Южный федеральный университет
Южный федеральный университет

Центр цифровых гуманитарных исследований

Центр цифровых гуманитарных исследований занимается:

– реализацией научно-исследовательской деятельности в сфере цифровых гуманитарных наук и образования;

– разработкой цифровых гуманитарных ресурсов в ходе реализации научных исследований;

– трансфером результатов исследований в образовательные программы всех уровней.

Задачи Центра:

– организация и проведение научно-исследовательских междисциплинарных гуманитарных проектов, в том числе в сотрудничестве с другими подразделениями Университета и внешними партнерами;

– проведение научно-исследовательских и образовательных мероприятий по темам проектов;

– включение цифровых гуманитарных технологий и результатов исследований в образовательные программы всех уровней;

– повышение квалификации преподавателей, исследователей в области цифровых гуманитарных подходов;

– повышение публикационной активности сотрудников и обучающихся Института;

– развитие сотрудничества с научно-исследовательскими учреждениями и вузами.

Центр занимается организацией и проведением научных исследований по проекту "Зеркальные лаборатории" НИУ ВШЭ, тема «Конвергенция языковых пластов русского языка в зеркале цифровых отношений» совместно с Международной лабораторией языковой конвергенции НИУ ВШЭ.

Цель проекта создание новых лингвистических и филологических цифровых ресурсов, расширяющих стандартные типы языковых данных и дополненных наукоемкой экспертной разметкой. Научно-исследовательская работа реализуется в трех научных направлениях цифровая диалектология, цифровой инструментарий преподавания русского как иностранного, семантическая разметка русской классической литературы. Проект обеспечивает контаминацию подходов и имеющихся наработок в ЮФУ и в НИУ ВШЭ, выработку единых стандартов и форматов представления данных, совместимость разных цифровых решений.

В задачи проекта входит создание трех языковых ресурсов.

1) Корпус донских говоров: в формате устного корпуса доступно для работы 9,5 часов. Выполнена расшифровка и диалектная (упрощенная) транскрипция (17 часов 40 минут аудиозаписей).

2) Русский учебный корпус “Восток” (RLC): цифровая коллекция составляет 457 текстов. Собран корпус письменных монологических высказываний изучающих русский язык как иностранный для письменного корпуса; разработана концепция аудиокорпуса, собраны и размечены материалы для корпуса.

3) Проект Chekhov Digital: разработана многоуровневая (семантическая) разметка текстов Полного собрания сочинений и писем А. П. Чехова (1974–1983) с опорой на стандарты цифровой публикации Text Encoding Initiative (TEI), проведена разметка в TEI-формате с учетом структурно-семантических особенностей текстов, реализована версия сайта с семантическим поиском (1-17 тт. ПСС, 1-12 тт. ПС писем), в том числе по именованным сущностям (https://chekhov-digital.sfedu.ru/search).

Корпус донских диалектных текстов и Русский учебный корпус “Восток” включают в себя абсолютно новый языковой материал, не представленный ранее в корпусах. Языковые данные и глубокая экспертная разметка востребована для научных квантитативных исследований, технологий машинного обучения и разработки образовательных продуктов.

Цифровое издание текстов А. П. Чехова является основой для исследования текстов А. П. Чехова методами Digital Humanities. Такое издание представляет интерес для исследователей, преподавателей, студентов, заинтересованных читателей.

Северина Елена Михайловна
Северина Елена Михайловнаруководитель