В каких языках не желают доброго утра и что такое ПРуД: конференция «Русская и зарубежная филология в диалоге культур» завершилась семинаром о возможностях лингвистических исследований в языке программирования R
Финальным мероприятием трехдневной конференции «Русская и зарубежная филология в диалоге культур», организованной Институтом филологии, журналистики и межкультурной коммуникации Южного федерального университета и Международной лабораторией языковой конвергенции Национального исследовательского университета «Высшая школа экономики», стал семинар «Возможности лингвистических исследований в языке программирования R».
Модерировал его Георгий Мороз, кандидат филологических наук, заведующий лабораторией, научный сотрудник Международной лаборатории языковой конвергенции НИУ ВШЭ.
Георгий Алексеевич начал с предыстории: когда Международная лаборатория языковой конвергенции только открывалась, многих исследователей там интересовало взаимодействие языков и то, какое влияние они оказывают на друг друга. В тот период они работали на Кавказе, изучали маленькие языки в Дагестане.
Другое направление работы лаборатории – устные корпусы, которые являются инструментом для диалектолога. Георгий Алексеевич рассказал об устройстве устных корпусов: здесь диалектная речь нормализуется и записывается на стандартном русском языке. Если будет идти стандартизация, можно провести исследование, которое будет распространяться на все диалектные корпусы. В итоге получится инструмент, который поможет вычленять контекст. После этого можно послушать контекст из разных корпусов, закончить исследование и построить статистику.
Другая часть проектов – словари. Чтобы корпус работал, нужно, говоря простыми словами, аудио, которое кто-то разместил и разделил на фрагменты. А чтобы корпус был на сайте, необходим сервер, на котором всё будет храниться и который будет обрабатывать пользовательские запросы. Тогда аудио хранится на сервере. Георгий Алексеевич рассказал, что есть данные исследований, для которых сервер не нужен, например для таблиц.
Также модератор семинара показал свою давнюю таблицу, которая состоит из 1664 строчек и предлагает разные звучания диалектов на родственных языках.
Георгий Мороз отметил, что ресурсы нужно разделять на типы – те, с которыми нет взаимодействия (пользователи просто читают текст), и те, в которых возможно взаимодействие с библиотекой, написанной на языке программирования Javascript. Для этого необходим сервер. Георгий Мороз сообщил, что в их лаборатории есть сервер – примерно такой, как стоит в углу аудитории 9 в корпусе ИФЖиМКК на Университетском, 93, где и проходил семинар. Модератор подчеркнул: «Если вы можете представлять миру результат работы, не используя сервер, это очень достойно».
Также Георгий Алексеевич подробно рассказал и о другом проекте: ПРуД – корпус просодии русских диалектов, созданный совместно с диалектологами С. В. Князевым и С. В. Дьяченко из Института русского языка РАН им. В. В. Виноградова. Главная идея проекта – посмотреть на просодии русских диалектов. На карте проекта выделены некоторые диалектные зоны. Каждая «точка» – населённый пункт. К каждому говору есть описание, это всё содержится на карте.
На семинаре студентам также рассказали о проекте «Типологический атлас языков Дагестана». Например, есть языки, в которых не желают доброго утра. Когда люди видятся, они как будто бы внезапно говорят: «Проснулся?» «Таковы языки Дагестана», – шутит Георгий Алексеевич. Статья в проекте – как раз про такие случаи.
Проект состоит из глав и карты. Здесь есть текст главы с глоссированным примером (это морфологическая категория слов, признаки слова).
На вопрос корреспондента медиацентра: «Как вы оцениваете уровень знаний о цифровой филологии у студентов?» – Георгий Алексеевич затруднился ответить, сказав, что за одну лекцию достаточно сложно это понять. А на вопрос, будут ли внедряться донские говоры в проект ПРуД, Георгий Мороз заметил, что он уже туда добавлен С. В. Князевым. К тому же сам он написал статью, в которой содержатся данные разных корпусов, в том числе и донского.
Текст и фото: Лия Сапронова