Всё, что народ хочет сохранить в своей памяти, выражается и сохраняется языком. Язык — это то, что нас объединяет и связывает.
С ноября 2022 г. кафедру мордовских языков возглавляет кандидат филологических наук, доцент Мария Левина. В рамках программы «Приоритет 2030» (стратегический проект «Университет — центр социокультурного развития региона») кафедра трудится над созданием электронного научно-информационного образовательного ресурса «Национальный корпус мордовских языков». О том, что уже сделано в этом направлении и над чем предстоит работать, читайте далее.
В научной копилке Марии Левиной более 30 учебников, учебных пособий, монографий и словарей, свыше 100 статей в научных журналах
— Что уже сделано в отношении «Национального корпуса мордовских языков»?
- В настоящее время ведётся работа над морфологическим описанием мордовских языков и глоссированием текстов (оформлением текстов, предполагающим наличие кратких пояснений к ним), подготовкой языкового материала для аудиословарей. Доступны инструменты по созданию тренировочных тестируемых работ. Информационно-справочную систему «Национальный корпус мордовских языков» за 9 месяцев 2023 г. мы пополнили на 5 тысяч словоформ мокшанского и эрзянского языков. Сейчас их уже 15 000.
Глоссированные тексты — основа для разработки программы автоматического перевода, системы распознавания орфографии, аудиословарей, а также обучающих курсов по мордовским языкам на платформе Lingvodoc — виртуальной «научной лаборатории» для документации исчезающих языков.
— Какие исследования выполняются в рамках программы «Приоритет 2030» на филологическом факультете?
- Проводится работа по оцифровке и лингвистической разметке художественных произведений Кузьмы Абрамова, Ильи Девина, Григория Пинясова и др., написанных на мокшанском и эрзянском языках.
Подготовленные тексты, размещённые на цифровой платформе Lingvodoc, глоссируются и переводятся в структуру морфологического анализатора. Иными словами, для каждой словоформы с помощью специальных помет указаны грамматические характеристики (часть речи, число, падеж, время, лицо
— На что нацелены результаты?
- «Национальный корпус мордовских языков» даёт возможность размещать, обрабатывать и накапливать языковые данные, собранные учёными, а также с помощью специальных компьютерных программ с точки зрения особенностей лексикологии, фонетики, морфологии и истории мордовских языков проводить фундаментальные исследования.
Соглашение о консорциуме с Институтом системного программирования РАН им. В. П. Иванникова о совместной работе на платформе Lingvodoc позволяет объединять усилия учёных-лингвистов в сборе и оцифровке языкового материала мордовских языков, художественных текстов с сохранением всех прав создателей словарей и корпусов.
— Какие задачи самые основные?
- Перед кафедрой стоит задача создания системы машинного перевода на мокшанский и эрзянский языки. Для этого ведётся работа по созданию параллельных корпусов. Параллельные корпусы — это двуязычные корпусы текстов, имеющих перевод с одного языка на другой. Все тексты в корпусах должны быть выравнены: отдельные фрагменты оригинала должны совпадать с соответствующими фрагментами перевода. Но лучше всего, если в корпусе сделано выравнивание по предложениям. Только тогда это будет точный параллельный корпус. В общем, работа трудная и долгая.
Современные электронные ресурсы открывают широкие возможности для сравнительно-исторических, сопоставительных и типологических исследований по мордовским и другим финно-угорским языкам, так как современные информационные технологии упрощают и ускоряют процедуры лингвистической обработки больших текстовых материалов, способствуют сохранению языкового наследия мордовского народа.