Российские ученые создали помощника для работы с узбекским языком

512
1 минута
Российские ученые создали помощника для работы с узбекским языком

Нижегородские лингвисты разработали программу для работы с узбекским языком.

Как сообщает пресс-служба Нижегородского государственного лингвистического университета (НГЛУ), узбекский язык стал вторым тюркским языком после турецкого, с которым успешно работает программа «Фразеоэкстрактор».

Программа была создана учёными из Научно-образовательного центра НГЛУ и лицея «Центр одарённых детей» в 2022 году. Она предназначена для составления словарей из словосочетаний на различных языках, таких как русский, английский, немецкий, французский, испанский, китайский, корейский, турецкий и узбекский.

На данный момент пользовательский интерфейс программы находится в стадии разработки. Тем не менее, студенты Иняза, обучающиеся в ЦОДе, и все заинтересованные лица могут получить программные коды от НГЛУ и использовать их в онлайн-редакторе, что позволит им освоить базовые навыки программирования.

Разработка «Фразеоэкстрактора» проходила в несколько этапов, как уточнили в университете. Сначала был оптимизирован процесс извлечения фраз и созданы отдельные модели для обработки английского языка. Затем были разработаны два метода извлечения: грамматико-семантический и частеречный. Эти методы в настоящее время тестируются на нескольких европейских и восточных языках. Модель обработки узбекского языка была создана с нуля, и для её корректной работы требуется собрать значительный объём данных. Первоначально планируется собрать пять тысяч слов, а затем десятки тысяч и более.

По словам исполняющего обязанности ректора НГЛУ Никиты Авралева, в будущем планируется создать пользовательскую версию программы и продолжить внедрять новые языки в зависимости от потребностей современного общества.

Николай Ильясов

Читайте также