Украинские волонтеры выложили в открытый доступ первый результат своей полуторагодовой работы - открытый электронный грамматический словарь украинского языка.

"Это первый шаг для создания чат-ботов, вопросительно ответственных систем, систем проверки орфографии, грамматики и стиля, классификаторов текстов и т.п. И все это - на украинском языке!", - Рассказала Знай.ua одна из активных учаниц разработки бесплатного продукта, компьютерный лингвист Марьяна Романишин.

По ее словам, до этого не было доступных инструментов именно для украинского языка, которые помогали бы разрабатывать серьезный машинный перевод. Базовые блоки и взялись создать команда лингвистов и программист Андрей Рысин.

Читайте также: Завод Кировограда выпустит солнечные батареи

Пока же в словаре проставили часть речи, падеж, род и т. Его уже используют для проверки орфографии украинского языка в FireFox и LibreOffice, в лемматизатори для ElasticSearch, в проекте PyMorphy и в проекте LanguageTool.

Популярные статьи сейчас
Социальные выплаты будут назначаться по новым правилам: что изменится для украинцев с июля Уклонистов хотят достать в любой точке мира: ТЦК рассылают повестки за границей ТЦК отказываются снимать граждан с военного учета - что нужно сделать В Украине вырастут пенсии и зарплаты: когда и насколько
Показать еще

Сейчас проект словаря изложены на платформе GitHub.

Здесь собрали около ~ 197 тысяч слов, которые генерируют 3,4 миллиона словоформ, и это - только первый шаг. Далее, активисты планируют создать проанотований корпус украинского языка на миллион слов.

Справка: корпус в лингвистике - совокупность текстов, специально подобрали и обработали по определенным правилам, чтобы их можно было использовать в качестве базы для исследования языка.

Корпус украиснькои языка создавался один раз и является на данный момент закрытым для использования.