Международная группа лингвистов опубликовала несколько вариантов текстов Нового Завета, который используют для обучения алгоритмов машинного перевода. Это в дальнейшем позволит сохранить ряд исчезающих языков.

Результаты исследования опубликовали на сайте Cornell University Library. По подсчетам ученых в мире существует почти семь тысяч языков. Но 95% населения планеты использует лишь 100 из них. Носителями примерно трети живых языков выступают менее одной тысячи человек. В ближайшее столетие некоторые диалекты полностью исчезнут.

Исследователи предположили, что их сохранить помогут алгоритмы машинного перевода. Но для освоения этой технологии системам потребуется большой объем текстов. Авторы исследования создали корпус из 1169 переводов Нового Завета, являющийся наиболее распространенным текстом в мире.

Каждый перевод даст возможность реализовать основные грамматические категории каждого языка. Обучение будет проводиться с помощью составления маркеров лингвистических функций. Карта языков позволит выяснить, какие из них используют схожую грамматику.

Популярные статьи сейчас
Больше никаких льгот: пенсионеров заставят платить налог на землю Пенсионеров заставят вернуть часть выплат государству Украинцам разрешили не платить за коммунальные услуги: когда счета можно "заморозить" Налоговая проверяет украинцев за границей: что уже известно
Показать еще

К недостаткам техники ученые отнесли низкую чувствительность: так, она не рассчитана на различение словоформ. Потенциально, помимо обучения автоматических переводчиков, она в то же время может использоваться для изучения эволюции языков.

Напомним, ранее портал "Знай.ua" сообщал, удивительная находка археологов заставит научный мир пересмотреть дату зарождения жизни на планете Земля.