Международная группа лингвистов опубликовала несколько вариантов текстов Нового Завета, который используют для обучения алгоритмов машинного перевода. Это в дальнейшем позволит сохранить ряд исчезающих языков.

Результаты исследования опубликовали на сайте Cornell University Library. По подсчетам ученых в мире существует почти семь тысяч языков. Но 95% населения планеты использует лишь 100 из них. Носителями примерно трети живых языков выступают менее одной тысячи человек. В ближайшее столетие некоторые диалекты полностью исчезнут.

Исследователи предположили, что их сохранить помогут алгоритмы машинного перевода. Но для освоения этой технологии системам потребуется большой объем текстов. Авторы исследования создали корпус из 1169 переводов Нового Завета, являющийся наиболее распространенным текстом в мире.

Каждый перевод даст возможность реализовать основные грамматические категории каждого языка. Обучение будет проводиться с помощью составления маркеров лингвистических функций. Карта языков позволит выяснить, какие из них используют схожую грамматику.

Популярные статьи сейчас
За вашими счетчиками скоро придут: что нужно сделать, если незнакомцы уже на пороге Российские военные прямо во время эвакуации расстреливают мирных жителей в Волчанске Пенсионерам предоставляют еще один вид льгот: что нужно знать Получили зарплату, сделали заначку и остались без денег: украинцев предупредили о неприятностях дома
Показать еще

К недостаткам техники ученые отнесли низкую чувствительность: так, она не рассчитана на различение словоформ. Потенциально, помимо обучения автоматических переводчиков, она в то же время может использоваться для изучения эволюции языков.

Напомним, ранее портал "Знай.ua" сообщал, удивительная находка археологов заставит научный мир пересмотреть дату зарождения жизни на планете Земля.