Международная группа лингвистов опубликовала несколько вариантов текстов Нового Завета, который используют для обучения алгоритмов машинного перевода. Это в дальнейшем позволит сохранить ряд исчезающих языков.

Результаты исследования опубликовали на сайте Cornell University Library. По подсчетам ученых в мире существует почти семь тысяч языков. Но 95% населения планеты использует лишь 100 из них. Носителями примерно трети живых языков выступают менее одной тысячи человек. В ближайшее столетие некоторые диалекты полностью исчезнут.

Исследователи предположили, что их сохранить помогут алгоритмы машинного перевода. Но для освоения этой технологии системам потребуется большой объем текстов. Авторы исследования создали корпус из 1169 переводов Нового Завета, являющийся наиболее распространенным текстом в мире.

Каждый перевод даст возможность реализовать основные грамматические категории каждого языка. Обучение будет проводиться с помощью составления маркеров лингвистических функций. Карта языков позволит выяснить, какие из них используют схожую грамматику.

Популярные статьи сейчас
С ТЦК сразу на передовую: по каким критериям распределяют новобранцев С 1 января 2025 будут получать надбавку к пенсии: кому из стариков повезет Водительские удостоверения станут "временными" документами: автомобилистам готовят новые правила Кредитки становятся бесполезным пластиком: ПриватБанк лишает клиентов важной услуги
Показать еще

К недостаткам техники ученые отнесли низкую чувствительность: так, она не рассчитана на различение словоформ. Потенциально, помимо обучения автоматических переводчиков, она в то же время может использоваться для изучения эволюции языков.

Напомним, ранее портал "Знай.ua" сообщал, удивительная находка археологов заставит научный мир пересмотреть дату зарождения жизни на планете Земля.