OpenNMT — Open Source-система нейронного машинного перевода на базе Torch

Исследователи из Гарварда представили интересный Open Source-релиз — систему нейронного машинного перевода (neural machine translation) под названием OpenNMT.

Система OpenNMT использует свободную библиотеку Torch (через язык Lua), похожую на MATLAB и предоставляющую различные алгоритмы для глубинного обучения и научных расчётов. В разработке проекта активное участие принимала французская компания Systran, которая в прошлом месяце начала публичное тестирование своего сервиса нейронного машинного перевода, работающего с 30 языками, — Pure Neutral Machine Translation. Новый Open Source-проект мог бы стать конкурентом онлайн-сервисов перевода вроде Google Translate, однако для этого ему требуются не только соответствующие алгоритмы, но и источники большого количества данных для обучения.

Исходный код OpenNMT опубликован на GitHub на условиях свободной лицензии MIT. Сайт проекта — opennmt.net. Посмотреть на возможности машинного перевода в действии можно в онлайн-демо Systran Pure Neural, где заявлено использование OpenNMT вместе с собственными наработками компании.