Яндекс запустил сервис Яндекс.Перевод, основанный на собственной системе машинного перевода. Теперь на сайте translate.yandex.ru все желающие смогут быстро перевести любой текст или веб-страницу с английского или украинского языка на русский или наоборот.
Система машинного перевода Яндекса основана на статистике. Она анализирует миллионы текстов — переводов друг друга на разные языки — и создаёт специальные словари. При переводе система выбирает из словарей наиболее вероятные варианты, учитывая контекст. Машинный перевод Яндекса — статистический. Такой перевод основывается не на правилах языка (системе эти правила даже не известны), а на статистике. Чтобы выучить язык, система сравнивает сотни тысяч параллельных текстов — содержащих одну и ту же информацию, но на разных языках. Это могут быть, например, большие тексты с разноязычных версий сайтов организаций. Изначально система находит параллельные тексты по адресам документов — чаще всего такие адреса различается только пометками, например, «en» или «us» для английской версии и «ru» для русской.
Для каждого изученного текста система строит список уникальных признаков. Это могут быть редко используемые слова, числа, специальные знаки, находящиеся в тексте в определённой последовательности. Когда система набирает достаточное количество текстов с признаками, она начинает искать параллельные тексты ещё и с их помощью — сравнивая признаки новых текстов и уже изученных.
Подробнее об устройстве системы машинного перевода Яндекса можно почитать здесь.
«Статистический машинный перевод, конечно, нельзя сравнивать с литературным, сделанным профессиональным переводчиком, — говорит Алексей Байтин, руководитель сервиса Яндекс.Перевод. — Но часто бывает, что пользователю нужно просто понять основной смысл текста — например, он хочет почитать отзывы о зарубежных отелях или новости в иностранных СМИ. Онлайн-переводчик легко поможет это сделать. К тому же на перевод он потратит всего несколько секунд».
Сервис Яндекс.Перевод пока находится в режиме бета-тестирования. Яндекс будет повышать качество и скорость перевода, а также добавлять другие языковые пары.