Google представила новую технологию синхронного перевода устной речи — Translatotron. Особенность технологии, которая синхронно переводит предложения с одного языка на другой, заключается в том, что она работает исключительно со звуком, не используя при этом промежуточный текст, сообщается в официальном блоге компании.
Это первая в мире технология, способная синхронно переводить речь с одного языка на другой. Новый алгоритм принимает и анализирует голос ввода, составляя спектрограмму, которая затем используется для озвучивания перевода.
Translatotron умеет воспроизводить интонации и паузы в речи, а также голос говорящего при переводе. Поэтому перевод выходит не роботизированный, а с интонацией исходного произношения. Однако смысл перевода немного отличается от исходного, поскольку эта версия нейросети ещё недостаточно обучена.
По итогам проведённого тестирования специалисты признали, что Translatotron пока уступает каскадной модели. Однако в будущем, алгоритмы будут обучаться и совершенствоваться. Посмотреть примеры работы алгоритма можно в Google на Github.