Яндекс представил документальный фильм «Саха Тыла. Как научить машину понимать якутский». В основе проекта от команды продакшена Stereotactic — история Алексея Иванова, благодаря которому в «Переводчике» компании появился якутский язык.
Инициатор собрал основу для обучения нейросети и обратился к программистам «Яндекса» — вместе им удалось сделать доступным для многих пользователей малый язык. Для этого Алексей собрал корпус якутских текстов и подготовил более 100 тыс. строк на разные темы, чтобы обучить ИИ.
Однако данных всё же оказалось недостаточно, поэтому разработчики бренда придумали обучение нейросети на яыках, родственных якутскому. В фильме они рассказали об устройстве машинного перевода и объяснили, что нужно, чтобы нейросеть «выучила» новый язык с учётом всех его сложностей и особенностей.
Также в ролике показаны герои, которые занимаются сохранением родного якутского языка — учат его заново во взрослом возрасте, используют в работе, снимают фильмы и пишут музыку.
Проект был реализован в рамках выхода второго номера журнала «ТЕХНО», который посвящён технологиям машинного перевода. Также в номере, который Яндекс разработал при поддержке издания N + 1, можно найти подкаст с руководителем «Переводчика» Антоном Дворковичем и статьи про обучение сервиса эльфийскому языку.
Состав творческой группы:
Яндекс (клиент)
PR и дистрибуция: Елизавета Ивтушок, Александра Юданова, Алина Купцова
Продюсеры: Виктория Еке, Анна Косинская
Stereotactic (продакшн)
Режиссёр: Максим Томаш
Оператор: Лидия Никонова
Продюсер: Алексей Шевченко
Ассистент продюсера: Мария Черемушкина
Шеф-редактор: Ксения Мчедлидзе
Музыка: Павел Лерер
Герои проекта:
Андрей Наговицын — учитель английского языка и фотограф
Анатолий Чиряев — учитель, основатель лейбла «Юность Севера» и участник хардкор-группы Crispy Newspaper
Ian Hopeless — музыкант, рэпер
Дуня Захарова — художница
Алексей Васильев — фотограф
Люба Борисова — режиссер кинокомпании «Сахафильм»