Фото: depositphotos.com
В видеохостинге YouTube появилась новая опция, ориентированная на людей с нарушением слуха. Ресурс научился распознавать окружающие звуки в видео и в автоматическом режиме начал подписывать их в роликах, пока речь идет только о трех звуковых эффектах - смех, аплодисменты и музыка, пишет The Verge.
Это небольшое, но значительное дополнение к функции автосубтитров для речи, запущенной YouTube еще в 2009 году. Разработчики признаются, что новая функция стала реальной благодаря машинному обучению. У YouTube появился алгоритм искусственного интеллекта для звуковых эффектов лишь после обработки тысяч часов видео. При этом наиболее сложной задачей было «научить» видеохостинг различать те элементы, которые звучат синхронно, например, в случае, когда в унисон раздаются смех и рукоплескание.
В будущем компания хочет добавить поддержку и других звуков, например, видеохостинг сможет распознавать стук, звон и т.д. Но для этого искусственному интеллекту придётся научиться различать источники этих звуков.
Субтитры к видео появились на YouTube в сентябре 2006 года, а автоматически создаваемые субтитры — в ноябре 2009 года. Однако функция пока ещё далека от идеала — из-за таких нюансов как неправильное произношение, акценты, диалекты и фоновые шумы её приходится постоянно дорабатывать. В начале текущего года компания Google объявила о том, что количество видеороликов с автоматическими субтитрами уже превысило 1 миллиард.