Mail.Ru Group запустила новый продукт в рамках платформы Mail Cloud Solutions — сервис аудиоаналитики Sounds, в основе которого лежат технологии машинного обучения, позволяет автоматизировать и упростить многие рядовые процессы.
Технология распознавания звуков может использоваться во множестве сценариев: распознавание отдельных звуков в аудиопотоке (крики, выстрелы, шаги, звуки разбитого стекла, плач), очистка аудиозаписей от шумов, идентификация людей по голосам, повышение чёткости голоса диктора, выявление неполадок в работе механизмов. Сервис аудиоаналитики Sounds, работающий на базе нейронных сетей, позволяет решать задачи в сферах безопасности, ритейла, медиа, телекоммуникаций и др.
С помощью аудиоаналитики можно обрабатывать как архивные файлы, так и онлайн-потоки. В ряде ситуаций технология применяется как альтернатива видеонаблюдению: технология распознает звуки в полной темноте, а микрофоны стоят значительно дешевле камер и не требуют специальных условий для размещения и обслуживания.
Нейронные сети «компьютерного слуха» обучены на собственных датасетах Mail.Ru Group и работают на серверных мощностях компании.
Егор Ганин, руководитель направления облачных и бизнес-сервисов Mail.Ru Group:
«Не так давно Mail.Ru Group вышла на рынок компьютерного зрения, запустив проект Vision. Мы убедились, что решение востребовано, поэтому пошли дальше и дополнили зрение слухом. Новая технология позволит развить эффективность «предложения» в целом. Например, нестандартный шум или шорох на наблюдаемом объекте должен вызывать подозрение, если речь идет об охранных функциях. Это перспективное направление, которое сейчас активно развивается. По прогнозам исследовательской компании Research and Markets, к 2023 году объем рынка аудиоаналитики составит 18 млрд долларов».