Видеосервис Megogo запустит программу-робота, который будет распознавать нецензурные слова, а также сцены курения, употребления алкоголя, секс. Робот поможет компании в быстром распознавании запрещенного законом контента и таким образом убережёт от штрафов, пишут «Ведомости» со ссылкой на гендиректора видеосервиса Виктора Чеканова.
В основе робота — многозадачная нейронная сеть. Она будет анализировать библиотеку Megogo и выявлять контент с матом и указанными сценами, чтобы устранить возможные нарушения: запикать или проставить маркировку «18+».
Многозадачная нейронная сеть базируется на двух существующих решениях. Первое — Vosk, автономный инструмент для распознавания речи с открытым исходным кодом. Второе — система визуального распознавания на основе нейросети. С идентификацией мата у робота проблем возникнуть не должно, а вот обучить его распознавать сцены насилия — одна из самых сложных задач, отмечает гендиректор Megogo.
Через год робот сможет самостоятельно идентифицировать запрещенный к распространению контент, уверены в компании, но пока участие человека в процессе необходимо. Так, программа находит в аудиовизуальном контенте сцены, к примеру, с матом и проставляет таймкоды, а они проверяют, правильно ли идентифицированы слова, и, если это действительно мат, запикивают.
Напомним, в ноябре Роскомнадзор составил в отношении Megogo административный протокол за несвоевременное устранение нарушений — мат и секс в фильме «Никто не знает про секс», который имел на видеосервисе маркировку «16+» вместо «18+».