Группа «Тинькофф» начинает продавать речевые технологии корпоративным клиентам. Tinkoff VoiceKit может использоваться, например, для создания голосового ассистента, роботов для автоматизации колл-центров, построения системы аналитики по транскрибированным текстам, а также создания аудиокниг, сообщили в пресс-службе группы.
Tinkoff VoiceKit — это глубокие нейросетевые модели для синтеза и распознавания речи, которые в течение последних лет разрабатывались в группе для создания голосового помощника «Олег». Технология позволяет преобразовывать голос в текст и синтезировать голос из текста. На данный момент она правильно определяет до 95% произнесенных слов и использует для обучения терабайты данных и десятки тысяч часов человеческой речи. Она одинаково хорошо справляется с шумной речью в телефонном канале, так и с чистой речью, полученной из качественных источников данных.
Образовательным учреждениям и студентам «Тинькофф» будет предоставлять технологию бесплатно — таким образом группа планирует сделать дополнительный вклад в российскую систему образования в рамках развития собственных образовательных проектов, поддержки всероссийских олимпиад и сотрудничества с ведущими российскими вузами и образовательными центрами. Кроме того, сейчас разрабатывается версия Tinkoff VoiceKit для физических лиц, которая будет доступна пользователям осенью.
Разработанные в Тинькофф нейросетевые архитектуры позволяет качеству синтезированного голоса вплотную приблизиться к человеческому. Однако технологии можно использовать не только в голосовом помощнике: они помогают автоматизировать процессы, связанные с обслуживанием, могут лечь в основу приложений для людей с ограниченными возможностями, а также помочь поисковой оптимизации.