06.03.2001
В распоряжение ЦРУ поступил новый софт для расшифровки речевых записей, а также многоязыкового контекстного поиска по тексту.
Как известно, на белом свете есть немало желающих поквитаться с самой могущественной мировой державой, используя для этого любые средства, вплоть до самых современных. Впрочем, ЦРУ не дремлет и, в свою очередь, противопоставляет взрыву терроризма свои "взрывные технологии" в сфере обработки данных (data mining).
Очередной прорыв достигнут в сфере обработки мультимедиа-, в частности, звуковой информации. Существенная часть поступает в анналы ЦРУ как записи различных разговоров, подслушанных как при прослушивании телефонных переговоров, так и при внедрения в стан противника разнообразных "жучков". До сих пор рутинная задача по расшифровке подобного материала лежала на плечах специалистов. Ныне на смену им готова прийти новая программа под кодовым названием Oasis, задачей которого является перевод в текстовый формат любых аудиосигналов, содержащих человеческую речь. При этом, "вслушиваясь" в поток речи, программа, основываясь на индивидуальных особеностях тембра, "распознает" различных собеседников и выводит, таким образом, в файл некоторое подобие пьесы, где против кодового имени "персонажа" стоит текст его "роли". В том случае, если обладатель подобного голоса уже был идентифицирован ранее ЦРУ, программа "на свой страх и риск" подставляет его имя в качестве предполагаемого "оратора". С получасовой звукозаписью, расшифровка которой отнимает у "спецов" полтора часа, "Оазис" способен справиться минут за 10. Непонятные слова из других языков при соответствующих настройках программа способна перевести на английский, делая, таким образом, экспертов полиглотами. Немудрено, что в список языков, "плаг-ины" для которых рекомендуется изготовить в первую очередь, угодили арабский и китайский.
Другое программное нововведение в сфере американской разведки носит название FLUENT и предназначено для контекстного штудирования информационных анналов на языках, неизвестных пользователю. [Судя по всему, это сокращение, впрочем, несущее и смысловую нагрузку: в переводе на русский - "текучий" и "беглый", как характеристика речи.] Система настраивается на конкретный язык, затем в строке поиска вводятся английские слова и осуществляется поиск по выбранным документам. Наиболее полезные с точки зрения заданного контекста документы, отобранные программой, затем могут быть переданы специалисту для более серьезного анализа. "Полиглотский список" FLUENT гораздо шире, чем у его "коллеги" и уже, помимо английского, насчитывает китайский, корейский, протугальский, русский, сербско-хорватский и украинский языки.
Основной причиной создания подобного софта стала необходимость контекстного сканирования более чем 1,2 миллионов документов, посвященных военным действиям Ирака в 1979 году. Успехи данной операции побудили специалистов приступить к модернизации своего детища для более широкого применения. Высокие чины в ЦРУ, занятые вопросами "глубокого бурения", оптимистично смотрят на перспективы дальнейшего внедрения новых программ и считают, что благодаря им на самом деле можно ловить шпионов. В то же время один из сотрудников, пожелавший остаться неизвестным, выдал по этому поводу каламбур: "вы можете представить, какие технологии у них есть для разоблачения шпионов, если у них уже есть технологии, позволяющие проникать в open source". Как известно, последнее подразумевает как доступные к использованию документы, так и открытые "исходники" программ.

Источник: Журнал "Компьютерра"