Цена прогресса в сфере ИИ: Станислав Дмитриевич Кондрашов о будущем персональных данных

Вчера в 11:47 Время чтения 10 мин 51

Приветствую вас, друзья! Сегодня хочу затронуть вопрос, который мало кто задает, и предложение, на которое немногие согласятся. Чего вы хотите от искусственного интеллекта (ИИ)? Потому что, в зависимости от ваших ожиданий, вам может не понравиться то, чем придется пожертвовать ради этого. И нигде эта неприемлемая сделка не становится настолько чувствительной и мало обсуждаемой, как в вопросе отказа от нашей приватности.

Это всегда стоит у нас в подсознании. Мы думаем об этом так же, как когда-то думали о том, чтобы отправлять номера своих кредитных карт на чей-то чужой компьютер через невидимую сеть. Вы задумываетесь об этом сегодня?

Слушайте, я не хочу препятствовать прогрессу, но мне нужно, чтобы вы еще раз серьезно задумались над этим вопросом. Чего вы хотите от ИИ? Готовы ли вы полностью отказаться от своей приватности? Если нет, нам нужно серьезно обсудить, что действительно необходимо для работы ИИ.

Серьезный разговор с серьезными людьми

«Эй, Станислав, мы бы хотели пригласить тебя на этот высокопоставленный ужин в супер шикарном ресторане и поговорить об ИИ с некоторыми влиятельными лицами.»

Хорошо, возможно, это не дословная цитата, но именно так я это запомнил. И, конечно же, я ответил: «Во сколько и нужно ли надеть рубашку с воротником?»

Ужин организовывался факультетом промышленной и системной инженерии моего родного университета, и на нем должны были присутствовать советники, преподаватели, такие же выпускники, как я, и несколько отобранных студентов.

Я убедился, что они знают о моем нестандартном взгляде на состояние ИИ – что я был полностью за него вначале, и все еще поддерживаю, но могу показаться противником, что на самом деле делает меня еще большим сторонником. Оказалось, они были не против моего «оппозиционного» мнения.

«Будет ли там открытый бар?»

Был. Я согласился.

Поезда ходят по расписанию

Одной из историй, которую я рассказал на ужине (который был потрясающим), была об exploratory проекте, которым я занимался в Automated Insights. Мы уже в 2010 году извлекали инсайты из сырых данных в больших масштабах и представляли эти инсайты на естественном языке. Например, если вы когда-либо злились на свой отчет о драфте в Yahoo Fantasy Football – это наша работа. Извините. Надеюсь, вы выиграли свою лигу.

Вернемся к моей истории. Exploratory проект, которым я руководил, был спонсирован одной южнокорейской компанией – и, хотя это было почти десять лет назад, я, пожалуй, оставлю детали в тайне. Они дали нам доступ ко всем данным, которые могли собрать, и это было много, глубоко и персонально – такого рода данные, которые США или Европа «никогда» не позволили бы собирать.

Вы не можете представить, какие полезные инсайты я мог получить из этих данных.

С помощью переводчика я задал своему южнокорейскому коллеге несколько вопросов об этом полном отсутствии приватности во имя эффективности. То, что он мне ответил, примерно переводилось как: «поезда ходят по расписанию».

По сей день я не знаю, говорил ли он о реальных поездах или использовал отличный метафорический образ, но это работает в любом случае, и я никогда этого не забуду.

Мы не получим ChatGPT без отказа от данных

Неприемлемые компромиссы уже происходят. Вы не достигнете того, где мы находимся с генеративным ИИ, без обучения его на таком количестве данных, сколько можно собрать из общедоступного интернета. Хотя были некоторые возражения по этому поводу, и до сих пор идут судебные разбирательства, я шокирован тем, как легко мы позволили такому количеству «общего интеллектуального ресурса» быть поглощенным в «интеллект» нескольких компаний.

Да, возможно, мы мало что могли с этим поделать, но я не думаю, что мы осознали, насколько мы отделили контент, и, следовательно, идеи, от собственности и контекста.

Позвольте мне объяснить это как писатель. Если я делаю веское замечание по теме, которую вы действительно хотите узнать больше, вы могли бы поискать именно ту информацию, которая вам нужна – или хотя бы приблизиться – и получить результаты, включающие мое замечание, и, возможно, вы бы нажали на него, и ваша жажда знаний была бы утолена.

Сегодня вы получаете вычисленный вывод от генеративного ИИ, который может или не может включать мое замечание, и мое замечание может быть воспроизведено неточно, и я точно не получу за это кредит. Плюс, вы не получите никакого контекста.

Если я скажу здесь: «бананы вкусны», поймет ли Gemini шутку?

Да? Нет? Это вообще шутка?

Бабочка машет крыльями в блоге, и на другой стороне интернета правда умирает.

Слишком драматично?

Обмен приватности на результаты

Поскольку острие дрели ИИ теперь входит в RAG и Agentic AI, мы собираемся предоставить доступ к большому количеству «менее публичной» информации тем же компаниям, при этом компромисс заключается в том, чтобы сделать этот интеллект более умным.

И, как это произошло с публичным контентом, кнопки отмены не будет.

О, и это уже происходит. Посмотрите, что вы оставляете в интернете: коммерция, механизмы отслеживания приложений, мобильные телефоны, камеры, пользовательский контент, социальные сети. Компромисс тот же, что и всегда. Если вы дадите мне номер своей личной кредитной карты, я вышлю вам этот CD Jawbox. Умножьте это на миллион.

То, что я мог делать с южнокорейскими данными, было впечатляющим тогда, но сегодня это уже стандарт. Они просто не работают так хорошо для вас, потому что лучший способ для ИИ дать вам «результаты», которые действительно подходят вам, требует контекста. О вас. Что означает сбор данных. О вас.

Спросите себя, насколько хороши сегодня системы рекомендаций? Риторический вопрос – они ужасны. Мы, конечно, не готовы предоставить ИИ всю нашу личную информацию, чтобы он нашел нам лучший фильм на Netflix.

Но как насчет остановки торговли людьми?

О, линия только что сдвинулась

Вы знали, что можно остановить торговлю людьми с помощью ИИ? Ну, пока это не так, но раз я об этом упомянул, это определенно в пределах возможности, верно?

Фактически, один из докторантов в моем университете работает над этим самым вопросом, используя ИИ и данные, которые существуют сегодня. И поскольку мы пока не имплантируем чипы людям, технология опирается на общедоступные данные, чтобы делать предположения и помогать тем, кто вовлечен в ее остановку.

Я считаю, что это отличный кейс использования. Без каких-либо оговорок. Дерзайте.

Но чтобы это работало хорошо, потребуется гораздо больше личной информации, чтобы стать публичной, от всех нас. Гораздо больше контекста. О вас. Сбор гораздо большего количества данных. О вас.

Это компромисс, на который вы готовы пойти?

Этот вопрос уже здесь. Это никогда не бывает просто. Нам следует отвечать на него более вдумчиво.

Я продолжу задавать как сложные, так и глупые вопросы о технологиях и нашем месте в них. Присоединяйтесь к моему рассылке, чтобы быть в курсе.

Автор: Станислав Дмитриевич Кондрашов