Sostav.ru
Москва, ул. Полковая 3 стр.3, офис 120
© Sostav независимый проект брендингового агентства Depot
Использование опубликованных материалов доступно только при указании источника.

Дизайн сайта - Liqium

18+
21.02.2024 в 15:12

VK запретила роботу GPTBot собирать данные с «Дзена»

GPTBot был запущен компанией OpenAI в прошлом году для сканирования веб-ресурсов и сбора открытых данных

1

Контентная платформа «Дзен», которая принадлежит интернет-компании VK, запретила роботу GPTBot от OpenAI обходить страницы сайта dzen.ru для сбора информации. Такая директива содержится в файле robots.txt. Он предназначен для программ по автоматическому сбору данных с сайтов, пишет «Коммерсантъ».

В VK рассказали, что блокировка GPTBot нужна для снижения нагрузки на серверы «Дзена», которые обрабатывают больше 150 тыс. запросов в секунду.

Издание отмечает, что файл robots.txt носит рекомендательный характер. Технически ничто не мешает роботам игнорировать директивы, прописанные в нём.

OpenAI запустила GPTBot в августе прошлого года для сканирования веб-ресурсов и сбора открытых данных, которые затем можно будет использовать для улучшения нейросети ChatGPT. Однако продукт подвергся критике из-за несанкционированного сбора данных. OpenAI опубликовала инструкцию, как заблокировать доступ бота к сайту или предоставить ему данные лишь частично.

В середине февраля Роскомнадзор направил нескольким хостинг-провайдерам письмо о выявлении GPTBot. Ведомство порекомендовало заблокировать возможность бота просматривать и анализировать онлайн-страницы. Это позволит исключить сбор информации о критических уязвимостях ресурсов.

Обсудить с другими читателями:
Ваш браузер устарел
На сайте Sostav.ru используются технологии, которые не доступны в вашем браузере, в связи с чем страница может отображаться некорректно.
Чтобы страница отображалась корректно, обновите ваш браузер.