Нейросеть Gemini, над которой работает Google, будет в пять раз мощнее самой продвинутой ИИ-модели GPT-4 от OpenAI, сообщает Android Pro.
Модель будет мультимодальной, иметь доступ к обширным данным Google из различных сервисов, отмечает издание. К ним относятся, в частности, Google Search, YouTube, Google Books и Google Scholar.
Аналитики предполагают, что эти данные дадут заметные преимущества Gemini, поскольку модель сможет работать с более сложной информацией и делать более точные, глубокие прогнозы и выводы. Способ обучения нейросети будет иным, отмечают авторы статьи. Разработчики будут использовать обучение с подкреплением, а также так называемый метод древа решений, используемый в аналитике, что даст Google конкурентное преимущество.
Известно, что для обучения модели Gemini предоставлено в два раза больше лексем, чем GPT4. В других источниках говорится о пяти-двадцатикратном увеличении количества операций. Отмечается, что Google обладает достаточной вычислительной мощностью для выполнения этой работы.
Презентация Gemini назначена на осень текущего года. Нейросеть была создана с нуля, акцент сделан на высокоэффективной интеграции инструментов и API.
Gemini сможет генерировать тексты и изображения, будет обучаться на транскриптах видеороликов на YouTube.
Таким образом Google стремится оспорить доминирование ChatGPT на высококонкурентном рынке генеративного ИИ. По оценкам аналитиков, к 2032 году объём рынка генеративных нейросетей может составить $1,3 трлн.
Стало известно, что Google создал специальные водяные знаки для изображений, сгенерированных нейросетями. SynthID встраивает цифровой водяной знак непосредственно в пиксели изображения, делая его незаметным для человеческого глаза. При этом его можно обнаружить при идентификации, если просканировать изображение на наличие цифрового водяного знака при помощи специальной нейросети.