Искусственный интеллект Google AI Overviews выдает десятки миллионов ошибочных ответов каждый час. К такому выводу пришли аналитики стартапа Oumi, которые провели масштабное тестирование системы по заказу The New York Times. Хотя точность ответов достигает 91%, при огромном объеме в 5 трлн поисковых запросов в год это конвертируется в сотни тысяч неверных результатов ежеминутно.
Unsplash
Главной проблемой обновленной системы стала оторванность ответов от первоисточников. После перехода поисковика на более мощную модель Gemini 3 общая точность выросла с 85% до 91%, однако качество ссылок резко упало. Теперь в 56% правильных ответов алгоритм ссылается на сайты, которые не подтверждают предоставленную пользователю информацию в полном объеме. Осенью этот показатель составлял лишь 37%.
Анализ более 5 тыс. источников показал, что алгоритмы Google стали массово опираться на пользовательский контент. Социальная сеть Facebook и форум Reddit заняли второе и четвертое места в списке самых цитируемых ресурсов. При этом именно посты из социальных сетей часто становятся причиной фактических ошибок: например, нейросеть запуталась в датах открытия музея Боба Марли, взяв за основу личную публикацию его дочери. В других случаях ИИ путал реки на карте и выдавал неверные даты смерти известных людей.
Система также оказалась крайне уязвимой к манипуляциям со стороны пользователей. Журналист ради эксперимента опубликовал шуточный пост, назвав себя чемпионом по поеданию хот-догов, и уже на следующий день Google стал выдавать эту информацию за абсолютную истину.
Представители Google раскритиковали исследование Oumi, заявив, что оно содержит «серьезные пробелы» и не отражает реальное поведение пользователей. При этом внутренние тесты самой корпорации показывают, что базовая модель Gemini 3 ошибается в 28% случаев.
Подпишитесь на «Инк» в Telegram. Там мы пишем нескучным языком о самом важном для предпринимателей. Подписаться.