Новости

Оказывается, люди принимают счастливые голоса за настоящие, а нейтральные — за голоса, созданные ИИ

Новое исследование показало, что люди с трудом различают человеческие голоса и голоса, сгенерированные ИИ, но их реакция мозга существенно отличается. Это позволяет предположить уникальную реакцию на каждый тип голоса, что имеет значительные последствия для технологий и этики.

«Мы уже знаем, что голоса, генерируемые ИИ, стали настолько совершенными, что практически неотличимы от настоящих человеческих голосов. Теперь можно клонировать голос человека всего за несколько секунд записи и мошенники используют эту технологию, чтобы имитировать близкого человека, попавшего в беду, и обманом заставить жертву перевести деньги», — говорит докторант Кристина Скьегстад.

В то время как специалисты по машинному обучению разрабатывают технологические решения для обнаружения голосов ИИ, о реакции человеческого мозга на эти голоса известно гораздо меньше.

В исследовании приняли участие 43 человека, которых попросили прослушать человеческие и сгенерированные ИИ голоса, выражающие пять различных эмоций:

  • нейтральные,
  • гнев,
  • страх,
  • радость,
  • удовольствие. 

Участников попросили определить, являются ли голоса искусственными или естественными, а их мозг исследовали с помощью функциональной магнитно-резонансной томографии (фМРТ). ФМРТ используется для определения изменений кровотока в мозге, указывающих на то, какие участки мозга активны. Участников также попросили оценить характеристики голосов, которые они слышали, с точки зрения естественности, достоверности и подлинности.

Участники правильно идентифицировали человеческие голоса только в 56% случаев, а голоса ИИ — в 50,5% случаев, то есть они одинаково плохо идентифицировали оба типа голосов. Люди с большей вероятностью правильно идентифицировали «нейтральный» голос ИИ как ИИ (75% по сравнению с 23%, которые правильно идентифицировали нейтральный человеческий голос как человеческий).

Это говорит о том, что люди считают нейтральные голоса более похожими на ИИ. Женские нейтральные голоса ИИ правильно идентифицировались чаще, чем мужские нейтральные голоса ИИ. Для счастливых человеческих голосов процент правильной идентификации составил 78%, в то время как для счастливых голосов ИИ — всего 32%, что говорит о том, что люди считают счастливые голоса более похожими на человеческие. Нейтральные голоса ИИ и человека воспринимались как наименее естественные, достоверные и аутентичные, в отличие от счастливых.

Однако, изучив снимки мозга, исследователи обнаружили, что человеческие голоса вызывают более сильную реакцию в областях мозга, связанных с памятью и эмпатией . Голоса ИИ вызывали более сильные реакции в областях, связанных с распознаванием ошибок и регулированием внимания.

«Мое исследование показывает, что мы не очень точно определяем, является ли голос человеческим или сгенерированным ИИ», — сказала Скьегстад. Участники также часто говорили о том, что им трудно отличить один голос от другого. Это говорит о том, что современные голосовые технологии ИИ могут имитировать человеческие голоса до такой степени, что людям трудно их различать.

Результаты также указывают на смещение восприятия, когда нейтральные голоса с большей вероятностью были идентифицированы как созданные ИИ, а счастливые голоса — как человеческие, независимо от того, были ли они таковыми на самом деле, особенно нейтральные женские голоса ИИ.  Это может быть связано с тем, что люди знакомы с женскими голосовыми помощниками, такими как Siri и Alexa».

Хотя люди не очень хорошо умеют отличать человеческие голоса от голосов искусственного интеллекта, похоже, что реакция мозга все же отличается. Голоса ИИ могут вызывать повышенную бдительность, в то время как человеческие голоса вызывают чувство родства.

Теперь исследователи планируют изучить, делают ли черты личности, например экстраверсия или эмпатия, людей более или менее чувствительными к различиям между человеческими голосами и голосами ИИ.

Профессор Ричард Рош, председатель коммуникационного комитета Форума FENS и заместитель заведующего кафедрой психологии Университета Мейноут, сказал, что изучение реакции мозга на голоса ИИ крайне важно, поскольку эта технология продолжает развиваться. Это исследование поможет понять потенциальные когнитивные и социальные последствия голосовых технологий ИИ, что может поддержать политику и этические принципы.

«Риски использования этой технологии для мошенничества и обмана людей очевидны. Однако есть и потенциальная польза, например замена голоса для людей, потерявших естественный голос. Голоса ИИ также могут быть использованы в терапии некоторых психических заболеваний», — добавил он.

Ранее ИИ смог расшифровать собачий лай. Теперь чат-боты понимают, что говорит собака. Такую возможность предоставило недавнее исследование ученых из Мичиганского университета в сотрудничестве с Национальным институтом астрофизики, оптики и электроники в Пуэбле, Мексика. Его результаты были представлены на Объединенной международной конференции по вычислительной лингвистике, языковым ресурсам и оценке.