Новости 02.07.2024

OpenAI задержала новый голосовой режим ChatGPT: у компании появились проблемы

В сообщении на официальном Discord-сервере OpenAI сообщила, что компания планировала начать альфа-версию расширенного голосового режима для небольшой группы пользователей ChatGPT Plus в конце июня, но затянувшиеся проблемы заставили ее отложить запуск до июля, поделились новостью TechCrunch.

В мае, когда OpenAI впервые продемонстрировала реалистичный голосовой режим для своей платформы чат-ботов ChatGPT, основанной на искусственном интеллекте, компания заявила, что функция будет доступна платным пользователям ChatGPT в течение нескольких недель. Спустя несколько месяцев OpenAI заявила, что ей нужно больше времени.

«Например, мы улучшаем способность модели обнаруживать и отклонять определенный контент, — пишет OpenAI. — Мы также работаем над улучшением пользовательского опыта и готовим нашу инфраструктуру к миллионному масштабированию при сохранении откликов в реальном времени. В рамках нашей стратегии итеративного развертывания мы начнем альфа-версию с небольшой группой пользователей, чтобы собрать отзывы и расширить ее на основе полученных данных».

По словам OpenAI, расширенный голосовой режим может быть запущен для всех пользователей ChatGPT Plus не раньше осени, в зависимости от того, пройдет ли он определенные внутренние проверки на безопасность и надежность. Однако эта задержка не повлияет на новые возможности видео и совместного использования экрана, которые были отдельно продемонстрированы на весеннем пресс-мероприятии OpenAI.

Эти возможности включают в себя решение математических задач по картинке и объяснение различных меню настроек устройства. Они предназначены для работы в ChatGPT как на смартфонах, так и в настольных компьютерах, например, в приложении для macOS, которое стало доступно всем пользователям ChatGPT.

«Усовершенствованный голосовой режим ChatGPT может понимать эмоции и невербальные сигналы и отвечать на них, приближая людей к естественным разговорам с ИИ в реальном времени, — пишет OpenAI. — Наша задача — вдумчиво донести до вас этот новый опыт».

На презентации сотрудники OpenAI продемонстрировали, как ChatGPT практически мгновенно реагирует на запросы, например решает математические задачи на листе бумаги, помещенном перед камерой смартфона исследователя.

Продвинутый голосовой режим OpenAI вызвал немало споров из-за схожести голоса Sky, используемого по умолчанию, с голосом актрисы Скарлетт Йоханссон. Позднее Йоханссон выступила с заявлением, что она наняла адвоката, чтобы узнать о голосе и получить точные сведения о том, как он был разработан, и что она отклонила неоднократные уговоры OpenAI лицензировать ее голос для ChatGPT.

Ранее сотрудники OpenAI опубликовали письмо, в котором выразили обеспокоенность быстрым развитием индустрии ИИ, несмотря на отсутствие надзора и защиты от разоблачителей, поделились новостью CNBC. «У компаний, занимающихся разработкой искусственного интеллекта, есть серьезные финансовые стимулы избегать эффективного надзора», — пишут сотрудники.

Темы

2024