Новости

OpenAI представила расширенный голосовой режим с большим количеством голосов и новым внешним видом

OpenAI объявила о о начале внедрения расширенного голосового режима (AVM) для более широкого круга платных клиентов ChatGPT. Аудиофункция, которая делает общение с ChatGPT более естественным, первоначально будет доступна пользователям уровней Plus и Teams. Клиенты Enterprise и Edu получат доступ на следующей неделе, сообщает TechCrunch.

В рамках расширения AVM получает обновленный дизайн. Теперь данная функция представлена ​​синей анимированной сферой вместо анимированных черных точек, которые OpenAI представила во время своей презентации технологии в мае.

Когда AVM станет для пользователей доступным, в приложении ChatGPT рядом со значком голосовой связи появится всплывающее окно. Расширенная голосовая связь станет доступна всем пользователям Plus и Team в приложении ChatGPT.

ChatGPT также получает 5 новых голосов, которые пользователи могут попробовать: Arbor, Maple, Sol, Spruce и Vale. Это доводит общее количество голосов ChatGPT до девяти (почти столько же, сколько у Gemini Live от Google ), наряду с Breeze, Juniper, Cove и Ember.

Один голос, отсутствующий в этом составе, — это Sky, голос OpenAI, продемонстрированный во время весеннего обновления, что привело к юридической угрозе со стороны Скарлетт Йоханссон.

Актриса, сыгравшая систему ИИ в художественном фильме «Она», заявила, что голос Sky звучит слишком похоже на ее собственный. OpenAI удалила голос Sky, заявив, что он никогда не намеревался напоминать голос Йоханссон, несмотря на то, что несколько сотрудников в то время ссылались на фильм в твитах.

Еще одна функция, отсутствующая в этом обновлении, — совместное использование видео и экрана ChatGPT, которое OpenAI показало во время своего весеннего обновления четыре месяца назад. Предполагается, что эта функция позволит GPT-4o одновременно обрабатывать визуальную и звуковую информацию.

Во время демонстрации сотрудник OpenAI показал, как можно задавать вопросы ChatGPT в реальном времени по математике на листе бумаги перед человеком или по коду на экране компьютера. В настоящее время OpenAI не сообщает, когда он запустит эти мультимодальные возможности.

Тем не менее OpenAI заявляет, что с момента выпуска своего ограниченного альфа-теста AVM она внесла некоторые улучшения. Голосовая функция ChatGPT, как утверждается, теперь лучше понимает акценты и ее разговоры стали более плавными и быстрыми.

OpenAI также расширяет некоторые функции настройки ChatGPT до AVM: пользовательские инструкции, которые позволяют персонализировать то, как ChatGPT реагирует на них, и память, которая позволяет ChatGPT запоминать разговоры для дальнейшего использования. Представитель OpenAI также сообщил, что AVM пока недоступен в ряде регионов, включая ЕС, Великобританию, Швейцарию, Исландию, Норвегию и Лихтенштейн.

Ранее компания OpenAI заявила, что ее Комитет по безопасности, созданный в мае для решения споров по поводу процессов безопасности, станет независимым надзорным комитетом совета директоров. Председателем назначен Зико Колтер, профессор и директор департамента машинного обучения Университета Карнеги-Меллона.