Компания OpenAI в течение двух недель выкатит голосовой интерфейс для искусственного интеллекта ChatGPT, пишет Bloomberg.
На вербальные вопросы пользователя будут отвечать голосом пять искусственных персон. Их имена предельно нейтральны — Juniper, Breeze, Ember. В перспективе пользователь сможет создать и «личный» голос. Чатбот может, к примеру, прочитать сгенерированную сказку на ночь или описать решение математической задачи по ее фото.
Возможность голосового управления в ChatGPT уже есть, но вот отвечать человеку голосом бот до сих пор не мог. Новая опция прямо претендует на нишу голосового помощника типа Siri от Apple или Alexa от Amazon.
Первые отзывы о голосах ИИ на продвинутом движке Whisper положительные — они достаточно человекоподобны, хотя их стиль может показаться назойливым.
Опция не будет доступна бесплатным пользователям, а только подписчикам ChatGPT Plus за $20 в месяц. Компания уверена, что в целом избавилась от багов, а проблемы остались на идейном уровне. В частности, не исключено использование ботов для голосового мошенничества, дискриминация обладателей малораспространенных акцентов и приписывание пользователем голосу ИИ социального и политического багажа. Возможность деанонимизации человека по фото ChatGPT заблокирована, утверждает OpenAI.