OpenAI выпустила альфа-версию продвинутого голосового помощника
CryptoWatcher
OpenAI представила альфа-версию продвинутого голосового режима GPT-4o для небольшой группы пользователей ChatGPT Plus. Для всех владельцев подписки он станет доступен осенью.
Некоторые продемонстрированные в мае возможности ИИ не вошли в запущенную альфа-версию, включая совместное использование экрана и поддержку видео. Они будут представлены позже.
Расширенный голосовой режимСтандартный голосовой режим ChatGPT использует три отдельные модели:
- одну для преобразования голоса в текст;
- другую для обработки запроса;
- третью для конвертации текста в голос.
ChatGPT может общаться на четырех голосах, записанных в сотрудничестве с актерами озвучивания. Он не будет имитировать речь других людей. Дополнительно добавлены фильтры для отклонения некоторых запросов на создание музыки или других форм защищенного авторским правом контента.
Напомним, в июле OpenAI сообщила о тестировании новых функций поиска на базе ИИ — SearchGPT.
В том же месяце СМИ узнали о работе компании Сэма Альтмана над новой технологией Strawberry, которая «значительно улучшит процесс рассуждения ИИ-моделей и даст им возможность планировать действия наперед».