Компания OpenAI представила новую модель искусственного интеллекта GPT-4o.
Об этом сообщает CNN.
Буква "o" в названии - это сокращение от "omni", то есть "всесторонний". Новая модель быстрее старой и обладает более широким набором функций.
GPT-4 Turbo - предыдущая ведущая модель OpenAI, улучшенная версия GPT-4 - обучалась комбинации изображений и текста и могла анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений или даже описание содержания этих изображений. Но GPT-4o добавляет к этому еще и речь.
"GPT-4o может работать с голосом, текстом и зрением. И это невероятно важно, потому что мы смотрим на будущее взаимодействия между нами и машинами", - сказала технический директор OpenAI Мира Мурати во время презентации в офисе OpenAI в Сан-Франциско 13 мая.
Например, GPT-4o по фотографии ресторанного меню на иностранном языке сможет перевести названия блюд, привести их историю и значение, а также дать рекомендации.
GPT давно предлагает голосовой режим, но GPT-4o значительно улучшает эту функцию, позволяя пользователям взаимодействовать с ChatGPT как с помощником. Модель реагирует на голос пользователя в режиме реального времени, может улавливать нюансы в голосе, генерируя ответ в "различных эмоциональных стилях", включая пение.
Данная модель поддерживается более чем на 50 языках, в том числе на русском.
Напомним, на днях искусственный интеллект от OpenAI создал свой первый музыкальный клип.
Ранее мы писали, что компания OpenAI создала собственной поисковую систему, которую уже окрестили "убийцей Google".