В ChatGPT случилось обновление, отразившееся на текстах
Компания OpenAI выпустила ChatGPT Images 2.0 — новую версию генератора изображений, встроенного в чат-бот. Теперь нейросеть способна генерировать до восьми изображений одновременно с сохранением единой стилистики.
Кроме того, она значительно лучше справляется с работой с текстами на языках, отличных от английского.
ChatGPT Images 2.0 представляет собой масштабное обновление визуального инструментария OpenAI. Ключевой особенностью версии стала функция «Рассуждение» (Thinking), которая доступна подписчикам тарифов Plus, Pro и Business.

При активации этого режима модель не просто выполняет текстовый запрос, а предварительно анализирует задачу, может обращаться к поиску в интернете для уточнения деталей и проверять собственный результат на соответствие инструкциям перед финальной выдачей.
Такой подход позволяет создавать серии до восьми изображений за один сеанс, поддерживая визуальную целостность персонажей и объектов в разных сценах. По заявлению представителей компании, это должно упростить создание комиксов, контента для социальных сетей или дизайн-проектов интерьеров.
Отдельный акцент разработчики сделали на улучшении работы с текстовой информацией. Если предыдущие версии генераторов на базе диффузионных моделей часто выдавали нечитаемые символы вместо слов, то ChatGPT Images 2.0 демонстрирует значительный прогресс в отрисовке надписей на японском, корейском, китайском, хинди и бенгальском языках.
В пресс-релизе OpenAI подчеркивается, что модель обеспечивает «беспрецедентный уровень детализации» при работе с мелкими элементами: иконками, компонентами пользовательского интерфейса, сложными композициями и стилистическими ограничениями, выдавая результат в разрешении до 2K.
Несмотря на широкую доступность базовых функций для всех пользователей ChatGPT, расширенные возможности инструмента привязаны к платной подписке. Пользователи бесплатной версии могут работать с базовым режимом генерации, в то время как более сложные итерации с функцией «мышления» и пакетной обработкой являются прерогативой коммерческих тарифов.
Релиз новой модели состоялся на фоне усиливающейся конкуренции на рынке генеративного ИИ, где присутствуют решения от Google и Midjourney, и, по мнению отраслевых обозревателей, нацелен на укрепление позиций OpenAI в сегменте профессионального использования ИИ для коммерческого дизайна и верстки.