OpenAI представляет DALL-E 3 с генерацией подсказок, помощью ChatGPT

OpenAI представляет DALL-E 3 с ChatGPT для генерации подсказок.

OpenAI объявила о выпуске DALL-E 3, последней версии инструмента преобразования текста в изображение, который использует ChatGPT для создания подсказок. Пользователи смогут настраивать свои подсказки – описания изображений, которые они хотят сгенерировать – через разговоры с ChatGPT.

Большинство лучших генераторов изображений на основе ИИ принимают подсказки в текстовой форме и используют их для создания произведений искусства в различных стилях. Один из ключевых моментов в генерации правильной серии изображений – создание правильной подсказки, что оказалось сложной задачей. Именно эта проблема и пытается решить DALL-E 3, используя ChatGPT для помощи создателям в создании более качественных подсказок.

“DALL-E 3 может переводить тонкие запросы в чрезвычайно детализированные и точные изображения”, – говорится в заявлении компании.

ChatGPT сможет преобразовывать пользовательский ввод даже в нескольких словах и создавать более детализированные подсказки, которые будет использовать модель Dall-E 3. Еще одним улучшением DALL-E является способность более точно интерпретировать подсказки, создавая изображения более высокого качества, чем в предыдущих версиях. Последняя модель также лучше оснащена для работы с более длинными подсказками и улучшена в отображении такого контента, как человеческие руки или текст.

С октября клиенты ChatGPT Plus и ChatGPT Enterprise получат доступ к DALL-E через API. Неясно, планирует ли компания выпустить бесплатный веб-инструмент, как это было в предыдущих версиях. OpenAI заверила пользователей, что в последней версии будут добавлены меры безопасности, такие как ограничения на возможность инструмента создавать насильственный, адультный или ненавистный контент. Также он сможет отклонять подсказки, запрашивающие изображения публичной фигуры по имени или те, которые стремятся создавать изображения в стиле живого художника. Чтобы обеспечить создателей, OpenAI объявила, что пользователи могут отказаться от использования их работ для обучения будущих моделей преобразования текста в изображение или разрешить использование только части их работ. Компания также заявляет, что в последней версии присутствуют новые меры безопасности, направленные на снижение алгоритмического уклонения.

Несколько технологических компаний, включая Midjourney, OpenAI, StabilityAI, BlueWillow и Tongyi Wanxiang от Alibaba, постоянно совершенствуют свои модели для создания изображений, работающих на основе текста, поскольку они конкурируют в создании лучшего инструмента ИИ для преобразования текста в изображение. Быстрое появление ИИ-сгенерированных изображений привело к нескольким юридическим и безопасностным проблемам. В прошлом месяце суд в Вашингтоне решил, что ИИ-арт, созданный без участия человека, не может быть авторским правом защищенным в соответствии с законодательством США. Несколько компаний по разработке ИИ сталкиваются с исками от художников и создателей, утверждающих, что их авторские произведения были использованы для обучения моделей ИИ.

We will continue to update BiLee; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more