DALL-E 3 интегрируется с ChatGPT, поэтому пользователям больше не нужно думать о подсказках.
OpenAI анонсировала третью версию своей платформы визуального искусства с генеративным искусственным интеллектом DALL-E. С ней пользователи смогут использовать ChatGPT для создания инструкций для работы нейросети.
DALL-E преобразует текстовые подсказки в изображения. Но даже DALL-E 2 ошибался, часто игнорируя конкретные формулировки. По словам исследователей OpenAI, последняя версия гораздо лучше понимает контекст.
Новая функция DALL-E 3 — интеграция с ChatGPT. Используя ChatGPT, пользователю не нужно придумывать собственные подробные инструкции по работе с DALL-E 3. Они смогут просто попросить ChatGPT придумать подсказку, и чат-бот напишет абзац (DALL-E лучше работает с более длинными предложениями), затем работу начнет DALL-E 3. При этом, пользователи по-прежнему смогут использовать собственные подсказки, если у них есть конкретные идеи для DALL-E.
Новую версия DALL-E сначала выпустят для пользователей ChatGPT Plus и ChatGPT Enterprise в октябре, а позже осенью — для исследовательских лабораторий и службы API. OpenAI не сообщила, когда выпустит бесплатную общедоступную версию.
Представители OpenAI утверждают, что много работали над мерами безопасности DALL-E 3, чтобы пользователи не создавали непристойные или потенциально ненавистнические изображения. OpenAI заявила, что работала с внешними «красными командами» — группой, которая намеренно пытается взломать систему, чтобы проверить ее безопасность — и полагалась на классификаторы входных данных. Это способ научить языковые модели игнорировать определенные слова. DALL-E 3 также не сможет воссоздавать изображения общественных деятелей, если в подсказке конкретно упоминается их имя.
Сандхини Агарвал, политический исследователь компании, заявила, что она «уверена» в новых мерах безопасности. Однако уточнила, что модель постоянно совершенствуется и неидеальна. Представители OpenAI сообщили в электронном письме, что DALL-E 3 обучен отказываться от создания изображений в стиле ныне живущих художников. В отличие от DALL-E 2, который, при подсказке, может имитировать искусство в стиле определенных авторов.
OpenAI, возможно, чтобы избежать судебных исков, также позволит художникам исключать свои произведения из будущих версий моделей искусственного интеллекта для преобразования текста в изображение. Авторы могут отправить изображение, права на которое у них есть, и запросить его удаление, заполнив форму на веб-сайте. Будущая версия DALL-E сможет блокировать результаты, похожие на изображение и стиль исполнителя.
Изображение: OpenAI