Как использовать DALL·E 3 для создания изображений AI с помощью ChatGPT

dall e

DALL·E 2 , вероятно, будет считаться одним из самых важных технологических продуктов 2020-х годов, и он, несомненно, положил начало нынешнему увлечению генеративным искусственным интеллектом. Но с момента его запуска в 2022 году другие генераторы изображений , такие как Stable Diffusion и Midjourney, создают всё более впечатляющее искусство искусственного интеллекта. Последние шесть месяцев или около того казалось, что DALL·E отстает

Но теперь ситуация изменилась с выпуском DALL·E 3.

Что такое ДАЛЛ·Е 3?

DALL·E 3 — это последняя версия генератора искусственного интеллекта OpenAI. Это значительное обновление по сравнению с DALL·E 2, как в плане использования, так и в качестве того, что он может генерировать. Опять же, он может конкурировать со всеми другими доступными генераторами изображений ИИ . Создавайте изображения AI из любого приложения, которое вы используетеАвтоматизируйте создание изображений с помощью ИИ

Самым большим изменением является то, что DALL·E 3 больше не является отдельным приложением, по крайней мере, на данный момент. Вместо этого он интегрирован с ChatGPT. Это упрощает использование, но все же есть некоторые особенности, как мы и ожидали от любого инструмента на базе искусственного интеллекта.

Итак, давайте копаться. 

Сначала зарегистрируйтесь в ChatGPT Plus.

На данный момент DALL·E 3 доступен только подписчикам ChatGPT Plus . Чтобы получить к нему доступ, зарегистрируйте учетную запись ChatGPT , а затем нажмите «Обновить до Plus» в нижней части левой боковой панели. Выберите план подписки ChatGPT Plus за 20 долларов в месяц, введите свои платежные данные, и все готово.

Модальная регистрация для ChatGPT Plus

На данный момент DALL·E 3 имеет то же ограничение, что и GPT-4: вы можете отправлять 50 запросов каждые три часа. Теоретически это означает, что вы можете создавать более тысячи изображений в день. Это намного больше, чем вы обычно получаете с помощью генератора изображений AI, такого как Dream Studio (который использует Stable Diffusion) или Midjourney, хотя цены на все направления неодинаковы. И я подозреваю, что если вы регулярно начнете просматривать такое количество подсказок, OpenAI, возможно, найдет что сказать. 

Если вы хотите опробовать DALL·E 3 без регистрации в ChatGPT Plus, вы также можете протестировать его в Bing Image Creator . У вас нет такого же уровня контроля, но он использует ту же базовую модель. Технически его можно использовать бесплатно, хотя изображения снабжены водяными знаками, и он использует систему «повышения кредитов». Когда вы закончите выделение, Image Creator может потребоваться больше времени для обработки ваших подсказок.

Начало работы с DALL·E 3

Чтобы получить доступ к DALL·E 3, перейдите в ChatGPT и наведите курсор на GPT-4 в верхней части экрана. В раскрывающемся меню выберите DALL·E 3 Beta.

Раскрывающийся список для выбора DALL-E 3 в ChatGPT

После этого использование DALL·E 3 аналогично использованию ChatGPT. Вы можете либо ввести обычное текстовое приглашение, либо взаимодействовать с ним, используя естественный язык . Каждая подсказка предоставит вам четыре разных изображения на выбор. 

Четыре изображения, основанные на подсказке ChatGPT.

Вот некоторые вещи, которые стоит попробовать:

  • «Кубистическая картина: большая корова на маленьком поле»
  • «Картина маслом обезьяны в скафандре на Луне»
  • «Канадец верхом на лосе по кленовому лесу в стиле картины импрессиониста»
  • «Фото ирландца, работающего удаленно»

Единственное, что DALL·E 3 делает по-другому, — это автоматическое улучшение и повторение ваших подсказок. Он также использует несколько разные подсказки для каждого из четырех генерируемых изображений. 

Например, когда я ввел «кубистическую картину, изображающую очень большую фиолетовую корову на небольшом поле», DALL·E 3 фактически использовал следующие подсказки:

  • «Картина в стиле кубизма, изображающая огромную фиолетовую корову, доминирующую на компактном поле, с фрагментированными геометрическими фигурами, подчеркивающими ее форму».
  • «Картина маслом в стиле кубизма, изображающая большую фиолетовую корову, тело которой состоит из угловатых форм, на фоне ограниченного луга».
  • «Произведение искусства в стиле кубизма, изображающее огромную фиолетовую корову с искаженными размерами, стоящую в центре ограниченной травянистой территории».
  • «Кубистическое произведение искусства, где объемная фиолетовая корова, состоящая из разрозненных плоскостей и углов, заметно выделяется на миниатюрном поле».

Чтобы увидеть, что DALL·E 3 использовало в качестве подсказки для любого изображения, просто щелкните по нему. То, что он попытался сгенерировать, появится в поле «Подсказка» . 

Подсказка DALL-E 3 создана на основе исходной текстовой подсказки.

Чтобы загрузить изображение, наведите на него курсор и щелкните значок загрузки в левом верхнем углу.

Значок загрузки на изображениях, созданных DALL-E 3, в ChatGPT

Как управлять DALL·E 3 с помощью ChatGPT

Самое лучшее в использовании DALL·E 3 — это то, что вы можете обрабатывать запросы на естественном языке через ChatGPT. Если вам что-то не нравится или что-то, что вы хотите подчеркнуть разными результатами, вы можете просто запросить это. 

ChatGPT показывает вид сбоку существующих изображений после запроса: «Можете ли вы сделать это более похожим на вид сбоку?»

Вот некоторые из вещей, которые я пробовал:

  • Просьба предоставить больше вариантов одного конкретного изображения.
  • Изменение точки зрения каждого изображения
  • Изменение места появления объекта на каждом изображении
  • Изменение соотношения сторон каждого изображения
  • Изменение количества объектов на каждом изображении
  • Добавление, удаление и изменение деталей объекта, таких как цвет и размер.
  • Добавление и удаление деталей фона
  • Развешивание созданных работ на стенах галереи.

К сожалению, на данный момент DALL·E 3 создает новое приглашение на основе ваших запросов, а затем генерирует новый набор изображений, вместо того, чтобы вносить изменения напрямую. Иногда изменения между двумя изображениями будут небольшими и именно такими, как вы хотите — когда это происходит, это похоже на волшебство. Но в других случаях DALL·E 3 также выдаст то, что вам понравилось в конкретном изображении. 

Совершенно новый образ из DALL-E 3

Тем не менее, работать с DALL·E 3 для точной настройки подсказки, которая даст вам именно то, что вы хотите, гораздо проще и эффективнее, чем полагаться на метод проб и ошибок, как это было с DALL·E 2. Помогает то, что DALL ·E 3 также продолжает оживлять события и предлагать вам более интересные и запоминающиеся подсказки. 

Как добиться наилучших результатов с DALL·E 3

Хотя DALL·E 3 все еще находится в стадии бета-тестирования, с его помощью можно добиться отличных результатов. В частности, я обнаружил, что DALL·E 3 превосходно подходит для создания рисунков, картин и других видов произведений искусства, а не фотореалистичных изображений. Вот некоторые вещи, которые следует учитывать, чтобы помочь вам добиться наилучших результатов.

Дайте подробные подсказки

Несмотря на то, что DALL·E 3 упрощает использование более простых подсказок, экстраполируя множество вещей, если вам нужно конкретное изображение, добавьте в подсказку множество деталей . Например, снимок экрана ниже начался с моей подсказки:

«Действительно подробная картина маслом, изображающая бельгийского малинуа, одетого как пират, который командует своим кораблем в ожесточенной пиратской битве с другим кораблем. Он носит треуголку и держит пистолет, когда лает приказы своей команде. Море тяжелое, идет дождь. падает, все немного хаотично. Темные и угрюмые цвета. Интересно, выживет ли он».

Неплохо, правда?

DALL·E 3 понимает цифры и положение

Хотя DALL·E 3 все еще можно перегрузить нелепым количеством деталей в подсказке, это гораздо сложнее, чем с DALL·E 2. И хотя он все еще не идеален, DALL·E 3 значительно лучше понимает такие вещи, как числа и положение различных элементов на вашем изображении.

Например, вы можете попросить его сгенерировать что-нибудь на переднем плане или в левой части изображения, и он, скорее всего, это сделает. Точно так же, если вы попросите его о конкретном количестве чего-либо, он чаще всего выполнит это правильно, чем нет.

Изображение трех слепых мышей, созданное DALL-E 3 в ChatGPT.

Попросите тонкие вариации

Если вы попросите DALL·E 3 внести изменения на основе одного из результатов, иногда он может внести довольно большие изменения в исходное приглашение. Если вы предпочитаете, чтобы все было немного более похоже, попросите его внести «тонкие вариации». Хотя это не мешает ему генерировать совершенно новые изображения, я обнаружил, что первоначальные подсказки будут меньше меняться. 

50 запросов каждые три часа — это много

Прежде чем написать эту статью, я много тестировал DALL·E 3 в течение двух дней, но так и не достиг предела. Потратьте время, чтобы сказать ему, что делать, и проработайте каждое изображение. Вы вряд ли достигнете цели, даже не попробовав. 

Развлекайтесь и играйте

Серьезно, единственный способ по-настоящему понять, на что способен (и на что не способен) DALL·E 3, — это поиграть с ним самостоятельно. ChatGPT смог выполнить некоторые запросы, с которыми, как я думал, у него возникнут проблемы, но он также полностью испортил то, что я считал простыми изменениями.

Like this post? Please share to your friends:
DALL E
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: