DALL·E 2 , вероятно, будет считаться одним из самых важных технологических продуктов 2020-х годов, и он, несомненно, положил начало нынешнему увлечению генеративным искусственным интеллектом. Но с момента его запуска в 2022 году другие генераторы изображений , такие как Stable Diffusion и Midjourney, создают всё более впечатляющее искусство искусственного интеллекта. Последние шесть месяцев или около того казалось, что DALL·E отстает
Но теперь ситуация изменилась с выпуском DALL·E 3.
Что такое ДАЛЛ·Е 3?
DALL·E 3 — это последняя версия генератора искусственного интеллекта OpenAI. Это значительное обновление по сравнению с DALL·E 2, как в плане использования, так и в качестве того, что он может генерировать. Опять же, он может конкурировать со всеми другими доступными генераторами изображений ИИ . Создавайте изображения AI из любого приложения, которое вы используетеАвтоматизируйте создание изображений с помощью ИИ
Самым большим изменением является то, что DALL·E 3 больше не является отдельным приложением, по крайней мере, на данный момент. Вместо этого он интегрирован с ChatGPT. Это упрощает использование, но все же есть некоторые особенности, как мы и ожидали от любого инструмента на базе искусственного интеллекта.
Итак, давайте копаться.
Сначала зарегистрируйтесь в ChatGPT Plus.
На данный момент DALL·E 3 доступен только подписчикам ChatGPT Plus . Чтобы получить к нему доступ, зарегистрируйте учетную запись ChatGPT , а затем нажмите «Обновить до Plus» в нижней части левой боковой панели. Выберите план подписки ChatGPT Plus за 20 долларов в месяц, введите свои платежные данные, и все готово.
На данный момент DALL·E 3 имеет то же ограничение, что и GPT-4: вы можете отправлять 50 запросов каждые три часа. Теоретически это означает, что вы можете создавать более тысячи изображений в день. Это намного больше, чем вы обычно получаете с помощью генератора изображений AI, такого как Dream Studio (который использует Stable Diffusion) или Midjourney, хотя цены на все направления неодинаковы. И я подозреваю, что если вы регулярно начнете просматривать такое количество подсказок, OpenAI, возможно, найдет что сказать.
Если вы хотите опробовать DALL·E 3 без регистрации в ChatGPT Plus, вы также можете протестировать его в Bing Image Creator . У вас нет такого же уровня контроля, но он использует ту же базовую модель. Технически его можно использовать бесплатно, хотя изображения снабжены водяными знаками, и он использует систему «повышения кредитов». Когда вы закончите выделение, Image Creator может потребоваться больше времени для обработки ваших подсказок.
Начало работы с DALL·E 3
Чтобы получить доступ к DALL·E 3, перейдите в ChatGPT и наведите курсор на GPT-4 в верхней части экрана. В раскрывающемся меню выберите DALL·E 3 Beta.
После этого использование DALL·E 3 аналогично использованию ChatGPT. Вы можете либо ввести обычное текстовое приглашение, либо взаимодействовать с ним, используя естественный язык . Каждая подсказка предоставит вам четыре разных изображения на выбор.
Вот некоторые вещи, которые стоит попробовать:
- «Кубистическая картина: большая корова на маленьком поле»
- «Картина маслом обезьяны в скафандре на Луне»
- «Канадец верхом на лосе по кленовому лесу в стиле картины импрессиониста»
- «Фото ирландца, работающего удаленно»
Единственное, что DALL·E 3 делает по-другому, — это автоматическое улучшение и повторение ваших подсказок. Он также использует несколько разные подсказки для каждого из четырех генерируемых изображений.
Например, когда я ввел «кубистическую картину, изображающую очень большую фиолетовую корову на небольшом поле», DALL·E 3 фактически использовал следующие подсказки:
- «Картина в стиле кубизма, изображающая огромную фиолетовую корову, доминирующую на компактном поле, с фрагментированными геометрическими фигурами, подчеркивающими ее форму».
- «Картина маслом в стиле кубизма, изображающая большую фиолетовую корову, тело которой состоит из угловатых форм, на фоне ограниченного луга».
- «Произведение искусства в стиле кубизма, изображающее огромную фиолетовую корову с искаженными размерами, стоящую в центре ограниченной травянистой территории».
- «Кубистическое произведение искусства, где объемная фиолетовая корова, состоящая из разрозненных плоскостей и углов, заметно выделяется на миниатюрном поле».
Чтобы увидеть, что DALL·E 3 использовало в качестве подсказки для любого изображения, просто щелкните по нему. То, что он попытался сгенерировать, появится в поле «Подсказка» .
Чтобы загрузить изображение, наведите на него курсор и щелкните значок загрузки в левом верхнем углу.
Как управлять DALL·E 3 с помощью ChatGPT
Самое лучшее в использовании DALL·E 3 — это то, что вы можете обрабатывать запросы на естественном языке через ChatGPT. Если вам что-то не нравится или что-то, что вы хотите подчеркнуть разными результатами, вы можете просто запросить это.
Вот некоторые из вещей, которые я пробовал:
- Просьба предоставить больше вариантов одного конкретного изображения.
- Изменение точки зрения каждого изображения
- Изменение места появления объекта на каждом изображении
- Изменение соотношения сторон каждого изображения
- Изменение количества объектов на каждом изображении
- Добавление, удаление и изменение деталей объекта, таких как цвет и размер.
- Добавление и удаление деталей фона
- Развешивание созданных работ на стенах галереи.
К сожалению, на данный момент DALL·E 3 создает новое приглашение на основе ваших запросов, а затем генерирует новый набор изображений, вместо того, чтобы вносить изменения напрямую. Иногда изменения между двумя изображениями будут небольшими и именно такими, как вы хотите — когда это происходит, это похоже на волшебство. Но в других случаях DALL·E 3 также выдаст то, что вам понравилось в конкретном изображении.
Тем не менее, работать с DALL·E 3 для точной настройки подсказки, которая даст вам именно то, что вы хотите, гораздо проще и эффективнее, чем полагаться на метод проб и ошибок, как это было с DALL·E 2. Помогает то, что DALL ·E 3 также продолжает оживлять события и предлагать вам более интересные и запоминающиеся подсказки.
Как добиться наилучших результатов с DALL·E 3
Хотя DALL·E 3 все еще находится в стадии бета-тестирования, с его помощью можно добиться отличных результатов. В частности, я обнаружил, что DALL·E 3 превосходно подходит для создания рисунков, картин и других видов произведений искусства, а не фотореалистичных изображений. Вот некоторые вещи, которые следует учитывать, чтобы помочь вам добиться наилучших результатов.
Дайте подробные подсказки
Несмотря на то, что DALL·E 3 упрощает использование более простых подсказок, экстраполируя множество вещей, если вам нужно конкретное изображение, добавьте в подсказку множество деталей . Например, снимок экрана ниже начался с моей подсказки:
«Действительно подробная картина маслом, изображающая бельгийского малинуа, одетого как пират, который командует своим кораблем в ожесточенной пиратской битве с другим кораблем. Он носит треуголку и держит пистолет, когда лает приказы своей команде. Море тяжелое, идет дождь. падает, все немного хаотично. Темные и угрюмые цвета. Интересно, выживет ли он».
Неплохо, правда?
DALL·E 3 понимает цифры и положение
Хотя DALL·E 3 все еще можно перегрузить нелепым количеством деталей в подсказке, это гораздо сложнее, чем с DALL·E 2. И хотя он все еще не идеален, DALL·E 3 значительно лучше понимает такие вещи, как числа и положение различных элементов на вашем изображении.
Например, вы можете попросить его сгенерировать что-нибудь на переднем плане или в левой части изображения, и он, скорее всего, это сделает. Точно так же, если вы попросите его о конкретном количестве чего-либо, он чаще всего выполнит это правильно, чем нет.
Попросите тонкие вариации
Если вы попросите DALL·E 3 внести изменения на основе одного из результатов, иногда он может внести довольно большие изменения в исходное приглашение. Если вы предпочитаете, чтобы все было немного более похоже, попросите его внести «тонкие вариации». Хотя это не мешает ему генерировать совершенно новые изображения, я обнаружил, что первоначальные подсказки будут меньше меняться.
50 запросов каждые три часа — это много
Прежде чем написать эту статью, я много тестировал DALL·E 3 в течение двух дней, но так и не достиг предела. Потратьте время, чтобы сказать ему, что делать, и проработайте каждое изображение. Вы вряд ли достигнете цели, даже не попробовав.
Развлекайтесь и играйте
Серьезно, единственный способ по-настоящему понять, на что способен (и на что не способен) DALL·E 3, — это поиграть с ним самостоятельно. ChatGPT смог выполнить некоторые запросы, с которыми, как я думал, у него возникнут проблемы, но он также полностью испортил то, что я считал простыми изменениями.