AI для генерации изображений Midjourney готовится к бану политических изображений, пишет на этой неделе Bloomberg. По словам главного исполнительного директора Midjourney Дэвида Хольца, компания близка к тому, чтобы в связи с американской предвыборной гонкой на год закрыть для пользователей возможность генерировать фотографии Джо Байдена и Дональда Трампа. В свое время Midjourney прославили дипфейки с арестом Трампа и сгенерированные изображения папы Римского в пуховике Balenciaga, которые широко разошлись в интернете и заставили многих пользователей поверить в их подлинность. Теперь компании приходится бороться с собственными возможностями.
Bloomberg отмечает, что запрет на использование изображений публичных лиц для введения общественности в заблуждение в Midjourney и так существует, но это не помешало журналистам создать модифицированные изображения Трампа, покрытого спагетти, в старой версии Midjourney. Новая версия отказалась генерировать такой контент. ChatGPT тоже работает над ограничением генерации политических картинок — скоро компания начнет добавлять водяные знаки к сгенерированным с помощью DALL-E 3 изображениям. Meta работает над технологией выявления сгенерированного с помощью AI фото-, видео- и аудиоконтента. Сегодня расскажем, как с помощью простых базовых промтов генерировать разрешенные и полезные картинки в Midjourney. В прошлом выпуске рубрики «Онлайн-расследование» мы уже рассказали, что такое промты и как использовать их в ChatGPT.
Инструменты — Midjourney
Midjourney генерирует изображения на основе короткого промта. То же самое делает DALL-E или Stable Diffusion. Но в DALL-E менее реалистичный уровень детализации изображений, а Stable Diffusion не так интуитивен в использовании. Пользоваться Midjourney тоже не так легко, как ChatGPT, но все же доступно любому пользователю.
Как это сделать:
- Зарегистрируйтесь в Discord, можно выбрать регистрацию по почте на gmail.
- Откройте приложение в браузере или скачайте его на компьютер — как вам удобнее.
- Пройдите по этой ссылке-приглашению на сервер Midjourney и оформите подписку (минимальная стоит $10 за 200 попыток). Раньше сеть предоставляла 25 бесплатных попыток, но весной 2023 года эту опцию упразднили.
- Затем в чате Discord слева выберите один из newbies-чатов. В них пользователи генерируют картинки. Они появляются там каждую минуту. Все сгенерированные вами можно посмотреть, нажав на значок «Почта» в верхнем правом углу, а там вкладку «Для вас».
- Наберите в поисковой строке значок «/» и выберите /settings, нажмите enter. Выберите модель, сейчас это V5.2. Выберите уровни стилизации (Style med — нейтральный вариант, чтобы AI не слишком додумывал за вас), детализации (начните со стандартного Regular) и включите Remix mode, чтобы можно было стилизовать и обрабатывать конкретные фото.
- Теперь снова нажмите «/» и выберите вариант /imagine, а в поле «Промт», которое появляется рядом, введите свой запрос. Именно в это поле, а не после него.
- Приложение даст вам четыре варианта картинки. Их можно скачать в хорошем разрешении по кнопкам U1, U2, U3, U4 или нажимать кнопки V1, V2, V3, V4 для доработки соответствующего изображения. С каждым разом картинка будет все детальнее.
Есть аналоги, имитирующие работу Midjourney, например такой, в них вы можете потренироваться с запросами, а результаты будете получать бесплатно с лимитом 10 картинок в день. Но это варианты «дешево и сердито», с минимумом возможностей и далеко не с таким качеством детализации. Большинство впечатливших вас картинок, сгенерированных AI, которые вы могли видеть, сделаны в Midjourney.
Как составлять промт:
— Midjourney разбивает слова и фразы в промте на небольшие фрагменты, по которым и понимает, какое изображение создавать, поэтому лучше, если промты будут короткие. Нужно удалять лишние слова и перечислять конкретные параметры через запятую. Формулировать рекомендуется на английском языке.
— Какие параметры изображения можно задать: пол, эмоция героя, национальность, одежда, что именно он делает (стоит, идет и т. п.), обстановка вокруг, место действия, временной период (время суток, время года), погода, преобладающие цвета и так далее.
— Автоматически первое упомянутое слово считается самым важным, генерация фокусируется на нем. Чтобы показать, что для вас одинаково важно, например, и изображение, и его фон, поставьте между ними два двоеточия (::).
— Преувеличивайте, например, если что-то должно быть большим, используйте не big, а immense. Если же вы хотите, чтобы на изображении не было чего-то конкретного, добавьте: —no (название предмета). Если изображение должно быть более или менее художественным, то добавьте: —s 100, где 100 — это базовое значение художественности.
— Примерная структура простого базового промта: объект изображения, стиль изображения (pencil drawing, oil painting, sketch), место съемки, погода, ракурс съемки и тип камеры (vintage, analog, GoPro, Kodak, fisheye lens), освещенность (soft light, ambient light, neon light), преобладающие цвета, выражение лица, стиль одежды, референсы (Wes Anderson, Tim Burton, Andy Warhol, Vogue, National Geographic).
Пример: four businessmen, meeting, watercolor illustration, office of a Russian IT holding, Moscow outside in winter, interior photography, analog, daylight, yellow and black, business suits, Vogue style.
При этом в бесплатном аналоге картинка по такому запросу будет выглядеть так
— Чтобы сгенерировать картинку по уже существующему снимку, снова нажмите на «/» и выберите /imagine, затем в графе promt введите прямую гиперссылку на фото и описание стиля, в котором нужно ее обработать, допустим, Wes Anderson style. Не путайте эту ссылку с гиперссылкой на пост с фото, такая не подойдет. Прямую гиперссылку на фото обычно можно получить, если кликнуть по ней левой мышкой и выбрать «Открыть изображение в новой вкладке».
Меры предосторожности
— Ваши запросы в общем чате Midjourney видны другим участникам чата. С одной стороны, вы заметите по себе, что не смотрите на чужие запросы и их результаты, а следите только за своими. С другой стороны, публиковать слишком личные или сомнительные запросы в таком чате все же не стоит. Для приватного использования нужно создавать свой сервер и добавлять в него бот Midjourney, но этот набор действий уже выходит за рамки базовых и простых.
— Не стоит использовать Midjourney для создания фейкового контента — поддельных снимков известных людей, иллюстраций для фейковых новостей, аватарок фейковых личностей. Помимо того, что это не этично, многие из таких действий во многих странах мира преследуются законом.
— В этом материале описан набор действий для начинающих, но возможности Medjourney в десятки раз выше. Почитать о них можно, например, здесь и здесь.
Примеры использования
Midjourney широко используется не для развлечений, а в работе крупных компаний. Специалисты Центра имиджевых проектов ИТМО заявляли, что используют Midjourney для разработки контент-планов для социальных сетей университета.
Бренды используют AI в маркетинге. Например, Nestle отпраздновала свое столетие в Колумбии десертами, разработанными Midjourney, и представила их в Музее современного искусства в Боготе. А авиакомпания KLM использовала Midjourney для создания изображений самолетов — морских существ.
Сотрудники сети «585» рассказывали РБК, что использовали Midjourney для создания дизайна ювелирного изделия в форме бабочки, а сеть «Теремок» создала с ее помощью визуал рекламной кампании «Масленица-2023».
Обычные пользователи достраивают с помощью Midjourney картинку, планируют дизайн помещения, готовят референсы к своим идеям, чтобы показать их работодателю.
Что мне с этого?
Правильно составленный промт может помочь в решении многих сложных задач. Часто иллюстрация помогает поделиться референсом или дать контрагенту представление о ваших идеях.
— Bloomberg подготовил справочник данных по 12 предвыборным гонкам, за которыми стоит следить в этом году, на основании данных Евростата, Transparency International и местных источников информации. В этом году выборы проходят в странах, совокупно представляющих половину мировой экономики. Например, Пакистан и Тунис издание относит к молодым демократиям, США и Великобританию — к давно установившимся демократиям. Россия тоже включена в подборку с пометкой о том, что Владимир Путин «почти наверняка» гарантировал себе победу, а его главный оппонент Алексей Навальный находится в тюрьме.
— Французская газета Le Monde подсчитала уровень потребления электроэнергии разными предметами домашнего обихода — обогревателями (в среднем 30,9% от потребления домохозяйств), водонагревателями (ими оборудовано 49% французских домов), холодильным оборудованием, аудиовизуальной техникой (64% этих расходов приходится на приставку, подключенную к телевизору), предметами освещения (за последнее десятилетие стало в 2,5 раза дешевле и вышло из топа самых расходных статей) и так далее, — чтобы помочь французам снизить коммунальные платежи, выросшие на 10% только за февраль. Также журналисты подсчитали, помогает ли экономить использование энергоэффективной техники и режимов (выяснилось, что холодильники с режимом экономии позволяют снизить расходы по этой графе в 1,5 раза). Источники данных: французское агентство по охране окружающей среды и энергетики, оператор сети передачи электроэнергии и европейская база данных Odyssee, которая отслеживает потребление энергии поэлементно на европейском уровне.
— Южнокорейское медие Mabu News SBS визуализировало зависимость от смартфонов и соцсетей на основании данных Министерства науки, информационных и коммуникационных технологий Южной Кореи, Корейского агентства NIA и международных исследований использования соцсетей. Настоящей зависимостью страдает 2–3% пользователей. Но в группе риска — 23,6% пользователей, больше 40% из них приходится на подростков. При этом объем использования соцсетей в мире очень разный. В Западной Европе 80,4% используют соцсети, в Восточной Азии — 73,3%, в Северной Америке — 71,4%, а в странах Африки к югу от Сахары — лишь около 10%.