Промт-инженер: как правильно писать промты для нейросетей
Работа с нейросетью для генерации текста и изображений становится обыденностью для многих специалистов от digital-сфер до офлайн-профессий. Однако страх чистого листа до сих пор препятствует многим начать пользоваться технологиями искусственного интеллекта.
Три эксперта по работе с нейросетями — художник, руководитель новостного портала и предприниматель — рассказали, как они настроили нейросети, чтобы те эффективно помогали им в работе.
Нейросеть ― это инструмент автоматической генерации контента. Машины умеют создавать текст, изображения, музыку, программный код, видеоролики.
Существует мнение, что в скором нейросети станут таким же привычным инструментом, как смартфон или автомобиль.
В подтверждение прогнозов команда Gerwin вместе с SEO-экспертами уже разбиралась, как поисковые машины будут взаимодействовать с AI-технологиями.
Работу с нейросетями можно сравнить с джинном из бутылки: он исполнит все желания, но в их формулировке может скрываться коварный подвох.
Слова воспринимаются буквально или же в их переносном значении, так что условное желание «зарабатывать лимон в месяц» может сильно разочаровать того, кто его загадал ???? Нейросеть ведёт себя так же: она принимает запросы по своим алгоритмам и выполняет наши просьбы исходя из этого понимания.
Что выдала популярная нейросеть Midjourney по запросу «полосатый кот»
Основа работы с нейросетями ― ввод промптов → запросов, которые набирают в поле обычного чата. Не имеет значения, с каким интерфейсом вы имеете дело: будь то Telegram-бот, GhatGPT или сторонний сервис. Вы всегда вводите промпт в чат, как будто разговариваете с собеседником.
Правильно подобранные промпты увеличивают вероятность выдачи нужного результата и позволяют генерировать примерно тот контент, который мы изначально себе представляем. Казалось бы, ничего сложного: если нужна картинка с белым кроликом, то просто вводим «белый кролик».
Давайте проведём эксперимент и сгенерируем кролика по этому промпту в Midjourney ↓
Среди вариантов вместо ожидаемого милого и пушистого зверька мы получили картинку лабораторного кролика с красными глазами из фильма ужасов. Да, это кролик, и он белый, но это вовсе не то, что мы хотели.
Попробуем исправить ситуацию и введём уточнение: «милый белый кролик».
И снова не то. Кролик белый и милый, но антропоморфный.
Мы снова добавим вводные и обозначим нужный стиль: «милый белый кролик в зелёном поле, фотореализм». И только с третьего раза получаем примерно то, к чему стремились:
Генерация изображения в три хода ― это оптимистичный путь. Куда чаще приходится по многу раз перебирать комбинации слов, чтобы получить хоть что-то похожее на то, что загадали изначально.
Та же самая проблема есть и у текстов: при многих запросах мы получаем очевидные и банальные ответы или совсем не то, что нужно.
В качестве решения проблемы при бешеном росте популярности нейросетей на рынке появилась новая услуга ― инжиниринг промптов, суть которой заключается в подборе наиболее универсальной системы запросов под задачи. Промпт-инженеры изучают принципы работы различных нейросетей и создают списки запросов-шаблонов, при помощи которых можно получать нужный контент за наименьшее количество попыток ввода.
Иногда стоимость услуг промпт-инженеров достигает нескольких тысяч долларов, если речь идёт о создании списков для компаний. Инженеры стали своего рода редкими лингвистами, способными наладить общий язык между человеком и машиной.
https://www.youtube.com/watch?v=Ow_dVFTnk-A\u0026pp=ygVq0J_RgNC-0LzRgi3QuNC90LbQtdC90LXRgDog0LrQsNC6INC_0YDQsNCy0LjQu9GM0L3QviDQv9C40YHQsNGC0Ywg0L_RgNC-0LzRgtGLINC00LvRjyDQvdC10LnRgNC-0YHQtdGC0LXQuQ%3D%3D
Для примера приведём список промптов для написания рекламного объявления:
Переведём первые три промпта (в скобках — данные, которые человек заполняет самостоятельно):
- Можете ли вы написать рекламный ролик для моего нового [название продукта], который призван помочь [описание вашей аудитории] [желаемый результат]?
- Мне нужен рекламный ролик для моей услуги [название услуги], который предоставляет [решение] для [описание ниши]. Можете ли вы написать текст, который затрагивает [проблемы в нише] и подчёркивает преимущества использования моего сервиса?
- Я запускаю новый [тип продукта], который помогает [аудитории]. Можете ли вы написать рекламный ролик, который затрагивает [болевую точку] и выделяет уникальные особенности продукта?
Но чтобы понять, что хочет услышать нейросеть, необязательно обращаться к услугам инжиниринга и покупать дорогостоящие подборки.
Мы поговорили с экспертами по AI-технологиям и инжинирингу и активными пользователями, чтобы разобраться, как обычному человеку наладить сотрудничество с нейросетями.
Евгений Мацкевич
Нейрохудожник
Многим непонятно, как подступиться к генерации изображений. Есть иллюзорное представление о том, что это крайне сложный процесс, но на самом деле это не так и порог входа в эту сферу можно назвать низким.
На сегодняшний день среди массы генеративных инструментов по популярности лидируют Midjourney (MJ) и Stable Diffusion (SD). Первый сервис более популярен у широкой аудитории и выдаёт потрясающие иллюстрации даже по простым промптам. Второй — более специфичный, но обладает рядом настроек для получения максимально точного результата.
В Midjourney главная проблема ― доступность и оплата. MJ ― это бот внутри Discord. И не всем удаётся разобраться с интерфейсом этой платформы, на котором и происходит работа. К тому же, сам бот стал полностью платным, без тестового периода, а оплата возможна только через иностранные карты.
Stable Diffusion сложна в установке. Чтобы настроить версию без ограничений, придётся познакомиться с GitHub и немного разобраться в коде Python.
Кроме того, для стабильной работы и рендера потребуются мощности видеокарты — от 4 ГБ выделенной видеопамяти, что опять же доступно не каждому пользователю.
Однако решение обеих проблем есть: на YouTube можно без труда найти нужные гайды: например вот этот для установки и настройки SD:
Нет лучшего способа побороть боязнь чистого промпта, чем просто начать генерировать. Во-первых, вы поймёте степень отзывчивости нейросети к запросам, а во-вторых, будете поражены её возможностями и тем, что практически всё, что приходит вам в голову, нейросеть может реализовать.
Чтобы разобраться с тем же MJ, в своё время мне помог подробный материал на сайте DTF.
Как выглядит интерфейс Midjourney
Вот пара основных лайфхаков: загадочные кнопки «U» и «V» обозначают Upscale и Version соответственно. То есть «U» масштабирует изображение, а «V» генерирует новые вариации на основе выбранной картинки.
Промпты нужно вводить на английском языке ― так нейросеть лучше понимает, чего мы хотим. Для удобства можно воспользоваться любым онлайн-переводчиком.
Чтобы исключить какие-то элементы, нужно ввести «—no»— два дефиса —перед названием этого элемента.
Например, благодаря «cat —no stripe» мы гарантированно получим условного кота без полосок на теле:
Можно задавать композицию, соотношение сторон, качество и тому подобное. Технические промпты всегда вводятся в конце, после основного запроса. К техническим промптам относятся те, что влияют на качество и соотношение картинки, а также определение стилей, освещения и ряда прочих настроек.
Важную роль играет само AI-коммьюнити. Так, в Discord можно сидеть в комнатах с другими новичками или более продвинутыми пользователями и в реальном времени наблюдать, что и как они генерируют. Вот ссылка на одно из таких сообществ.
Можно заимствовать и адаптировать их промпты. По сути там происходит процесс коллективного самообучения, можно даже сказать, что такое сообщество тоже представляет собой сложную нейросеть. Это хороший вариант, чтобы овладеть синтаксисом запросов, если лень читать огромное справочное руководство, и оценить творческие возможности нейросети.
Первое время я и сам так обучался, а затем перенес бота MJ на собственный сервер — посмотреть, как это сделать, можно в этом ролике по тайм-коду.
Я знаю, что есть сайты, на которых продаются готовые промпты, однако не вижу в них никакого смысла. Во-первых, промпты можно бесплатно позаимствовать в упомянутых комнатах в Discord, где сидят такие же нейроэнтузиасты — и даже делают подборки наиболее удачных промптов.
Лучше всего создавать промпты самому и перестать думать, что это ― удел избранных. Достаточно знать структуру промпта, основные команды и стили.
Как составить промпт для нейросети, генерирующей изображения
Если вы уже использовали нейросети, то знаете, как сложно получить результат, который бы вам понравился. Чтобы ожидание совпало с реальностью, важно правильно написать промпт – запрос. Общие принципы одинаковы в любых нейросетях. Рассказываем, как правильно составить промпт для генерации изображений в нейросетях, чтобы искусственный интеллект вас понял корректно.
- 1 этап. Составляем несложный запрос
- 2 этап. Детализируем объект
- 3 этап. Задаем стилистику
- 4 этап. Добавляем примеры
- 5 этап. Настраиваем параметры
- 6 этап. Собираем запрос воедино
1 этап. Составляем несложный запрос
Научиться писать промпты легко. Для создания изображения достаточно нескольких слов. Вы сможете получить результат высокого качества с минимальным количеством усилий.
Но если ввести несколько слов без уточнений, нейросеть додумает сама недостающие детали.
Поэтому, если вы точно знаете, какой результат хотите получить, сначала надо правильно составить максимально простой запрос для нейросети, а потом добавить к нему уточнения.
https://www.youtube.com/watch?v=Ow_dVFTnk-A\u0026pp=YAHIAQE%3D
Нейросети принимают лучше всего промпты на «родном» языке. Например, Midjourney – на английском, а Kandinsky, нейросеть об Сбера, – на русском. Если не вы не знаете английский, можете использовать переводчики. Например, нейросетевой переводчик DeepL хорошо определяет контекст.
Объект. Это основа фактически любого запроса для нейросети. Именно объект будет в центре всего изображения. Логично, что в сначала надо продумать именно его. Например, волшебник, кот, священник, ангел, некромант, император, город, королева, храм, дом, ферма, пейзаж, гора, машина, река.
Нейросети обучаются на огромной базе изображений из интернета. Поэтому легко выдадут результат по такому запросу. Но, если вписывать в команду только один объект, результаты будут однообразны. Поэтому, например, можно попробовать совместить два объекта: некромант-коммунист, кот-геймер, киберпанк-монах.
Также идеи можно совмещать через предлоги. Винни-Пух из глины, Винни-Пух как король Франции или Винни-Пух, похожий на Пятачка.
- По промпту Winnie the Pooh as King of France в Midjourney получился такой результат:
- А вот такой – в «Кандинском»:
- Вариант по промпту от Leonardo.AI:
- Еще один – от Stable Diffusion:
- А вот так видит Винни Пуха в роли короля Франции DALL·E 2:
- На примерах наглядно видно, насколько по-разному нейросети могут воспринимать один и тот же промпт.
Нейросети позволяют использовать персонажей в качестве объектов. Героев легко узнать, даже если внешность не списана с актеров.
Чтобы на изображении находились несколько объектов, нужно указать количество. Вместо «маги в кафе» напишите «три мага в кафе». Если не указывать значение, нейросеть отобразит случайное количество магов.
Чем больше конкретных объектов на изображении, например больше пяти-шести, тем сложнее нейросети. В таких случаях лучше просить сгенерировать «толпу магов». Но важно помнить: чем больше объектов, особенно животных или людей, тем выше вероятность ошибки и хуже детализация.
Абстракции. Кроме реальных объектов нейросети способны генерировать абстрактные понятия вроде судьбы, времени, смысла жизни или счастья. Они это делают так, как подобные концепты изображают в искусстве или поп-культуре. Сгенерируйте создание времени или когнитивный резонанс – результаты будут удивлять каждый раз.
В то же время не желательно увлекаться и генерировать концепции, предполагающие самостоятельные выводы и обдумывание. Вы так запутаете нейросеть.
Лучше выбирать конкретные запросы, где объекты заменяют абстрактные понятия.
Например, вместо «оптимистичного будущего» лучше попросить создать по промпту «киберпанк-город с голограммами», а вместо «моды в 3000 году» – «футуристичное платье с красочными и светящимися украшениями».
Сразу нужно отказаться:
- от отрицаний. Избегайте слов «не», «без», «исключая», «кроме» и пр. Нейросети понимают все буквально и не видят отрицательных частиц. Например, по промпту «мужчина без бороды» нейросеть генерирует изображение бородатого мужчины. Поэтому лучше создать запрос для нейросети «чисто выбритый мужчина», чтобы получить то, что требуется;
- большого количества объектов. Есть высокая вероятность, что нейросеть ошибется. Особенно, если детализировать каждый объект;
- желания точно передать реальный объект. Если вы укажете «Москва», то не получите реальную столицу России – это будет вариация нейросети с характерными элементами. Аналогично и с попытками создать образы конкретных людей. Да, они будут похожи, но это все равно вариант нейросети.
Для генерации картинок в запросе к нейросети стоит использовать архетипы. Например, вместо «человек, который держит лук и стрелы» лучше написать «лучник», вместо «человек в белом халате с документами и стетоскопом» – «врач».
Если все равно не получается, можно найти в интернете, например на фотобанках или в Pinterest, похожее изображение и взять описание к нему.
Так ИИ будет проще понять идею, ведь именно на подобных изображениях с описаниями он и обучался.
2 этап. Детализируем объект
Конкретизируйте. Например, придумайте, как на изображении будут расположены объекты. Укажите, что находится в центре картинки, а что на заднем плане.
https://www.youtube.com/watch?v=lbGw_Kv1h4s\u0026pp=ygVq0J_RgNC-0LzRgi3QuNC90LbQtdC90LXRgDog0LrQsNC6INC_0YDQsNCy0LjQu9GM0L3QviDQv9C40YHQsNGC0Ywg0L_RgNC-0LzRgtGLINC00LvRjyDQvdC10LnRgNC-0YHQtdGC0LXQuQ%3D%3D
Добавлять детали на изображение можно с помощью глаголов, существительных и прилагательных. Напишите не просто «маг», а «грустный маг в колпаке поздно вечером работает в офисе за компьютером». Не забывайте, что в нейросетях есть ограничение на количество знаков в промпте. Например, у Midjourney – 4000 знаков, у Stable Diffusion – 75 слов, у DALL-E 2 – 400 символов.
К объекту можно добавить базовые детали.
Действия. Действие важно сформулировать так, чтобы оно наглядно отображалось на изображении. Глаголы «идет» или «стоит» помогают больше, чем «беспокоится» или «мечтает». Если необходимо изображение с неочевидным действием, лучше написать промпт не просто «ностальгирует», а «сидит, вспоминает детство».
Как писать эффективные промты для нейросети — Я зерокодер
Промт — это запрос для нейросети, от английского «prompt». Некоторые общаются с ней настолько виртуозно, что почти сразу получают релевантный результат. Причем работодатели уже оценили столь ценный навык — появилась профессия промт-инженера, человека, который правильно разговаривает с искусственным интеллектом.
Промт-инженеру, как и зерокодеру, не нужно уметь программировать, просто хорошо понимать, как взаимодействовать с нейросетью. Давайте поговорим, как выстраивать общение с машиной, чтобы ей становилась понятна ваша задача.
Больше о нейросетях и их прикладном применении расскажем на бесплатном вебинаре. Продемонстрируем, как составлять самые релевантные запросы для Midjourney и дадим доступ в ChatGPT!
Что нужно знать
У Open AI — команды создателей ChatGPT — есть собственная песочница, в которой можно поупражняться в сочинении промтов: регистрируйтесь по ссылке. Это не чат-бот для разговоров и генерации мемов, а инструмент для тестирования промтов. Нейросеть не будет отвечать, только выполнять запросы.
- Например:
- Справа — фильтры и характеристики. Из них важные две:
- Temperature, или «температура», которая контролирует уровень «креативности» нейросети на шкале от 0 до 1, по умолчанию выставлено значение 0,7. Чем ниже, тем обезличеннее получится текст. Чем выше — тем необычнее будет ответ;
- Maximum length, или «максимальная длина», — размер сгенерированного текста. Если вы набрали промт и заметили, что в середине предложения нейросеть замолкла, то просто увеличьте максимальную длину и перезагрузите запрос.
Можно поэкспериментировать и с другими характеристиками. Для того, чтобы залогиниться в песочницу из России, понадобится VPN, одноразовая почта и одноразовый номер телефона, перекликающийся по местоположению с VPN.
Теперь поговорим о том, как же все-таки написать хороший запрос, чтобы нейросеть быстро все поняла и выдала нужный нам результат.
Как составить эффективный промт
1. Используйте контекст
Когда есть контекст, лучше работают и люди, и нейросети. Например, есть разница между: «Напиши поэму о зиме» и «Напиши поэму о холодной и мрачной зиме в стиле Эдгара Аллана По». Или между: «Напиши письмо о том, как воспитывать щенка» и «Напиши готовое письмо от лица кинолога в дружелюбно-неформальном тоне о том, как воспитывать трехмесячного щенка овчарки».
Какой контекст имеется в виду:
- тон письма — например, формальный, профессиональный, дружелюбный;
- тип текста — статья в блог, описание к видео или электронное письмо;
- роль пишущего — специалист, клиент, заказчик.
Чем больше контекста, тем точнее будет результат. И переспрашивать не придется, а это сильно экономит время.
2. Предлагайте примеры
Особенность современных нейросетей заключается в том, что они обучаются. Поэтому для того, чтобы машина «подхватила» и развила идею, ей можно просто предложить готовый пример!
Такой подход отлично работает, когда нужно писать скрипты, ответы на вопросы, описания к фотографиям и короткие посты в определенном стиле. Еще он работает не только с написанием текстов, но и, например, с программированием. И другими вещами, с которыми машина точно справится быстрее человека.
3. Сразу указывайте длину
Компьютеры любят точность. Вместо того, чтобы просить «написать о криптовалютах», лучше попросить «написать текст о криптовалютах для телеграм-канала длиной до 500 символов».
Можно установить длину «от 500 до 700 символов». Можно даже указать «короткий» или «длинный». Но оставлять совсем без указаний не стоит — высок риск получить совсем не то, что хотелось бы.
4. Дополняйте промт важной информацией
Нейросеть можно использовать для написания мотивационного письма на любом языке, но просто печатать в окошке «напиши мотивационное письмо» бессмысленно: результат получится безликим и совершенно не про вас. А вот если предварительно «скормить» ей резюме, то она использует предложенную информацию для создания уникального контента, который потом останется только немного подправить.
В нейросеть можно загрузить статью и попросить у нее написать саммари длиной в 500 символов. Это особенно полезно, если вспомнить, что модели естественного языка GPT-3 и GPT-4 используют информацию до 2021 года. То есть, о новейших научных изысканиях они просто не знают. Но узнают, если им об этом рассказать.
5. Используйте фразы-лайфхаки
Нейросеть можно направить, использовав фразы-лайфхаки:
- «опиши шаг за шагом», что поможет не только в структурировании статьи, но и в написании кода или решении математической задачи;
- «напиши в стиле [Пушкина], [Хармса], [любой другой известной личности]», что поможет, например, в генерации забавных пародий или постов;
- «от лица [профессионального кинолога], [руководителя отдела], [любого другого специалиста]», что поможет в написании электронных писем и рассылок, а также рекламных постов.
Что самое главное в составлении промтов? Хорошо понимать конечную цель текста и конкретизировать. Нейросеть совсем как человек — чем больше информации она получит, тем лучше будет работать.
Школа Midjourney: урок "как правильно писать промты". Cпойлер: делюсь промтами + 1 крутое упражнение, улучшающее промты — Сервисы на vc.ru
Мы очень много работаем с ИИ. И в частности — с Midjourney. Нам часто пишут примерно один и тот же вопрос: «У вас получаются очень интересные и очень красивые иллюстрации. Как вы это делаете?».
{«id»:638422,»gtm»:null}
5.8K показов
16K открытий
Мы отвечаем: «мы не делимся своими промтами. Ведь они — как главный ингредиент в изображении, которое вас вдохновило. Сутки за сутками мы проводим в экспериментах, чтобы найти «тот самый» промт и представить на ваш суд изображение, которое вас так вдохновляет.
Мы любим создавать яркие и необычные работы.
Дочитайте до конца: промтами я все же поделюсь.
Листая соцсети, я увидел очередной «суперзаряженный» промт на полстраницы и решил написать пост о том, как работать с промтами.
portrait of indian village woman at a gathering in the forests of Himachal Pradesh, Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo RGB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Conte-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, super detailed, dynamic pose, photography, volumetric, ultra-detailed, intricate details, 8K, super detailed, ambient –uplight
Wow, подумал я, вот это терпение. Дописать до конца такой огромный промт — это достойно уважения. Вы, конечно же, хотите увидеть результат? Вот он:
Вполне неплохое изображение. Нужен ли такой длинный промт? Отвечу в этом разборе.
Я надел очки и стал читать слово за словом. И с каждым новым словом моя улыбка становилась все шире. Совершенно очевидно, что автор промта хотел добиться максимальной фотографичности изображения. Но зачем же СТОЛЬКО «умных» слов?
Проанализирую лишь одно слово: SFX. У него миллион знаений: звуковые эффекты, самораспаковывающийся архив, имя английского журнала о научной фантастике. А еще это аббревиатура от словосочетания Spread Firefox — из рекламной компании одноименного браузера.
И как, предполагал автор промта, Midjourney должна интерпретировать эти три буквы, применительно к генерации пожилой женщины из индийской деревне?
Правильно — никак. Mj версии «пять» (да и «четверка» тоже — я провел нижеописанный тест полностью в обеих версиях), умничка и просто проигнорировала это слово. Как и десятки других.
Когда вы дочитате эту статью я вам это докажу и вы поймете, как ПРАВИЛЬНО писать промты, не перегружая их «мусором», который совершенно не нужен.
Шаг за шагом я произведу декомпозицию промта (это суперполезное упражнение я рекомендую провести с любым из ваших промтов), чтобы на примерах показать, что влияет на итоговую генерацию, а что нет.
Более того, поймете, что принцип декомпозиции, о котором я пишу, работает и в обратном направлении.
Поэтому держим свои know how в тайне. Как повара — свои фирменные рецепты.
Возможно вы этого не заметили. Но началась новая «золотая лихорадка». Все устремились в цифровой Клондайк. Креативные агенства, пиарщики, простые люди, бренды — каждый хочет решить свою корыстную задачу, задействуя силу ИИ.
Но тут возникает главный облом — как сделать так, чтобы картинки отличались от всех остальных?
Тут-то и приходит понимание, что именно промты — «золото», не картинки. Промтостроитель — старатель, проводящий нудные часы на берегу цифровой реки, просеивая песок слов, чтобы найти золотой самородок: свое идеальное изображение.
Многие ошибочно думают, что с помощью ИИ легко получить то, что вы хотите, и поэтому в их представлении «рисование картинок в нейросетях» — мошенничество и кража чужой работы.
Но в действительности, я вижу, как сеть наводнили однотипные изображения тех людей, которые пришли в Midjourney на хайпе и решили тоже «творить».
Все картинки однотипные, скучные и однообразные, и именно из-за таких людей (которые не разобрались в том, как все работает), MJ незаслуженно обвиняют в том, что она рисует одинаковые картинки. Я уже писал и показывал примеры в стате «Все картинки от ИИ одинаковые!» Это полная чушь. И сейчас я вам это докажу.
Пчела. Mj V5. Итог экспериментов с углом съемки, крупностью плана и освещением.
Некоторые люди говорят, что искусство ИИ — это репликация чужих талантов, а не искусство. Для некоторых — это просто инструмент разочарованных творцов, чтобы смешать популярные культурные ценности или эстетику вместе в попытке получить «лайки» в соцсетях.
Некоторые говорят, что «ИИ-рисовалки» — средство для создания нереалистичных стандартов красоты, чтобы люди могли навязывать свои личные предпочтения в отношении привлекательности вымышленным людям, чтобы избежать взаимодействия с несовершенством в реальном мире.
Некоторые говорят, что это шанс для тех, у кого нет воображения, наступить на плечи творческих гениев, которые десятилетиями осваивали мастерство, стремились создать собственный бренд.
Но все в действительности не так просто.
Я уверен, что инженер промтов — карьера будущего. Поезд уже отходит и скоро наберет очень большую скорость. Но места в вагонах пока еще есть.
А на каждый из вышеперечисленных пунктов я отвечу — нет. Я говорю: «Люди, работающие ИИ, сами по себе творцы. Мы используем развивающиеся технологии, чтобы расширить границы нашего собственного безграничного воображения».
Работа над проптом требует времени и обучения — как и со всеми инструментами, физическими или цифровыми. Итак, нейропоезд уже отходит — на большой скорости — но еще есть место для многих людей. Я предпочитаю быть в поезде, даже если он сойдет с рельсов.
Я приглашаю всех попробовать и убедиться на личном опыте, что все не так просто. Необязательно платить — та же Midjourney дает бесплатные 25 изображений для теста. Есть бесплатные ИИ.
А теперь обещанное. Я расскажу, как можно работать с промтами и отсеивая все лишнее.
Итак, вернемся к промту в начале. Вы удивитесь, но такого же качества можно добиться лишь 1 «ключом» (одним параметром в промте) и сейчас я вам это докажу. Но давайте разберемся с тем, как писать промты.
В начале этот статьи, я привел огромный промт. Сейчас я возьму скальпель своего знания и начну резать его слово за словом. Для начала выкинем весь откровенный мусор и увидим ничего не меняется (за исключением лица, что естественно). После выброса «заумных» терминов, у нас остался такой промт:
portrait of Indian village woman at a gathering in the forests of Himachal Pradesh , Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Pro Photo RGB, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Soft Lighting, Volumetric, Conte-Jour, Global Illumination, Screen Space Global Illumination, Scattering, Shadows, Rough, Shimmering, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, OpenGL-Shader’s, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, dynamic pose, photography, volumetric, ultra-detailed, intricate details, super detailed, ambient —uplight —v 4 —q 2
portrait of an indian village woman in forest in Himachal pradesh, clear facial features, Cinematic, 35mm lens, f/1.8, accent lighting, global illumination.
portrait of indian village woman at a gathering in the forests, digital photograph, soft natural light, 50mm lens, f1.8 aperture.
portrait of indian village woman in the forests, digital photograph, soft natural light, 50mm lens, f1.8 aperture
А что если отрезать еще кусок и убрать 1.8 Aperture?:
portrait of indian village woman in the forests, digital photograph, soft natural light, 50mm lens
А теперь избавимся от 50mm lens:
portrait of indian village woman in the forests, digital photograph, soft natural light
Следующим шагом пустим под нож параметр soft natural light.
portrait of indian village woman in the forests, digital photograph
Ничего не меняется. Кэп, что случилось?! :-)))
Отрезаем digital photograph
portrait of indian village woman in the forests
portrait of indian village woman
И только на этом этапе мы видим значимое изменение. Поменялись цвета изображения. Параметр in the forests задавал «зеленые оттенки». Поэтому, если бы мы захотели увидеть женщину в красном, мы должны были бы написать:
portrait of indian village woman in red dress the forests
Проверим резульльтат этого промта (да, все рабтает):
Но давайте продолжим резать исходный промт. Мы же решили действовать радикально. Так что мы оставим только:
Ну и как тебе такое, Илон Маск?
Проанализируем, с чего мы начали и к чему пришли. Было:
portrait of indian village woman at a gathering in the forests of Himachal Pradesh, Cinematic, Photoshoot, Shot on 25mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/22, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo RGB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Dramatic Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Conte-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, Ray Traced, ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, super detailed, dynamic pose, photography, volumetric, ultra-detailed, intricate details, 8K, super detailed, ambient –uplight
Тут я не могу не добавить: LOL.
Все генерации сделаны в Midjourney v5. Точно такой же эксперимент я провел в версии 4. И могу сделать однозначное утрвеждение: новая версия заточена делать фотографии прямо из коробки. Если вы хотите сделать стилизацию (под иллюстрацию, и тд) — это теперь НУЖНО указывать в промте обязательно. Если же вы хотите сделать фото — стало проще.
В четвертой версии занчимые изменения случились на этапе, когда я убрал из этого промта — portrait of indian village woman at a gathering in the forests, f1.8 aperture — параметр «f1.8 aperture». Фотография стала иллюстрацией. В «пятерке» все не так.
Как я уже писал выше, процесс декомпозиции можно (и нужно) проводить в обратном порядке, нанизывая новые данные на промт и анализируя, как меняется изображение.
Промты стоит писать по такой формуле:
[ОБЪЕКТ] [ЛОКАЦИЯ] [ПАРАМЕТРЫ ОСВЕЩЕНИЯ] [ТЕХНИЧЕСКИЕ ПАРАМЕТРЫ — такие, как —ar 16:9 и т.д.]
Творите, ищите свои промты, и не выпрашивайте промты у других. Как я уже написал в самом начале статьи: создавать промты — это искусство.
Как составить эффективный промт для нейросети с примерами и подробной инструкцией
Как составить эффективный промт для нейросети с примерами и подробной инструкцией
Современные нейросети могут решать множество задач, но для этого им нужно понимать ваши запросы. В этой статье мы подробно рассмотрим, как создать эффективный промт для нейросети и добиться точных и полезных ответов.
Прежде чем погрузиться в создание промта, вы должны четко определить, что вы хотите от нейросети. Это может быть вопрос, задача анализа данных или запрос на перевод текста. Чем точнее цель, тем легче будет создать промт.
Особенность современных нейросетей заключается в том, что они обучаются.
Поэтому для того, чтобы машина «подхватила» и развила идею, ей можно просто предложить готовый пример! Такой подход отлично работает, когда нужно писать скрипты, ответы на вопросы, описания к фотографиям и короткие посты в определенном стиле. Еще он работает не только с написанием текстов, но и, например, с программированием. И другими вещами, с которыми машина точно справится быстрее человека.
- Сформулируйте основные слова, связанные с вашей задачей.
- Изучите примеры запросов, связанных с вашей темой.
Чтобы ваш промт был понятен нейросети, используйте технические термины и специфическую лексику, если это уместно.
- Исследуйте, какая лексика близка к языку вашей нейросети.
- Предоставьте дополнительные данные, если это поможет.
Нейросеть можно использовать для написания мотивационного письма на любом языке, но просто печатать в окошке «напиши мотивационное письмо» бессмысленно: результат получится безликим и совершенно не про вас. А вот если предварительно «скормить» ей резюме, то она использует предложенную информацию для создания уникального контента, который потом останется только немного подправить.
В нейросеть можно загрузить статью и попросить у нее написать саммари длиной в 500 символов. Это особенно полезно, если вспомнить, что модели естественного языка GPT-3 и GPT-4 используют информацию до 2021 года. То есть, о новейших научных изысканиях они просто не знают. Но узнают, если им об этом рассказать.
- Избегайте сложных оборотов и излишней технической специфики.
- Тестируйте промт на нейросети и людях.
Создание эффективного промта — это итеративный процесс. После первых попыток, тестируйте промт и вносите корректировки.
- Протестируйте промт на нейросети.
- Анализируйте полученные результаты и уточняйте запрос.
Когда есть контекст, лучше работают и люди, и нейросети. Например, есть разница между: «Напиши поэму о зиме» и «Напиши поэму о холодной и мрачной зиме в стиле Эдгара Аллана По». Или между: «Напиши письмо о том, как воспитывать щенка» и «Напиши готовое письмо от лица кинолога в дружелюбно-неформальном тоне о том, как воспитывать трехмесячного щенка овчарки».
Какой контекст имеется в виду:
- тон письма — например, формальный, профессиональный, дружелюбный;
- тип текста — статья в блог, описание к видео или электронное письмо;
- роль пишущего — специалист, клиент, заказчик.
Чем больше контекста, тем точнее будет результат. И переспрашивать не придется, а это сильно экономит время.
- Указывайте важные детали или параметры в запросе.
- Если возможно, предоставьте контекстную информацию.
Нейросеть можно направить, использовав фразы-лайфхаки: «опиши шаг за шагом», что поможет не только в структурировании статьи, но и в написании кода или решении математической задачи; «напиши в стиле [Пушкина], [Хармса], [любой другой известной личности]», что поможет, например, в генерации забавных пародий или постов; «от лица [профессионального кинолога], [руководителя отдела], [любого другого специалиста]», что поможет в написании электронных писем и рассылок, а также рекламных постов. Что самое главное в составлении промтов? Хорошо понимать конечную цель текста и конкретизировать. Нейросеть совсем как человек — чем больше информации она получит, тем лучше будет работать.
- Готовьтесь отвечать на уточняющие вопросы.
- Предоставляйте дополнительные данные по запросу нейросети.
Сложные концепции могут быть лучше поняты, если использовать метафоры или аналогии. Это помогает нейросети ассоциировать информацию и давать более точные ответы.
- Ищите подходящие метафоры или аналогии для вашей задачи.
- Используйте их в запросе.
Слишком короткий или длинный запрос может затруднить понимание нейросетью. Старайтесь подбирать оптимальную длину запроса.Компьютеры любят точность.
Вместо того, чтобы просить «написать о криптовалютах», лучше попросить «написать текст о криптовалютах для телеграм-канала длиной до 500 символов». Можно установить длину «от 500 до 700 символов». Можно даже указать «короткий» или «длинный».
Но оставлять совсем без указаний не стоит — высок риск получить совсем не то, что хотелось бы.
- Соблюдайте баланс между краткостью и полнотой.
- Подбирайте длину запроса в зависимости от конкретной задачи.
Нейросети могут улучшать свои навыки с течением времени. Если у вас есть возможность, предоставляйте обратную связь и корректировки ответов нейросети.
- Следите за качеством ответов и вносите исправления при необходимости.
- Участвуйте в процессе обучения нейросети.
Составление эффективного промта для нейросети — это искусство, требующее внимания к деталям и понимания работы искусственного интеллекта. Следуя нашей инструкции, вы сможете создавать запросы, которые дадут точные и полезные ответы от нейросетей.
- Чтобы лучше понять, как создавать эффективные промты, рассмотрим несколько примеров.
- Задача: Перевести английский текст на французский.
- Промт: «Переведите следующий текст с английского на французский: ‘Hello, how are you?'»
- Задача: Провести анализ данных о продажах за последний год.
- Промт: «Проведите анализ данных о продажах за последний год и предоставьте отчет с информацией о выручке, наиболее популярных товарах и динамике продаж.»
- Чтобы подытожить, давайте рассмотрим общий подход к созданию эффективных промтов для нейросетей:
- Определите цель запроса: Четко сформулируйте, что вы хотите получить от нейросети.
- Выберите ключевые слова: Подберите слова или фразы, которые наилучшим образом описывают вашу цель.
- Используйте понятный язык: Пишите запрос, понятный искусственному интеллекту, и учитывайте его технический контекст.
- Тестируйте и уточняйте: После создания промта, тестируйте его и вносите корректировки, если необходимо.
- Учитывайте контекст и обучение: Дополнительные данные и обратная связь могут значительно улучшить результаты.
Следуя этим шагам, вы сможете создавать эффективные промты для нейросетей, получая точные и полезные ответы на ваши запросы
- Что такое промт-инженер и в чем заключается его работа?
- Промт-инженер — это специалист, который формулирует запросы для нейросетей, чтобы получать нужные результаты. Он обучает машину понимать контекст и задачу.
- Какие характеристики важны при создании промта?
- Важны Temperature (температура) и Maximum length (максимальная длина). Они влияют на креативность и размер генерируемого текста соответственно.
- Почему важен контекст при написании промта?
- Контекст помогает нейросети понять задачу точнее. Чем больше информации, тем лучше результат.
- Можно ли использовать нейросеть для генерации текста на разные темы?
- Да, нейросеть может генерировать тексты на разные темы, если вы правильно сформулировали промт и предоставили контекст.
- Какие еще советы вы можете дать начинающим промт-инженерам?
- Экспериментируйте, используйте примеры и фразы-лайфхаки, уточняйте длину текста. Чем больше практики, тем лучше становитесь.