Что такое Midjourney
Midjourney – это независимая исследовательская лаборатория, которая изучает новые средства мышления и расширяет воображение человеческого вида. Они также разрабатывают программу искусственного интеллекта, которая создает изображения по текстовым описаниям. Вы можете использовать Midjourney через бота в Discord, но с ограничением на количество попыток. Это очень интересный и инновационный проект.
Кто основал Midjourney?
Midjourney был основан Дэвидом Холцем, который также является сооснователем Leap Motion. Он – главный исполнительный директор исследовательской лаборатории Midjourney, Inc., которая находится в Сан-Франциско, Калифорния. Он считает художников своими клиентами, а не конкурентами Midjourney. Он также говорит, что компания уже прибыльна.
Какие технологии использует Midjourney?
Midjourney использует технологии искусственного интеллекта для генерации изображений по текстовым описаниям, называемым “подсказками” (Prompt), подобно DALL-E и Stable Diffusion от OpenAI. Midjourney обучался на миллионах изображений, собранных из интернета. Для генерации изображений Midjourney использует процесс, называемый диффузией, который заключается в постепенном уточнении случайного шума до желаемого изображения. Midjourney также работает над веб-интерфейсом, но пока доступен только через бота в Discord.
Что такое диффузия?
Диффузия – это процесс, при котором искусственная нейронная сеть обучается восстанавливать изображение из случайного шума. Диффузия работает путем постепенного добавления шума к исходному изображению, пока оно не станет полностью зашумленным, а затем обучения нейронной сети обратить этот процесс . Для генерации изображения диффузионная модель начинает с чистого шума и постепенно улучшает его, пока не получит чистое изображение. Этот процесс синтеза можно интерпретировать как алгоритм оптимизации, который следует по градиенту плотности данных, чтобы произвести вероятные образцы.
Как составить качественный Prompt для Midjourney
Есть несколько основных правил составления качественных, подробных Prompts для Middjorney v5:
- Используйте простые и конкретные слова для описания того, что вы хотите видеть на изображении. Например: “взрывающаяся статуя”, “микки маус”, “бэби йода”, “пикачу” и т.д.
- Добавляйте дополнительные слова или фразы для уточнения контекста, стиля, настроения или перспективы вашего запроса. Например: “+ кинематографический кадр”, “+ фотографии, сделанные ARRI”, “+ невероятно детализированные”, “+ профессиональное освещение”, “+ 50мм, 80мм, 100мм” и т.д.
- Используйте запятые для разделения разных слов или фраз в вашем запросе. Например: “бэби йода + зеленый световой меч, космический корабль”
- Используйте символы “–” для указания дополнительных параметров для вашего запроса. Например: “–q 2” для установки качества изображения на 2 (из 4), “–v 4” для выбора версии алгоритма v4 (из 5), “–upbeta 1” для использования бета-версии улучшителя изображений
- Конечно же, описывать желаемое изображение нужно на английском языке
Что нового в Midjourney v5
Midjourney v5 предоставляет несколько новых функций и команд для генерации качественных изображений. Вот некоторые из них:
- Высокое разрешение по умолчанию. Изображения Midjourney v5 по умолчанию рендерятся с разрешением 1024 x 1024 пикселей, в отличие от 512 x 512 пикселей в v4.
- Неограниченные соотношения сторон. Вы можете использовать любое соотношение сторон для вашего запроса, добавив параметр –aspect или –a с желаемым значением. Например: “–a 16:9” или “–a 1:2”.
- Более четкие, детализированные изображения. Midjourney v5 использует бета-версию улучшителя изображений, который делает изображения более резкими, четкими и детализированными. Вы можете включить эту функцию, добавив параметр –upbeta или –ub с значением 1. Например: “–ub 1”.
- Более связный вывод. Midjourney v5 лучше понимает текстовые запросы и создает более логичные и целостные изображения.
- Более широкий диапазон поддерживаемых стилей. Midjourney v5 может генерировать изображения в разных стилях, таких как реалистичный, сюрреалистичный, абстрактный, аниме и т.д. Вы можете указать желаемый стиль, добавив параметр –style или –s с одним из доступных значений. Например: “–s realistic” или “–s anime”1.
- Более тонкое понимание текстовых запросов. Midjourney v5 может учитывать контекст, настроение, перспективу и другие аспекты вашего запроса и создавать более подходящие изображения.
- Поддержка повторяющихся узоров. Вы можете создавать изображения с повторяющимися узорами, добавив параметр –tile или –t с желаемым значением. Например: “–t 4” или “–t 8”.
- Лучшая обработка изображений-подсказок (и ремиксов). Вы можете использовать изображения в качестве подсказок для вашего запроса, добавив параметр –img или –i с URL-адресом изображения. Например: “–i https://example.com/image.jpg”. Вы также можете комбинировать несколько изображений-подсказок с помощью символа “+”.
Как добавлять параметры в текстовые описания (Prompts) для Midjourney v5
- Параметры – это специальные слова или символы, которые вы можете добавлять в конец своего текстового запроса, чтобы изменить настройки или поведение сервиса Midjourney.
- Параметры начинаются с символа “–” и могут иметь одно или несколько значений после него. Например: “–q 2” или “–style realistic”.
- Параметры могут быть сокращены до одной буквы для удобства. Например: “–q” можно заменить на “–q”.
- Параметры могут быть комбинированы друг с другом, разделяя их пробелами. Например: “–q 2 –v 5 –s realistic”.
- Параметры могут быть переопределены другими параметрами с тем же именем. Например: “–q 2 –q 3” будет использовать значение 3 для параметра –q.
- Параметры могут быть установлены по умолчанию с помощью команды /settings. Например: “/settings –v 5” установит версию модели на 5 для всех будущих запросов.
Вот список возможных параметров для Midjourney v5:
- –version или –v: выбирает версию модели для генерации изображения. Принимает значения от 1 до 5. По умолчанию используется последняя версия (5).
- –quality или –q: выбирает качество изображения. Принимает значения от 1 до 4. Чем выше значение, тем лучше качество и тем дольше время генерации. По умолчанию используется значение 2.
- –style или –s: выбирает стиль изображения. Принимает разные значения в зависимости от версии модели. Например: realistic, abstract, anime и т.д. По умолчанию используется стиль photorealistic.
- –aspect или –a: выбирает соотношение сторон изображения. Принимает значения в формате X:Y. Например: 16:9, 1:1, 1:2 и т.д. По умолчанию используется значение 1:1.
- –tile или –t: создает изображение с повторяющимся узором. Принимает значения от 2 до 8. Чем выше значение, тем больше повторений узора на изображении. Это экспериментальная функция и может работать нестабильно.
- –img или –i: использует изображение в качестве подсказки для запроса. Принимает URL-адрес изображения. Может быть использован несколько раз с разными URL-адресами для комбинирования нескольких изображений-подсказок.
- –iw или –w: задает вес изображения-подсказки для запроса. Принимает значение от 0 до 1000. Чем выше значение, тем больше влияние изображения-подсказки на результат. Должен быть использован после параметра –img или –i.
- –upbeta или –ub: включает бета-версию улучшителя изображений. Принимает значение 0 или 1. Если значение равно 1, то изображение будет обработано улучшителем, который делает его более четким и детализированным.
- –stylize или –c: бот Midjourney был обучен создавать изображения с художественными цветами, композицией и формами. Параметр —stylize или —s влияет на то, насколько сильно применяется это обучение. Низкие значения стилизации создают изображения, которые точно соответствуют подсказке, но менее художественны. Высокие значения стилизации создают очень художественные изображения, но менее связанные с подсказкой. –stylize Значение по умолчанию равно 100 и принимает целые значения от 0 до 1000
Примеры изображений, созданных Midjourney + Prompts

a ballerina in a dimly lit small deteriorated loft, looking at the camera, ultra realistic, ultra high detail –v 5 –s 750 –q 2

a ballerina in a dimly lit small deteriorated loft, looking at the camera, ultra realistic, ultra high detail –v 5 –s 750 –q 2

Moroccan girl of a Bedouin tribe in traditional clothing. The scene is photorealistic shot with Nikon Z9 and NIKKOR Z 85mm f/1.2 S –v 5

a ballerina sleeping on an old sofa in a dimly lit deteriorated factory building, looking at the camera, ultra realistic, ultra high detail –v 5 –s 750 –q 2

a ultra realistic alien creature is entering the swedish parlament,Cinematic, Color Grading, Ultra-Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, insane details, intricate details, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography, Photoshoot, Shot on 70mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/2, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo GB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, R a y Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, hyper realistic, super detailed, dynamic pose, photography, Hyper realistic, volumetric, photorealistic, ultra photoreal, ultra-detailed, super detailed, full color, ambient occlusion, volumetric lighting, high contrast, Nikon D850, Nikon AF-S NIKKOR 14-24mm f/2.8G ED lens, ISO 200, f/8, 1/15-second shutter speed, –ar 16:9 –q 2 –v 5 –s 750 –q 2 –v 5

one person portrait photography of Andrey Shalygin, Ankhaii Great Dragon, First Rank Battlemage, the Grey Wanderer, supreme being, Nordic race fair skinned, 40 years old bald man, narrow face, high-quality black leather clothes and cloak, mansion luxury room interior, Cinematic, Color Grading, Ultra-Wide Angle, Depth of Field, hyper-detailed, beautifully color-coded, insane details, intricate details, beautifully color graded, Unreal Engine, Cinematic, Color Grading, Editorial Photography, Photography, Photoshoot, Shot on 70mm lens, Depth of Field, DOF, Tilt Blur, Shutter Speed 1/1000, F/2, White Balance, 32k, Super-Resolution, Megapixel, Pro Photo GB, VR, Lonely, Good, Massive, Half rear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Shimmering, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, Diffraction Grading, Chromatic Aberration, GB Displacement, Scan Lines, R a y Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cell Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hyper maximalist, elegant, hyper realistic, super detailed, dynamic pose, photography, Hyper realistic, volumetric, photorealistic, ultra photoreal, ultra-detailed, super detailed, full color, ambient occlusion, volumetric lighting, high contrast, Nikon D850, Nikon AF-S NIKKOR 14-24mm f/2.8G ED lens, ISO 200, f/8, 1/15-second shutter speed, –ar 16:9 –q 2 –v 5

superman in cute Chibi style , White background , octane render , global illumination –v 5

beach wave, sand, acryllic pour, 8k high definition, photorealistic

beauty robot

An Easter egg surrounded by things that symbolise chillout, relaxation, good mood, positivity. The egg is colourful and has sunglasses on
комментариев