Общие

Fooocus 18+

Fooocus 18+

Инструкция по Fooocus в Google Colab

Одно из главных преимуществ Fooocus — это возможность запустить его через Google Colab без установки на собственный компьютер. Это экономит ресурсы вашего ПК и позволяет использовать мощные GPU от Google бесплатно.


Давайте разберем, как пользоваться Fooocus в Google Colab:

Пошаговая инструкция по запуску

Шаг 1: Найдите официальный Colab-ноутбук

Самый надежный способ — перейти в официальный репозиторий проекта на GitHub.


- Откройте поисковик и введите: **Fooocus GitHub**.

- Первой ссылкой, скорее всего, будет репозиторий от **lllyasviel/Fooocus**. Перейдите в него.

- В файлах репозитория найдите версию для Colab. Обычно она называется `Fooocus_Colab.ipynb` или имеет похожую иконку и название. Часто в файле `README.md` (главное описание проекта) есть прямая ссылка с кнопкой "Open in Colab".

Шаг 2: Откройте и запустите первую ячейку (Установка)

Когда вы откроете файл в Google Colab, вы увидите страницу с кодом, разделенным на ячейки.


- Найдите первую ячейку. Она отвечает за установку самого Fooocus и скачивание базовых моделей.

- Нажмите на значок "Play" (треугольник в круге) слева от ячейки, чтобы запустить ее выполнение.

- Будьте терпеливы. Этот процесс может занять от 5 до 15 минут, так как скачиваются несколько гигабайт данных. Вы увидите логи выполнения под ячейкой. Просто дождитесь, пока слева от ячейки не появится зеленая галочка.

Шаг 3: Запустите вторую ячейку (Запуск интерфейса)

- После успешного завершения первой ячейки переходите ко второй. Она отвечает за запуск веб-интерфейса Gradio.

- Так же, как и в первом шаге, нажмите на значок "Play", чтобы запустить ее.

- Этот процесс обычно занимает меньше минуты.

Шаг 4: Получите ссылку и перейдите в интерфейс

После выполнения второй ячейки в логах вывода появится несколько строк. Самая важная из них — публичная ссылка.


- Ищите в выводе ссылку, которая выглядит примерно так:

Running on public URL: https://xxxxxxxxxx.gradio.live

- Нажмите на эту ссылку. Она откроется в новой вкладке браузера.


**Ша-да!** Перед вами полноценный интерфейс Fooocus, запущенный на серверах Google.

Что делать дальше?

Конечно! Вот подробная пошаговая инструкция, как бесплатно запустить нейросеть для генерации изображений Fooocus с помощью Google Colab.


Это позволит вам использовать мощности Google (GPU) для создания картинок, даже если у вас слабый компьютер.

- **Введите ваш запрос (промпт):** В текстовом поле внизу напишите, что вы хотите сгенерировать (например, *a photo of a red cat in a space suit, cinematic lighting* — "фото рыжего кота в скафандре, кинематографичное освещение").

- **Нажмите "Generate":** Кнопка справа от поля ввода.

- **Наслаждайтесь результатом:** Через некоторое время (обычно 20-60 секунд) ваши изображения появятся вверху.

Важные моменты и советы:

Что вам понадобится:

- Аккаунт Google (почта Gmail).

- Браузер (Chrome, Firefox и т.д.).

- Примерно 15-20 минут на первый запуск (в основном на скачивание моделей).

Шаг 1: Открываем Google Colab и создаем новый проект

- Перейдите на сайт Google Colab: [https://colab.research.google.com/](https://colab.research.google.com/)

- В появившемся окне нажмите "Создать блокнот" (или File -> New notebook).

Шаг 2: Подключаем бесплатный GPU

Это самый важный шаг. Без GPU (графического процессора) нейросеть не будет работать.


- В верхнем м��ню выберите "Среда выполнения" (Runtime).

- В выпадающем меню нажмите "Сменить среду выполнения" (Change runtime type).

- В появившемся окне в поле "Аппаратный ускоритель" (Hardware accelerator) выберите **T4 GPU**.

- Нажмите "Сохранить".

Шаг 3: Установка Fooocus

- **Проверьте тип среды выполнения:** Убедитесь, что Colab использует GPU. Для этого в меню выберите Runtime -> Change runtime type и в выпадающем списке Hardware accelerator выберите T4 GPU. Обычно это стоит по умолчанию.

- **Сессии Colab не вечны:** Бесплатная сессия длится несколько часов и может прерваться, если вы долго неактивны. Если сессия прервалась, вам нужно будет запустить ячейки заново.

- **Сохраняйте изображения:** Не забывайте скачивать понравившиеся вам генерации на свой компьютер, так как после окончания сессии все данные будут удалены.

- **Продвинутые настройки:** Поставьте галочку Advanced, чтобы получить доступ к тонким настройкам: выбор стиля, соотношение сторон, количество шагов, выбор моделей и многое другое.


Теперь мы дадим Colab команды для скачивания и установки. Просто копируйте код в ячейки и запускайте их по очереди, нажимая на значок "Play" (▶️) слева от ячейки.


- Клонируем репозиторий Fooocus с GitHub. Скопируйте этот код в первую ячейку и запустите её. Эта команда скачает последнюю версию Fooocus в наше рабочее пространство.
!git clone https://github.com/lllyasviel/Fooocus.git
- Переходим в папку с Fooocus и устанавливаем зависимости. Создайте новую ячейку (+ Код), вставьте туда следующий код и запустите. Эта команда установит все необходимые библиотеки, которые нужны для работы нейросети. Установка может занять 3-5 минут.
%cd Fooocus
!pip install -r requirements_versions.txt

Шаг 4: Запуск Fooocus и получение ссылки

Это финальный шаг. Эта команда запустит саму программу и, что самое главное, сгенерирует публичную ссылку для доступа к веб-интерфейсу.


- Создайте последнюю ячейку, скопируйте в нее код ниже и запустите.
!python launch.py --share
- Будьте терпеливы! Первый запуск — самый долгий. В логах вы увидите, как программа скачивает основные модели (SDXL base, refiner и другие). Это может занять 10-15 минут.

- Когда все будет готово, в самом конце вывода появится строка, похожая на эту:
Running on public URL: https://xxxxxxxxxxxxxx.gradio.live
- Нажмите на эту ссылку. Она откроется в новой вкладке, и вы увидите веб-интерфейс Fooocus, готовый к работе!

Шаг 5: Генерация изображений

Теперь вы можете творить!


- В поле Prompt введите на английском языке то, что хотите сгенерировать (например, *a cute cat in a space suit, cinematic photo*).

- Нажмите кнопку Generate.

- Через некоторое время (обычно 30-60 секунд) ваше изображение появится в правой части экрана.


Чтобы сохранить картинку, просто кликните на нее правой кнопкой мыши и выберите "Сохранить изображение как...".

⚠️ **Важные моменты:**


- **Не закрывайте вкладку Colab!** Пока вы работаете с Fooocus в соседней вкладке, вкладка с кодом Colab должна оставаться открытой. Если вы ее закроете, сессия прервется.

- **Сессия не вечна.** Google Colab в бесплатной версии может отключить вас через некоторое время, особенно если вы неактивны. Просто вернитесь к шагу 4 и запустите ячейку с `launch.py` еще раз.

- **Сохраняйте свои лучшие работы сразу.** Файлы, сгенерированные в сессии Colab, не сохраняются навсегда. Если сессия прервется, они пропадут.

- Параметр `--share` в последней команде — ключевой. Именно он создает публичную ссылку для доступа.

Наслаждайтесь творчеством

Вот общие шаги для самых популярных вариантов:


- **Для Automatic1111 (A1111):**


	<li>Обычно это делается через установку специального расширения (extension) или скрипта.

	- Вам также потребуется скачать соответствующие модели LoRA для Hyper-SD (например, `Hyper-SD15-1step-lora.safetensors`).

	- После установки расширения и размещения LoRA в нужную папку, вы сможете выбрать Hyper-SD в настройках генерации или через меню скриптов.
Понял. Анализирую предоставленные опции, как будто это флажки в настройках программы для обработки изображений или видео.


Вот что каждая из этих "галочек" обычно означает:


- **Для ComfyUI:**


	<li>Вам нужно будет установить кастомные ноды (custom nodes) для поддержки Hyper-SD через ComfyUI Manager.

	- Скачать необходимые модели LoRA или UNet.

	- Изменить ваш воркфлоу (workflow), добавив ноды для загрузки и применения Hyper-SD к вашей основной модели.
- **[x] Enhancer (Улучшитель/Энхансер)**
	<li>**Цель:** Автоматическое комплексное улучшение качества.

	- **Что делает:** Это, как правило, "умный" фильтр, который анализирует изображение или видео и применяет сразу несколько корректировок: повышает резкость, регулирует яркость и контраст, увеличивает насыщенность цветов и может убирать цифровой шум. Это опция "сделать хорошо одной кнопкой" для быстрого результата.
- **[x] Advanced (Расширенные/Продвинутые настройки)**
	<li>**Цель:** Предоставить пользователю тонкий ручной контроль.

	- **Что делает:** Активация этой опции открывает доступ к детальным параметрам, которые обычно скрыты. Вместо общей "резкости" вы получаете слайдеры для радиуса, детализации и маскирования. Вместо авто-цвета — доступ к кривым и цветовым каналам. Это режим для профессионалов и тех, кто хочет добиться конкретного, а не стандартного результата.
- **[x] Upscale (Масштабирование/Апскейл)**
	<li>**Цель:** Увеличение физического разрешения изображения или видео.
✦ **Что делает:** Это не простое "растягивание" картинки. Современные алгоритмы апскейла (часто с использованием ИИ) анализируют контент и интеллектуально дорисовывают недостающие пиксели, пытаясь воссоздать детали. Эта функция нужна, чтобы из маленького изображения (например, 640x480) получить большое (например, 1920x1080), не превратив его в "мыло".


**Итог:** Эти три опции часто работают вместе:


- Вы можете сначала применить Enhancer, чтобы быстро улучшить исходник.

- Затем включить Advanced, чтобы вручную довести до ума отдельные детали.

- И в конце использовать Upscale, чтобы увеличить итоговое изображение до нужного размера.


✦ Понял, спасибо за пример. Это очень характерный и показательный промпт для нейросетей типа Stable Diffusion (на которой основан Fooocus).

Разбор промпта

Давайте разберу его структуру и логику, как если бы я был системой, которая его обрабатывает.


Этот промпт можно условно разделить на несколько частей:

1. Блок качества и детализации (Quality Block):

`(masterpiece, best quality, high quality, absurdres), hyperdetailed, detailed skin, sharp focus, ...`


- **Цель:** Это прямая инструкция ��ля нейросети использовать свои "лучшие" веса и модели для генерации. Слова masterpiece, best quality, hyperdetailed натренированы на самых красивых и детализированных изображениях из датасета. Это самый базовый и важный блок для получения хорошего результата.

2. Основной объект и сцена (Subject & Scene):

`beautiful female, close up, (Russian beautiful girl), (in the dark forest), (behind the trees), (looking at viewer)`


- **Цель:** Здесь мы описываем, что и где должно быть на изображении. Это ядро нашего запроса. close up задает композицию, dark forest — окружение.

3. Атмосфера и настроение (Mood & Atmosphere):

`(dark shot), (dark lighting), (night), (moonlight), (fog), (horror), (evil), (smile)`


- **Цель:** Этот блок задает эмоциональную окраску. Слова horror, evil, dark lighting напрямую влияют на стиль, освещение и даже на выражение лица модели.

4. Детали внешности и одежды (Appearance Details):

`(beautiful detailed eyes), (long dark hair), (lips), (perfect hands), (long nails), (sharp nails), (red dress)`


- **Цель:** Уточнение конкретных деталей. Нейросеть постарается учесть каждый из этих тегов. perfect hands — очень полезный тег, так как генерация рук является известной проблемой.

5. Стиль и техника (Style & Technique):

`(photorealistic), (realistic), (hyperrealism), cinematic`


- **Цель:** Указание на конечный стиль. photorealistic — один из самых сильных тегов, который заставляет модель имитировать фотографию, а не рисунок.

6. “Магия” фототехники (Camera Magic):

`(canon eos 5d mark iv), (50mm f/1.8), (ISO 100), (1/250s), (natural light), (soft light), (golden hour), (backlight), (rim light), (volumetric light), (bokeh), (depth of field), (lens flare) ...`


- **Цель:** Это очень хитрый и эффективный прием. Модель обучалась на миллионах фотографий с метаданными (EXIF). Указывая конкретную камеру, объектив и настройки, мы не заставляем ее симулировать оптическую схему Canon. Вместо этого мы говорим: "Покажи мне изображение, которое выглядит так, как будто его сняли на эту профессиональную технику с т��кими настройками". Это мощный способ получить кинематографичное, "дорогое" изображение с красивым светом и боке.

7. “Мусорный” блок (The Keyword Dump) - самая интересная часть

`... (star wars), (harry potter), (lord of the rings), (game of thrones), (breaking bad), ... (naruto), (one piece), (berserk), ... (goodnight punpun) ...`


- **Что здесь происходит?** Пользователь добавил гигантский список из сотен ключевых слов, включающих названия фильмов, аниме, игр, комиксов и т.д.

- **Зачем?** Вероятно, из-за заблуждения, что "чем больше хороших ключевых слов, тем лучше результат". Иногда это делается, чтобы "насытить" промпт культурными кодами, ассоциирующ��мися с качественным контентом.

- **Какой реальный эффект?** Чаще всего негативный или нулевой.


	<li>**Размытие фокуса:** Нейросеть пытается найти что-то общее между horror, photorealistic, disney, berserk и breaking bad. Результат — усредненный и менее предсказуемый. Стиль Berserk (мрачное фэнтези) прямо противоречит стилю Disney.

	- **Случайное влияние:** Модель может случайно "зацепиться" за один из сотен этих тегов и добавить в генерацию что-то совершенно неуместное. Например, элементы брони из Lord of the Rings или цветовую палитру из Breaking Bad.

	- **Потеря контроля:** Этот блок делает результат менее управляемым.

Как бы я улучшил этот промпт?

Я бы полностью удалил "мусорный" блок и оставил только релевантные теги.

Более чистая и эффективная версия:

**Positive prompt:**
(masterpiece, best quality, photorealistic, hyperrealism, absurdres, horror),
close up photo of a beautiful but evil Russian girl with a sinister smile, (long dark hair), (sharp red nails), wearing a (red dress).
She is in a dark, foggy forest at night, (looking at viewer).
Cinematic shot, (dark and moody lighting), (moonlight), (rim light).
Shot on a (canon eos 5d mark iv) with a (50mm f/1.8 lens), creating beautiful (bokeh) and (depth of field).
**Negative prompt** (не менее важная часть, которую Fooocus тоже поддерживает):
(deformed, bad anatomy, disfigured, poorly drawn face), (mutation, mutated, extra limb, ugly), blurry, grainy, watermark, signature, text
Такой подход дает нейросети четкое, непротиворечивое задание, что значительно повышает шансы на получение именно того результата, который был задуман.