Stable Diffusion 3.5: як встановити і використовувати у 2026 році - Aitematic

Stable Diffusion 3.5 — одна з найпотужніших відкритих моделей для генерації зображень, яка доступна кожному безкоштовно. Якщо ви хочете створювати фотореалістичні ілюстрації, арт або дизайн-матеріали прямо на своєму комп’ютері — ця стаття саме для вас. Ми розберемо покрокове встановлення, налаштування та практичне використання моделі, щоб ви могли запустити її вже сьогодні.

🔍 Що таке Stable Diffusion 3.5 і чим вона відрізняється

Stable Diffusion 3.5 — це відкрита генеративна AI-модель від компанії Stability AI, випущена у жовтні 2024 року. Вона базується на архітектурі Multimodal Diffusion Transformer (MMDiT) і є суттєвим кроком вперед порівняно з попередніми версіями. Модель доступна у трьох варіантах: SD 3.5 Large (8 мільярдів параметрів), SD 3.5 Large Turbo (прискорена версія для швидкої генерації) та SD 3.5 Medium (2.5 млрд параметрів, підходить для слабших GPU). Головна перевага — можливість запустити модель локально без будь-яких підписок і цензури. SD 3.5 значно краще розуміє складні текстові підказки, зокрема коректно відображає текст на зображеннях, що раніше було слабким місцем. Модель підтримує роздільну здатність до 1 мегапікселя та генерує зображення з точними пропорціями тіла і детальними обличчями. Вагова ліцензія дозволяє комерційне використання для проєктів з доходом до 1 мільйона доларів на рік без додаткових виплат.

⚡ Ключові функції та можливості Stable Diffusion 3.5

SD 3.5 пропонує широкий набір інструментів як для початківців, так і для досвідчених користувачів. Архітектура MMDiT дає змогу обробляти текст і зображення паралельно, що значно підвищує якість відповідності результату промпту. У поєднанні з ComfyUI або Automatic1111 модель перетворюється на повноцінну студію для генерації контенту. Ось основні функції, які варто знати:

Text-to-Image (txt2img) — генерація зображень із текстового опису; підтримує детальні підказки до 300 токенів без втрати якості
Image-to-Image (img2img) — переробка існуючого зображення за новим описом зі збереженням композиції оригіналу
Inpainting — точне редагування окремих ділянок фото: заміна фону, прибирання об’єктів, додавання нових елементів
ControlNet-сумісність — керування позою, глибиною та контурами через допоміжні моделі для точного відтворення потрібної композиції
LoRA-адаптери — підключення дообучених мікромоделей для конкретних стилів: аніме, реалізм, конкретний художник або бренд
Turbo-режим — генерація якісного зображення за 4 кроки замість стандартних 20–50, що скорочує час у 5 разів

📊 Порівняння варіантів Stable Diffusion 3.5

Модель існує у кількох версіях з різними вимогами до заліза і різною швидкістю роботи. Обирайте варіант залежно від відеокарти та завдань: для комерційного продакшену підійде Large, для швидких ескізів — Turbo, для слабких ПК — Medium.

Версія	Вимоги до VRAM	Що включено / особливості
SD 3.5 Large	від 16 ГБ VRAM	8 млрд параметрів, максимальна якість, підходить для фінальних рендерів і комерційних проєктів
SD 3.5 Large Turbo	від 16 ГБ VRAM	Дистильована версія Large, генерація за 4 кроки, швидкість у 4–5 разів вища при схожій якості
SD 3.5 Medium	від 6 ГБ VRAM	2.5 млрд параметрів, оптимізована для RTX 3060/4060, чудовий баланс якості та швидкості
Хмарний API (Stability AI)	не потрібен GPU	Платний доступ через API, $0.065 за зображення, підходить для інтеграції в застосунки

✅ Переваги та недоліки Stable Diffusion 3.5

Переваги:

Повністю безкоштовна для локального запуску — платите лише за електроенергію і залізо, жодних щомісячних підписок
Значно краща передача тексту на зображеннях порівняно з SD 2.x і SDXL — написи, логотипи і вивіски виглядають читабельно
Відкрита ліцензія з можливістю комерційного використання без роялті для малого та середнього бізнесу
Широка екосистема: тисячі готових LoRA-моделей, стилів і пресетів на Civitai та Hugging Face
Повний контроль над даними — жодне зображення не передається на зовнішні сервери

Недоліки:

Висока вимогливість до відеокарти: для версії Large потрібна RTX 3090/4090 або аналог, що робить її недоступною для більшості ноутбуків
Складне початкове налаштування для нетехнічних користувачів: потрібно встановлювати Python, залежності і розбиратися з інтерфейсом ComfyUI або A1111
Генерація рук все ще поступається Midjourney v7 у крайніх позах, хоча якість суттєво покращилась

💡 Як встановити і запустити Stable Diffusion 3.5: покроковий гайд

Найпростіший спосіб запустити SD 3.5 — через ComfyUI, який має зручний графічний інтерфейс і вбудовану підтримку нової архітектури. Ось повна інструкція для Windows:

Крок 1. Встановіть Python і Git
Завантажте Python 3.10 або 3.11 з офіційного сайту python.org (обов’язково позначте “Add to PATH” під час встановлення). Встановіть Git з git-scm.com.

Крок 2. Завантажте ComfyUI
Відкрийте термінал і виконайте команду: git clone https://github.com/comfyanonymous/ComfyUI. Перейдіть до папки: cd ComfyUI. Встановіть залежності: pip install -r requirements.txt.

Крок 3. Завантажте вагові файли моделі
Перейдіть на Hugging Face (huggingface.co/stabilityai/stable-diffusion-3.5-large). Для завантаження потрібна безкоштовна реєстрація і підтвердження ліцензії. Завантажте файл sd3.5_large.safetensors (розмір ~16 ГБ для Large або ~5 ГБ для Medium). Для Turbo-версії завантажте sd3.5_large_turbo.safetensors.

Крок 4. Розмістіть файл у правильній папці
Скопіюйте завантажений .safetensors файл до папки ComfyUI/models/checkpoints/. Також завантажте текстові енкодери (clip_g, clip_l, t5xxl) і покладіть їх у ComfyUI/models/clip/.

Крок 5. Запустіть ComfyUI
Виконайте команду python main.py --gpu-only. Для слабших карток додайте прапор --lowvram. Відкрийте браузер за адресою http://127.0.0.1:8188.

Крок 6. Завантажте робочий воркфлоу
На офіційному GitHub ComfyUI або у репозиторії Stability AI знайдіть файл воркфлоу для SD 3.5. Перетягніть JSON-файл прямо у вікно браузера — граф завантажиться автоматично. Виберіть свій checkpoint у ноді “Load Checkpoint” і натисніть “Queue Prompt”.

Крок 7. Перший тест
Введіть простий промпт: “a photo of a cat sitting on a wooden table, natural light, sharp focus”. Для Turbo-версії встановіть кількість кроків 4, CFG Scale 1.0. Для Large — 20 кроків, CFG Scale 4.5–5.0.

❓ Часті запитання (FAQ)

1. Чи можна запустити SD 3.5 без відеокарти?
Так, можна запустити на CPU, але це надзвичайно повільно — одне зображення генеруватиметься 10–30 хвилин. Для комфортної роботи потрібна мінімум GPU з 6 ГБ VRAM (для версії Medium). Альтернатива — хмарні сервіси на кшталт Google Colab з безкоштовним GPU.

2. Яка різниця між SD 3.5 і Midjourney?
Midjourney — хмарний платний сервіс ($10–$60/місяць) з кращою “естетикою за замовчуванням”, але без локального запуску і з обмеженнями контенту. SD 3.5 — безкоштовна і відкрита, вимагає налаштувань, але дає повну свободу і приватність.

3. Що таке LoRA і як її підключити до SD 3.5?
LoRA — це невеликий файл (.safetensors, 50–200 МБ), який змінює стиль генерації основної моделі. Завантажте LoRA з Civitai.com, покладіть у папку ComfyUI/models/loras/ і підключіть через ноду “Load LoRA” у воркфлоу. Сила впливу регулюється параметром weight від 0 до 1.

4. Чи легально використовувати SD 3.5 для комерційних проєктів?
Так, ліцензія Stability AI Community License дозволяє комерційне використання для організацій з річним доходом до 1 мільйона доларів. Якщо ваш дохід перевищує цю суму — потрібно придбати комерційну ліцензію у Stability AI.

5. Чому зображення виходять розмитими або низької якості?
Найчастіші причини: неправильний CFG Scale (для Large оптимально 4–5, для Turbo — 1), занадто мала кількість кроків, або модель завантажена без VAE-декодера. Переконайтесь, що ви використовуєте рекомендований воркфлоу зі сторінки Stability AI на Hugging Face.

🏁 Висновок

Stable Diffusion 3.5 — це найпотужніша безкоштовна відкрита модель для генерації зображень станом на 2026 рік. Вона поєднує промислову якість результатів із повною свободою налаштувань і відсутністю щомісячних платежів. Для тих, хто готовий витратити годину на початкове налаштування, це інвестиція, яка окупається багаторазово.

SD 3.5 Medium ідеально підходить дизайнерам, ілюстраторам і контент-мейкерам з GPU від 6 ГБ — це практичний щоденний інструмент для генерації банерів, концепт-артів і соціальних медіа. Версія Large орієнтована на студії і фрилансерів, яким потрібна комерційна якість без підписки на Midjourney чи Adobe Firefly. Якщо ви фотограф або ретушер — Inpainting та img2img змінять вашу роботу назавжди.

Починайте з версії Medium і ComfyUI — завантажте модель з Hugging Face просто зараз і зробіть перший тест за наведеною інструкцією. Якщо виникнуть питання, спільноти в Discord (Stable Diffusion офіційний сервер) і Reddit (/r/StableDiffusion) дадуть відповідь протягом години.