Як зробити субтитри автоматично через ШІ 2026

Як зробити субтитри автоматично за 15 хвилин через ШІ. Пошаговий туторіал з Whisper та CapCut для контент-крейторів.




Як зробити субтитри автоматично через ШІ: покроковий туторіал

Ручне написання субтитрів до 10-хвилинного відео може забрати 2–3 години вашого часу — це рутина, яку давно можна автоматизувати. ШІ-інструменти у 2026 році розпізнають мову з точністю до 95% і генерують субтитри за лічені хвилини. У цьому туторіалі ви навчитесь робити субтитри для будь-якого відео через сервіс Whisper від OpenAI та додавати їх через CapCut — весь процес займе не більше 15 хвилин. Для старту потрібен лише комп’ютер, відеофайл і доступ до інтернету.

🛠️ Що знадобиться

  • Whisper (через сайт Groq або Whisper.ai) — безкоштовний ШІ від OpenAI для автоматичного розпізнавання мови та генерації субтитрів у форматі SRT. Groq надає безкоштовний API із швидким розпізнаванням.
  • CapCut Desktop — безкоштовний відеоредактор для імпорту SRT-файлу та вбудовування субтитрів у відео. Є версія для Windows і macOS.
  • Субтитри.ua або Subtitle Edit — безкоштовна програма для редагування SRT-файлів, якщо ШІ десь помилився у тексті чи тайминзі.
  • Відеофайл — MP4, MOV або AVI до 500 МБ. Якщо файл більший — спочатку стисніть через HandBrake (безкоштовно).

📋 Покрокова інструкція

Крок 1: Підготуйте відео та зайдіть на Groq

Відкрийте браузер і перейдіть на сайт console.groq.com. Натисніть кнопку «Sign Up» у правому верхньому куті та зареєструйтесь через Google-акаунт — це займе 30 секунд. Після входу в кабінет знайдіть у лівому меню пункт «Audio» і натисніть на нього. Ви побачите інтерфейс для завантаження аудіо або відеофайлів — саме тут Whisper буде розпізнавати вашу мову. Groq дає безкоштовно 7 000 хвилин аудіо на місяць, чого вистачить для більшості проєктів.

Крок 2: Завантажте відео та налаштуйте розпізнавання

На сторінці Audio натисніть кнопку «Upload File» і виберіть ваш відеофайл з комп’ютера. У полі «Model» оберіть «whisper-large-v3» — це найточніша версія, яка добре розуміє українську, російську та суміш мов. У полі «Language» вручну введіть «uk» для української або залиште порожнім, якщо хочете, щоб ШІ визначив мову сам. У полі «Response Format» обов’язково оберіть «srt» — це формат файлу субтитрів, який підтримують усі відеоредактори. Натисніть зелену кнопку «Submit».

Крок 3: Збережіть SRT-файл на комп’ютер

Через 30–120 секунд (залежно від довжини відео) у правій частині екрана з’явиться текст субтитрів у форматі SRT — з номерами, таймкодами та реченнями. Виділіть весь цей текст комбінацією Ctrl+A, скопіюйте через Ctrl+C. Відкрийте на комп’ютері будь-який текстовий редактор — наприклад, Notepad++ або навіть стандартний Блокнот. Вставте текст через Ctrl+V і збережіть файл: натисніть «Файл» → «Зберегти як», введіть назву subtitles.srt і в полі «Тип файлу» оберіть «Усі файли», кодування виставте UTF-8. Натисніть «Зберегти».

Крок 4: Перевірте та відредагуйте субтитри

Навіть найкращий ШІ іноді помиляється у власних назвах, термінах або специфічних словах. Відкрийте програму Subtitle Edit (завантажте з nikse.dk/subtitleedit безкоштовно), натисніть «File» → «Open» і відкрийте ваш subtitles.srt. Ви побачите таблицю з усіма репліками та їх таймингами. Прочитайте текст по діагоналі: якщо бачите помилку — клікніть на рядок і відредагуйте прямо у нижньому текстовому полі. Якщо субтитри «з’їхали» за часом — виділіть усі рядки через Ctrl+A, натисніть «Synchronization» → «Adjust All Times» і зсуньте на потрібну кількість мілісекунд. Збережіть через Ctrl+S.

Крок 5: Додайте субтитри у відео через CapCut

Відкрийте CapCut Desktop, натисніть «Новий проєкт» і перетягніть ваш відеофайл на таймлайн. У верхньому меню знайдіть вкладку «Субтитри» (іконка з літерою «A» і рядками). Натисніть «Імпортувати субтитри»«Локальний файл» і виберіть ваш subtitles.srt. CapCut автоматично накладе всі репліки на таймлайн відповідно до таймкодів. Тепер оформіть субтитри: виділіть усі рядки через Ctrl+A на таймлайні субтитрів, у правій панелі оберіть шрифт (рекомендую Arial Bold), розмір 6–7, колір білий, додайте чорну обводку товщиною 2px. Для експорту натисніть «Експорт» у правому верхньому куті → оберіть роздільну здатність 1080p → формат MP4 → натисніть «Експортувати». Готово — відео з вбудованими субтитрами збережеться на вашому робочому столі.

⚠️ Типові помилки та як їх уникнути

  • Збереження SRT у неправильному кодуванні — якщо субтитри відображаються кракозябрами, значить файл збережено не в UTF-8. У Блокноті при збереженні завжди вибирайте кодування «UTF-8» (не «UTF-8 з BOM»).
  • Відеофайл занадто великий для завантаження — Groq обмежує файли до 25 МБ для прямого завантаження. Якщо відео більше — спочатку витягніть аудіодоріжку через VLC: «Медіа» → «Конвертувати/Зберегти» → оберіть профіль «Audio – MP3» і збережіть. Аудіофайл буде в 10 разів менший.
  • Субтитри не збігаються з відео за часом — це трапляється, якщо відео має відрізану початкову частину. У Subtitle Edit скористайтесь функцією «Synchronization → Visual Sync» і вручну вкажіть дві опорні точки синхронізації.
  • ШІ переплутав слова через фоновий шум — перед завантаженням покращте аудіо через безкоштовний сервіс Adobe Podcast Enhance (podcast.adobe.com): просто завантажте аудіо, і ШІ прибере шум. Після цього точність розпізнавання зросте на 10–15%.

💡 Поради для кращого результату

Розбивайте довгі репліки вручну. Whisper іноді об’єднує два речення в один рядок субтитрів — це важко читати. У Subtitle Edit знайдіть рядки довші за 42 символи, клікніть на них правою кнопкою миші й оберіть «Split» — розбийте на два коротші рядки. Стандарт для зручного читання: не більше 2 рядків по 42 символи.

Використовуйте функцію перекладу в Groq. Якщо вам потрібні субтитри англійською для іноземної аудиторії — у полі «Task» оберіть «translate» замість «transcribe». Whisper автоматично перекладе мову відео на англійську прямо під час розпізнавання.

Для YouTube достатньо SRT без вбудовування. Якщо ваше відео йде на YouTube — не треба «запікати» субтитри у відео. Просто завантажте відео, зайдіть у YouTube Studio → «Субтитри» → «Додати» → завантажте SRT-файл. YouTube сам усе накладе, і глядачі зможуть вмикати/вимикати субтитри.

Перевіряйте першу та останню хвилину. Найбільше помилок розпізнавання зазвичай на початку відео (вступний шум, музика) та наприкінці. Приділіть цим фрагментам окрему увагу при редагуванні.

❓ Часті запитання (FAQ)

1. Чи підтримує Whisper українську мову?
Так, модель whisper-large-v3 офіційно підтримує українську мову. Точність розпізнавання чіткого мовлення — близько 90–95%. Діалекти, суржик або сильний акцент можуть знижувати точність до 80%.

2. Чи є безкоштовна альтернатива Groq?
Так. Можна скористатись сервісом Whisper.ai, Clop.ai або встановити Whisper локально через Python — для цього потрібен комп’ютер із 8 ГБ RAM. Також існує сервіс veed.io із безкоштовним планом до 10 хвилин відео на місяць.

3. Скільки часу займає розпізнавання?
На Groq 10-хвилинне відео обробляється приблизно за 30–60 секунд завдяки спеціалізованим LPU-чипам. Стандартний OpenAI API працює повільніше — ті ж 10 хвилин розпізнає за 2–3 хвилини.

4. Чи можна зробити субтитри одразу кількома мовами?
Так, але доведеться запустити розпізнавання двічі. Перший раз — з оригінальною мовою, другий — з опцією «translate» для англійської версії. Отримаєте два окремих SRT-файли, які можна завантажити на YouTube як різні доріжки субтитрів.

5. Що робити, якщо у відео говорять дві людини і їх мікшують разом?
Whisper не розрізняє спікерів автоматично, але існує технологія «діаризація». Скористайтесь сервісом Pyannote.audio або AssemblyAI — вони вкажуть, хто і коли говорив, і додадуть мітки «Спікер 1», «Спікер 2» до субтитрів.

🏁 Підсумок

Ви навчились автоматично генерувати субтитри через ШІ Whisper, редагувати SRT-файл і вбудовувати субтитри у відео через CapCut — весь процес займає 10–15 хвилин замість кількох годин ручної роботи. У результаті ви отримуєте готове відео з професійними субтитрами або SRT-файл для завантаження на YouTube.

Почніть просто зараз: зайдіть на console.groq.com, зареєструйтесь і завантажте перше відео — вже за хвилину побачите результат. Спробуйте на короткому відео 2–3 хвилини, щоб відчути процес, а потім масштабуйте на більші проєкти.

🎙️ Спробуй ElevenLabs безкоштовно

Найреалістичніший AI-голос для відео, подкастів і реклами. Понад 1000 голосів, українська мова, клонування голосу.

Спробувати →

🎬 Спробуй HeyGen безкоштовно

Створюй AI-відео з аватаром за лічені хвилини. Без камери, без монтажу — просто текст і готове відео.

Спробувати →


РОЗСИЛКА

📬 Щотижневий AI-дайджест

Найкращі статті про ШІ та автоматизацію — без спаму, лише суть

Без спаму · Відписатись будь-коли

Telegram