Related articles
Этап 1. Локальный прототип
Первая работающая программа для вставки паузы между двумя фразами на компьютере
Этап 2. Работа программы онлайн
Договоренность перенести инструмент на сайт: интерфейс, загрузка файлов, обработка на сервере
Как реализовать
Как будет реализовано технически
Инструкция: как разрезать аудиофайл на фразы и вставить паузы
Готовый работающий код лежит в папке C:\audio_proj или любой другой на диске C:.
Программа сама распознаёт русскую и английскую речь, режет по тишине, вставляет паузу, фильтрует короткий мусор (вроде «2 мая»).
1. Подготовка

Что делаем

Что происходит

Создаём папку для проекта

Например, C:\audio_proj (имя только латиницей, без пробелов и кириллицы)

Кладём в неё исходный аудиофайл

Файл должен называться input_long.mp3

Кладём в ту же папку файл программы

Скрипт final_clean.py (или любой другой с нужными настройками)

2. Открываем командную строку (PowerShell)

Что делаем

Что происходит

Открываем папку в проводнике

C:\audio_proj

Нажимаем правой кнопкой мыши внутри папки

Появляется контекстное меню

Выбираем «Открыть в терминале» (Windows 11) или «Открыть окно PowerShell здесь» (Windows 10)

Открывается синее окно с путём PS C:\audio_proj>

3. Запускаем программу

Что делаем

Что происходит

Вводим в командной строке: python final_clean.py

Программа начинает работать

Нажимаем Enter

Запускается обработка

4. Что делает программа (автоматически, без вашего участия)

Этап

Что программа делает

Загрузка

Загружает input_long.mp3 и модель распознавания речи (Whisper)

Разделение

Режет файл на фразы по моментам тишины

Фильтрация

Убирает короткие фрагменты, цифры, даты («2 мая») и пустые фразы

Распознавание

Определяет язык (русский / английский) и превращает речь в текст

Склейка

Склеивает все фразы в исходном порядке с паузами между ними

Сохранение

Сохраняет результат как final_clean_output.mp3

5. Результат

Что получаем

Где лежит

Готовый аудиофайл

C:\audio_proj\final_clean_output.mp3

Длительность

Как в исходной записи (со вставленными паузами)

Все фразы

Русские и английские, без потерь

Пауза между фразами

3 секунды (можно изменить в коде)

6. Как изменить длину паузы

Что делаем

Что происходит

Открываем final_clean.py в Блокноте

Видим код

Находим строчку PAUSE_SEC = 3

Это длина паузы в секундах

Меняем 3 на любое другое число (например, 2 или 1.5)

Пауза станет короче или длиннее

Сохраняем файл и запускаем программу заново

Новый файл будет с новой паузой

7. Если хотите изменить порядок фраз
В текущей версии программа склеивает фразы в исходном порядке, как они звучали в файле.
Если нужен другой порядок (например, сначала все русские, потом все английские), нужно заменить скрипт на другую версию (например, final_audio.py), где порядок задаётся вручную.
8. Возможные проблемы и их решение

Проблема

Решение

Файл не открывается / нет звука

Перекодировать исходник через ffmpeg (см. отдельную инструкцию)

Программа не запускается

Проверить, что Python установлен (python --version)

Путь содержит пробелы или кириллицу

Перенести папку в C:\audio_proj

«2 мая» не отфильтровалось

Усилить фильтр (добавить в код условие для дат)

9. Файлы в папке после работы

Имя

Что это

input_long.mp3

Исходный файл (не удалять)

final_clean.py

Программа

final_clean_output.mp3

Готовый результат — его слушаем

final_output.mp3 / final_working.mp3

Промежуточные версии (можно удалить)

Подпись
Документация к инструменту «Честная склейка фраз»
Работает на Windows + Python + Whisper + FFmpeg
Фильтрует мусор, сохраняет все фразы, вставляет паузы.
ссылка на Git Hub
Made on
Tilda