Blank page

Первая работающая программа для вставки паузы между двумя фразами на компьютере

Договоренность перенести инструмент на сайт: интерфейс, загрузка файлов, обработка на сервере

Как будет реализовано технически

Инструкция: как разрезать аудиофайл на фразы и вставить паузы
Готовый работающий код лежит в папке C:\audio_proj или любой другой на диске C:.
Программа сама распознаёт русскую и английскую речь, режет по тишине, вставляет паузу, фильтрует короткий мусор (вроде «2 мая»).
1. Подготовка

Что делаем	Что происходит
Создаём папку для проекта	Например, C:\audio_proj (имя только латиницей, без пробелов и кириллицы)
Кладём в неё исходный аудиофайл	Файл должен называться input_long.mp3
Кладём в ту же папку файл программы	Скрипт final_clean.py (или любой другой с нужными настройками)

2. Открываем командную строку (PowerShell)

Что делаем	Что происходит
Открываем папку в проводнике	C:\audio_proj
Нажимаем правой кнопкой мыши внутри папки	Появляется контекстное меню
Выбираем «Открыть в терминале» (Windows 11) или «Открыть окно PowerShell здесь» (Windows 10)	Открывается синее окно с путём PS C:\audio_proj>

3. Запускаем программу

Что делаем	Что происходит
Вводим в командной строке: python final_clean.py	Программа начинает работать
Нажимаем Enter	Запускается обработка

4. Что делает программа (автоматически, без вашего участия)

Этап	Что программа делает
Загрузка	Загружает input_long.mp3 и модель распознавания речи (Whisper)
Разделение	Режет файл на фразы по моментам тишины
Фильтрация	Убирает короткие фрагменты, цифры, даты («2 мая») и пустые фразы
Распознавание	Определяет язык (русский / английский) и превращает речь в текст
Склейка	Склеивает все фразы в исходном порядке с паузами между ними
Сохранение	Сохраняет результат как final_clean_output.mp3

5. Результат

Что получаем	Где лежит
Готовый аудиофайл	C:\audio_proj\final_clean_output.mp3
Длительность	Как в исходной записи (со вставленными паузами)
Все фразы	Русские и английские, без потерь
Пауза между фразами	3 секунды (можно изменить в коде)

6. Как изменить длину паузы

Что делаем	Что происходит
Открываем final_clean.py в Блокноте	Видим код
Находим строчку PAUSE_SEC = 3	Это длина паузы в секундах
Меняем 3 на любое другое число (например, 2 или 1.5)	Пауза станет короче или длиннее
Сохраняем файл и запускаем программу заново	Новый файл будет с новой паузой

7. Если хотите изменить порядок фраз
В текущей версии программа склеивает фразы в исходном порядке, как они звучали в файле.
Если нужен другой порядок (например, сначала все русские, потом все английские), нужно заменить скрипт на другую версию (например, final_audio.py), где порядок задаётся вручную.
8. Возможные проблемы и их решение

Проблема	Решение
Файл не открывается / нет звука	Перекодировать исходник через ffmpeg (см. отдельную инструкцию)
Программа не запускается	Проверить, что Python установлен (python --version)
Путь содержит пробелы или кириллицу	Перенести папку в C:\audio_proj
«2 мая» не отфильтровалось	Усилить фильтр (добавить в код условие для дат)

9. Файлы в папке после работы

Имя	Что это
input_long.mp3	Исходный файл (не удалять)
final_clean.py	Программа
final_clean_output.mp3	Готовый результат — его слушаем
final_output.mp3 / final_working.mp3	Промежуточные версии (можно удалить)

Подпись
Документация к инструменту «Честная склейка фраз»
Работает на Windows + Python + Whisper + FFmpeg
Фильтрует мусор, сохраняет все фразы, вставляет паузы.

ссылка на Git Hub