Что делаем | Что происходит |
Создаём папку для проекта | Например, C:\audio_proj (имя только латиницей, без пробелов и кириллицы) |
Кладём в неё исходный аудиофайл | Файл должен называться input_long.mp3 |
Кладём в ту же папку файл программы | Скрипт final_clean.py (или любой другой с нужными настройками) |
Что делаем | Что происходит |
Открываем папку в проводнике | C:\audio_proj |
Нажимаем правой кнопкой мыши внутри папки | Появляется контекстное меню |
Выбираем «Открыть в терминале» (Windows 11) или «Открыть окно PowerShell здесь» (Windows 10) | Открывается синее окно с путём PS C:\audio_proj> |
Что делаем | Что происходит |
Вводим в командной строке: python final_clean.py | Программа начинает работать |
Нажимаем Enter | Запускается обработка |
Этап | Что программа делает |
Загрузка | Загружает input_long.mp3 и модель распознавания речи (Whisper) |
Разделение | Режет файл на фразы по моментам тишины |
Фильтрация | Убирает короткие фрагменты, цифры, даты («2 мая») и пустые фразы |
Распознавание | Определяет язык (русский / английский) и превращает речь в текст |
Склейка | Склеивает все фразы в исходном порядке с паузами между ними |
Сохранение | Сохраняет результат как final_clean_output.mp3 |
Что получаем | Где лежит |
Готовый аудиофайл | C:\audio_proj\final_clean_output.mp3 |
Длительность | Как в исходной записи (со вставленными паузами) |
Все фразы | Русские и английские, без потерь |
Пауза между фразами | 3 секунды (можно изменить в коде) |
Что делаем | Что происходит |
Открываем final_clean.py в Блокноте | Видим код |
Находим строчку PAUSE_SEC = 3 | Это длина паузы в секундах |
Меняем 3 на любое другое число (например, 2 или 1.5) | Пауза станет короче или длиннее |
Сохраняем файл и запускаем программу заново | Новый файл будет с новой паузой |
Проблема | Решение |
Файл не открывается / нет звука | Перекодировать исходник через ffmpeg (см. отдельную инструкцию) |
Программа не запускается | Проверить, что Python установлен (python --version) |
Путь содержит пробелы или кириллицу | Перенести папку в C:\audio_proj |
«2 мая» не отфильтровалось | Усилить фильтр (добавить в код условие для дат) |
Имя | Что это |
input_long.mp3 | Исходный файл (не удалять) |
final_clean.py | Программа |
final_clean_output.mp3 | Готовый результат — его слушаем |
final_output.mp3 / final_working.mp3 | Промежуточные версии (можно удалить) |