# meeting-report — генерация отчётов по аудиозаписям встреч ## Функционал - Транскрипция WAV аудио через faster-whisper - Генерация аналитического отчёта в Markdown - Экспорт в PDF (через pandoc или weasyprint) ## Установка зависимостей (Docker/Debian-based) apt-get update && apt-get install -y ffmpeg pandoc texlive-xetex texlive-lang-cyrillic fonts-noto pip install faster-whisper weasyprint ## Быстрый старт ### Шаг 0. Подготовка аудио Положите WAV файл(ы) в папку встречи: /app/hermes_data/meetings/YYYY-MM-DD/ ### Шаг 1. Установка переменных окружения (КРИТИЧНО!) Перед запуском транскрипции НУЖНО установить: export MKL_SERVICE_FORCE_INTEL=1 export OMP_NUM_THREADS=2 Без этого скрипт упадёт на втором чанке с ошибкой: Intel oneMKL FATAL ERROR: Cannot load libctranslate2.so ### Шаг 2. Запуск транскрипции bash /app/hermes_data/skills/meeting-report/scripts/generate_report.sh /app/hermes_data/meetings/2026-03-18 Для длительных файлов (>30 мин) используется автоматическое разбиение на чанки. ### Шаг 3. Создание аналитического отчёта После получения transcription/merged_plain.txt: 1. Прочитайте транскрипцию 2. Создайте report.md со структурой: - Краткая выжимка (1-2 абзаца) - Ход совещания (подробно) - Ключевые решения (список) - Задачи и ответственные - Итоги и следующие шаги ### Шаг 4. Генерация PDF Вариант A: Через pandoc (требует texlive) pandoc report.md -o report.pdf --pdf-engine=xelatex -V mainfont="Noto Sans CJK SC" Вариант B: Через weasyprint (проще) pip install weasyprint python3 generate_pdf.py report.md report.pdf ## Результаты - transcription/merged_plain.txt — полная транскрипция - report.md — аналитический отчёт Markdown - report.pdf — финальный PDF документ ## Типичные ошибки Ошибка: Intel oneMKL FATAL ERROR Решение: Установите MKL_SERVICE_FORCE_INTEL=1 OMP_NUM_THREADS=2 Ошибка: pandoc command not found Решение: apt-get install pandoc texlive-xetex texlive-lang-cyrillic Ошибка: weasyprint command not found Решение: pip install weasyprint Ошибка: Нет кириллицы в PDF Решение: Используйте fonts-noto или weasyprint ## Время обработки - Модель small: 5-10 мин на 10 мин аудио - 1 час аудио = 30-60 минут обработки - Длительные процессы запускайте в фоне: nohup script.sh &