auto-report-skill/README.md
2026-04-21 18:07:11 +00:00

72 lines
3.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# meeting-report — генерация отчётов по аудиозаписям встреч
## Функционал
- Транскрипция WAV аудио через faster-whisper
- Генерация аналитического отчёта в Markdown
- Экспорт в PDF (через pandoc или weasyprint)
## Установка зависимостей (Docker/Debian-based)
apt-get update && apt-get install -y ffmpeg pandoc texlive-xetex texlive-lang-cyrillic fonts-noto
pip install faster-whisper weasyprint
## Быстрый старт
### Шаг 0. Подготовка аудио
Положите WAV файл(ы) в папку встречи:
/app/hermes_data/meetings/YYYY-MM-DD/
### Шаг 1. Установка переменных окружения (КРИТИЧНО!)
Перед запуском транскрипции НУЖНО установить:
export MKL_SERVICE_FORCE_INTEL=1
export OMP_NUM_THREADS=2
Без этого скрипт упадёт на втором чанке с ошибкой:
Intel oneMKL FATAL ERROR: Cannot load libctranslate2.so
### Шаг 2. Запуск транскрипции
bash /app/hermes_data/skills/meeting-report/scripts/generate_report.sh /app/hermes_data/meetings/2026-03-18
Для длительных файлов (>30 мин) используется автоматическое разбиение на чанки.
### Шаг 3. Создание аналитического отчёта
После получения transcription/merged_plain.txt:
1. Прочитайте транскрипцию
2. Создайте report.md со структурой:
- Краткая выжимка (1-2 абзаца)
- Ход совещания (подробно)
- Ключевые решения (список)
- Задачи и ответственные
- Итоги и следующие шаги
### Шаг 4. Генерация PDF
Вариант A: Через pandoc (требует texlive)
pandoc report.md -o report.pdf --pdf-engine=xelatex -V mainfont="Noto Sans CJK SC"
Вариант B: Через weasyprint (проще)
pip install weasyprint
python3 generate_pdf.py report.md report.pdf
## Результаты
- transcription/merged_plain.txt — полная транскрипция
- report.md — аналитический отчёт Markdown
- report.pdf — финальный PDF документ
## Типичные ошибки
Ошибка: Intel oneMKL FATAL ERROR
Решение: Установите MKL_SERVICE_FORCE_INTEL=1 OMP_NUM_THREADS=2
Ошибка: pandoc command not found
Решение: apt-get install pandoc texlive-xetex texlive-lang-cyrillic
Ошибка: weasyprint command not found
Решение: pip install weasyprint
Ошибка: Нет кириллицы в PDF
Решение: Используйте fonts-noto или weasyprint
## Время обработки
- Модель small: 5-10 мин на 10 мин аудио
- 1 час аудио = 30-60 минут обработки
- Длительные процессы запускайте в фоне: nohup script.sh &