音声ファイルの発話区間を検出し、CSVパターンとのマッチング分析・テンプレート管理を行います
streamlit_app.py
streamlit run streamlit_app.py
ブラウザ内で Whisper モデルを実行します。初回はモデルのダウンロードが発生します(以降はキャッシュ)。 tiny: 約75MB・高速・精度低め / small: 約168MB・推奨(量子化済み) / medium: 約1.5GB・高精度
Step 6のデータベースに蓄積したセリフ内容とCSVパターンの対応を元に、テキスト入力からCSVを生成します。
複数回の分析結果を蓄積し、セリフ内容とCSVパターンの対応を学習させます。テキストからのCSV生成精度が向上します。