会議やユーザーヒアリングの録画の内容を文字起こしするためのツールです。
このツールは mp3 の音声ファイルか、mp4 の動画ファイルをサポートしています。ただし、 内部で使用している Whisper が音声ファイルの上限サイズを 24MB までとしているため、音声ファイルは 24MB 以下になるようにしてください。動画ファイルの場合は変換後のサイズが 24MB を超えていた場合は変換できないので短くする等の工夫をしてください。
初めて使用する場合は npm パッケージをインストールしてください。
npm install
npm パッケージがインストールされていたら以下のコマンドを参考に文字起こしを行ってください。OPENAI_API_KEYや出力先などはご自身で変えてください。
OPENAI_API_KEY=xxxxxxxxxxxxx node index.js -f 音声.mp3 > ~/Desktop/文字起こし.txt
OPENAI_API_KEY=xxxxxxxxxxxxx node index.js -f 音声.mp4 > ~/Desktop/文字起こし.txt