動画の喋りについて自動で文字起こし〜テロップ化してくれる VREW というアプリケーションがあります。フル字幕動画を作る際は欠かせないものとなったので、これについてざっと書き出してみたいと思います。(Final Cut Pro Xで連携が前提の話になります)
VREWはMac、Windows、どちらでも使えます。文字起こしに通信が発生します。提供元へデータが送信されていると思いますので、大丈夫?という声もあるようですが、僕はあまり気にしないタイプです。今のところ無料で使えますが、いずれ有料になるんじゃないかと思います。興味あれば以下よりどうぞ。
所感
テロップの量を増やそうという話題が出て、もうもはや文字起こしした方がいいレベルなのかと思いVREWの存在を思い出しました。ダメもとでぶっこんでみたところ、意外とありなのかもしれないと思うようになりました。結果、動画にフル字幕をいれることになり、VREWなしでは作業が成立しなくなるに至っています。
文字起こしの精度について
65〜70点ぐらいの印象です。AWSでやるよりはるかに良い印象です。
何よりもタイムコードにのせてくれるのが秀逸ですね。
ちなみにこれは録音状態がかなり良いことが前提になっています。ここで話題にしている動画については少し早口な部分が多いので、喋りの速度を落とせばもう少し向上するような気がしています。
VREWは再生範囲をなんらかのロジックで区切って、1つの範囲ごとに文字起こしを行います。1つ1つの範囲は長さがけっこうバラバラです。極端に短いことはないのですが、極端に長いことは時々起こります。よって、仮に文字起こし精度が100%だったとしても、フル字幕としたい場合、このまま使うことは現実的ではありません。
1つの癖として、拾いきれない言葉は文字起こしからカットされるので、時々文字が少ないケースがあります。
65〜70点の精度ですから、修正は必要になります。
これは編集画面で直接編集することができまし、テキストファイルととして書き出して修正、この修正したテキストファイルをインポートすることで修正反映といったこともできます。このおかげで、第三者による文字チェックがかなりはかどります。
第三者チェックは、読み込んだ動画ファイルとVREWのファイルを渡すことでも可能です。ただしこの場合パソコンの環境がかわるので、VREWファイルと動画ファイルの紐付けが壊れますが、それは検知してダイアログを出してくれますし、たった1つのファイルと紐付けし直すだけなのでとても簡単です。
あとこれは気のせいかもしれませんが……。
いままで3回フル字幕動画作ってるのですが、少しずつ文字起こし精度が上がっている気がします。提供元の改善もあるのかもしれませんが、AIを使ってるらしいので使えば使うほど精度UPするのかも!?
Final Cut Pro X との連携
Final Cut Pro XのXMLファイルをエクスポートしてくれます。
このXMLファイルはテロップデータとしてではなく、プロジェクトファイルとして書き出されるので、このXMLファイルをインポートするのではなく、このXMLをFinal Cut Pro Xで直接開くことになります。開くとライブラリに新しいプロジェクトが追加されています。
というものなので、XMLファイルはライブラリファイルと同じ階層に置く必要があります。
現時点でのワークフロー
参考になるのかわかりませんが、当方のワークフローをざっと書いておきます。
当方、文字チェックを二段階でしているので、普通よりプロセスが多いかもです。
- 動画の音声をFIXして書き出す(FCPX)
- 書き出した動画をVREWで読み込み、自動で文字起こしする
- VREWの編集画面で文字修正をする(15分動画で2時間ぐらい目安)
- 第三者Aに確認出しをする(動画+VREWファイルを渡す)
- 第三者Aの修正を受け取る(VREWファイルのみ受け取る)
- 受け取ったVREWファイルを開く
- VREWでテロップ部分をテキストデータで書き出す
- 第三者Bに確認出しをする(テキストデータを渡す)
- 第三者Bの修正を受け取る(テキストデータ)
- VREWにテキストデータをインポートする
- VREWでテロップ部分をXML(Final Cut Pro X 形式)で書き出す
- XMLファイルを置くべき場所に置く
- XMLファイルをFinal Cut Pro Xで開く
- テロップが入ったプロジェクトを確認〜編集再開
- 字幕タイミングの調整(15分動画で3時間ぐらい)
質問があれば……
お気軽に以下よりどうぞ。