名古屋市同棲支援センター

ykpyがなにか書きます

in-factoの文字起こしフローをまとめてみる

今年の10月くらいから in-facto の活動を始めている。ホラー制作チームとして、今はとにかくコンテンツの量を増やしている段階だ。


www.youtube.com

動画ごとに、振り返りや自分ら語りを兼ねて、制作の裏側や感想を記事にしている。収録から文字起こし→編集の流れが固まってきて、高速に出力できるようになってきたのでまとめてみる。

in-facto.jp

収録

動画を作り終わった次の週の平日に30分ほどで収録している。

LINE通話をそのままDAWで収録している。これはまあ録れれば何でも良い

DAWからmp3で出力し、iPhoneアプリCLOVA note に読み込ませる。アップロード時の音声の種類は「インタビュー・相談」を選んでいる。

すぐに文字起こしされる。

人もだいたい識別されるので本当に重宝している。有料化しても使うと思います。

音声記録のダウンロード を選択してtxtファイルを落とす。

txtファイルをダウンロードしたら Googleドキュメントにそのまま読み込ませて、文字起こしをしていく。

編集

誤検出があるものの、だいたい声で発言者が識別されているので、「参加者 1」などで検索して、一括置き換えしていく。

発言内容を覚えているうちに置き換えてしまう。

テンポや文量を調整しつつ、不要な発言を削っていく。CLOVA Noteは漢字もだいたい起こしてくれるのですばらしい。

このタイミングで画像なども入れてしまう。画像を貼ってしまうことで、なんとなく流れが把握しやすくなる。できたら、ドキュメント全体をコピー・ペーストして、.mdファイルとして保存する。

https://in-facto.jpNext.js の Next exportで静的なhtmlをビルドして、それを Cloudflare Pages でホストしている。ホスティング自体も無料だし転送量も無制限ですごい。 *1

基本的に記事はMarkdown記法で書いているが、Googleドキュメントからのコピペでもいい感じに反映されるよう、一部独自の拡張をしている。たとえば、行頭の 「トモヒロツジ」「ykpythemind」などは発言者名なので、太文字にしつつ一行にする、などだ。画像も独自の形式で表記できるようにして、キャプションを入れたりしている。 *2

記事がある程度できたら、ブランチを切ってgit pushしておくとCloudflare Pagesがプレビュー環境を立ち上げてくれる。

この環境はemail認証などでアクセス制限をかけられて便利。 同時にin-factoのメンバーにはGoogleドキュメント上で提案モードで編集してもらう。

提案モード

最後にもう一度Googleドキュメントの内容をmarkdownファイルとして保存して、mainブランチに取り込めばCloudflare pagesが自動で https://in-facto.jp に反映してくれる。

といったかんじで、30分の会話をだいたい3時間くらいあればコンテンツ化できるようになっている。めちゃくちゃ便利です。サイト作成は昨今のブログサービスやCMSで事足りるものだが、やはり自前で作って自前で記事を管理するのはDIYのロマンがあり、手に馴染んでいる。


自分はあえてPodcastとして音声をそのまま公開することは避けている。自分らのトーク力の問題もあるのだが、やはり文章化されていたほうが内容把握の時間が少なくて済むからだ。(5分くらいで読めるくらいの文量を意識している)

in-factoの投稿もこんなん、よほど好きな人しか読まねえよなぁと思いつつ、自分たちのスタンスの表明や好きなモノの共有として続けたい。かつてのオタッキーな個人サイトのように、インターネットの中で誰かに刺さって仲間が増えたらいいなと思っているのだ……

*1: このあたりは仕事として相談してもらえればお手伝いします

*2: ちなみにやっていることは愚直に正規表現でマッチさせて、タグを挿入して、といった感じ。ここは Remark でASTをいじるよう書き換えたい……