Alternative Architecture DOJO

オルターブースのクラウドネイティブ特化型ブログです。

Video Indexerの文字起こしが秀逸だった

こんにちは。もうすぐクリスマスですね。
クリスマスは、ジムで筋トレ予定のかとぅーんです。

弊社では、動画コンテンツの公開も行ってます。
弊社の動画コンテンツはこちら↓
www.youtube.com
そんな動画編集で必ずといって必要になる文字起こしですが
なかなか大変だー!という声が、社内のどこからか聞こえたので
今回はAzure Media Services Video Indexerを使って、文字起こしをやってみようと思います。

Azure Media Services Video Indexer とは

docs.microsoft.com

Azure Cognitive Servicesの一つとして位置づけられていて
機械学習モデルを活用し、ビデオの分析情報を抽出できる機能。

料金に関しては、インデックス作成にかかった時間 (分) に対して課金が発生する形ですが
一定の無料インデックス作成枠があります。

  • Web サイト経由では、10 時間
  • API経由では、40 時間

azure.microsoft.com

解析

ということで、実際にやっていこうかなと思いますが、ここで何を解析しようか?って
話になるわけです。
今回は、弊社の動画コンテンツの中から、私がエンジニアの方に見てもらいたい動画があるので
それを使って解析してみます。


【オルタナティブなVlog】社長直伝!エンジニアの勉強方法

とくに、登壇のくだりは、とてもおもしろいので是非見ていただきたい。

で、使い方なんですが
サイトにアクセスして、動画をアップロードするだけという超簡単仕様!
現時点で、言語に日本語は入ってませんでしたが、自動検出で判定してくれるようです。

f:id:kattoon:20201220113453p:plain
Video Indexer1

f:id:kattoon:20201220113637p:plain
Video Indexer2

参考までに、インデックス作成時間は、おおよそ動画の再生時間(14分)と同じ程度で解析が終わりました。
解析終了時点で、トリミングされたPeopleなどの情報がアカウントメールアドレスへ届きます。

f:id:kattoon:20201220113836p:plain
Video Indexer Mail

解析結果は、[インサイト][タイムライン]という形でタブ分けされ
[インサイト]では、ラベリングや感情なども抽出できます。

今回は、感情として喜びが1.33%抽出されており、判定箇所は
登壇のくだりの部分でした。

f:id:kattoon:20201220113929p:plain
Video Indexer Result1

[タイムライン]には、目的の文字起こしされた文章がタイムラインベースで表示されます。
ざっと見た感じは、抽出できているなーと感じますガ。

f:id:kattoon:20201220114117p:plain
Video Indexer Result2

獄門

この単語を抽出してきているのは、あっとほーむな弊社を何か意識しているのでしょうか笑
※注)正:"午後問"。"獄門"というような語句は動画内で一切使われておりませんので、安心して動画をご覧ください。
話はそれますが、猫の惑星という曲が好きです。

f:id:kattoon:20201220114452p:plain
AlterboothCEO Mr.Kojima

人物や感情なども抽出できて楽しいですね。
今回は、動画コンテンツのご紹介と、Video Indexerのお話でした。

クリスマスまでお楽しみください!