Alternative Architecture DOJO

オルターブースのクラウドネイティブ特化型ブログです。

【Microsoft Build 2023】OpenAIやHugging Faceの学習済みモデルをVM上に簡単にデプロイできるようになったらしい

こんにちは、エンジニアの木村龍太郎です!

みなさん、2023/5/23~25に開催されたMicrosoft Build 2023の内容は見ましたか? リアタイでの視聴を逃した方は、公式が一覧でまとめてあるBOOK OF NEWSを読むといいかもしれません👀
(あと、2023/6/27,28に日本でハイブリッドで開催される「Microsoft Build Japan」でも内容が見れますよ!)

そのBOOK OF NEWS読んでいると、どうやらAzure Machine Learningの機能でStableDiffusion, Whisperといった学習済みモデル(=foundation model)を簡単にデプロイ出来るようになったみたいです!
まだプレビューですが、実際に触ってみたので紹介します!

techcommunity.microsoft.com

learn.microsoft.com

試してみる

まずは、Azure portalでAzure Machine Learningのリソースを作ります。

このAzure ML自体は前からあったもので、そのリソース内にあるAzure ML Studioを起動すると、機械学習モデルを構築、トレーニング、テスト、そしてデプロイといった一連のプロセスをWeb上で行えます。(参考)

いままでは、ローカルから学習済みモデルをデプロイしていましたが、今回の発表で Model catalog からAzure上で用意された学習済みモデル(=foundation model)を選択し、デプロイできるようになりました。

というわけで、作成したAzure ML のリソースからAzure ML Studioを開いてみましょう。
そして、左のメニューに[Model catalog]があるので見てみます。 モデルカタログのスクショ

モデルの一覧が表示されてますね!Hugging Face社が公開している一部のモデルも選べました!

Microsoft Build 2023で公開されていた記事の画像では話題のGPT-4やdavinciといったOpenAIのモデルも選べるようになっていて、現在のプレビュー版ではまだないですが楽しみですね~

Microsoft Build 2023で公開されていたModel catalog

今回はopenai-whisper-largeを選んでみます。

whisperのスクショ

右側の[Sample inference]でAIの検証もできるみたいです。(Hugging Face Hubのモデルではできませんでした。)
それでは、モデルをデプロイしてみましょう。上のスクショ内の[▷Deploy]から[Real-time endpoint]を選択します。
すると、VMスペックやインスタンスの数を選ぶ項目が出てきます。 動かすのに結構スペックがいるみたいで、低スペックのVMは選べないようになっていました。
VMは時間経過とともに料金が発生してしまうので、使用しない時間帯にはシャットダウンしましょう。

青い[Deploy]のボタンを押すとデプロイが開始されます。(デプロイ完了まで10分くらいかかりました)
デプロイ後の画面を見てみましょう。 デプロイ後の画面

[Consume]というタブの中身を見てみると、このモデルを使うためのコードやAPIキーが用意されているではありませんか👀
実際にPythonのサンプルコードをコピペして、一部書き換えてからローカルから動作確認してみました。

今回デプロイしているOpenAIの音声認識モデル「Whisper」は、英語だけでなく日本語の音声でも精度高く文字起こしできます。
モデルに以下のような音声ファイル先のURL(参考)を含んだデータを渡してみます。

data = {
    "inputs": {
        "audio":
            ["https://soundeffect-lab.info/sound/voice/mp3/info-girl1/info-girl1-honzitsuhagoraizyou1.mp3"],
        "language": ["ja"],
    }
}

出力結果

おお、長文でもきれいに文字おこしできてますね。自分が用意したおまけ音声もできました。
こんなに簡単にデプロイからローカル実行までできるとは、、、

まとめ

まだプレビューでSLAがないので運用環境に使うのはおすすめしませんが、GAされたりOpenAIやHugging Faceのモデルが新しくカタログに追加されると、より実用的になっていきそうですね!

また、今回触れませんでしたが、Azure Machine Learning スタジオの簡単にモデルの微調整ができる機能を使って、新しい学習済みモデルをカスタマイズできるのは強みだと思います。
実務に限らず、大学の卒論とかでも使うのもありじゃないですか?👀

ほかにもBOOK OF NEWSに面白い情報があるので
気になる方はぜひいろいろ調べてみてください!