現地からおはようございます!マーケ部しんばです。
こちらの朝は7~9度とかなり冷え込んでいます。
部屋から見える朝焼けがきれいですよ〜〜。
さて、今回はUniverse Day2で参加した『What you need to greenlight AI tools at your company』というセッションで聞いた、生成AIと法的リスクについてまとめます。
スピーカー紹介
以下、GitHub公式ページよりスピーカー情報です。
Shelley McKinley
Heather Meeker
Jen Peck
Heatherは、20年以上に渡りOSS含め、ソフトウェアライセンシングの専門家であり、個人弁護士としても活動されているので、法律的な観点からも、生成AIの著作権リスクにまつわる興味深い話を聞けました。
「まるでOSS黎明期のよう」
まずHeatherは、「現在の生成AIブームは、まるでOSS黎明期のようだ」と述べました。
20年前、OSSが流行り出した頃、多くの慎重な企業では「なるべくOSSは避けるよう」いわれてきました。アイデアの盗作や、著作権違反を恐れていたり、そもそも定められていた企業コンプライアンスに反しているから、といった理由からです。
「現在においてはOSSを利用することは当たり前で、社長が自社製品に使われているOSSの利用を知らないことなど日常茶飯事で、問題はありません。」と語りました。
そして生成AIについて、当時と似た論争が起こっている、と感じているそうです。ただし、OSSは明確に誰でも使って良いものと定義されています。一方、生成AIは学習されることを意識しない学習元がほとんどなため、より問題を複雑化させていますよね。
私個人としてはある程度納得しつつも、OSSと生成AIの著作権問題については完全にイコールではなさそうだ、という印象を持っています
前進することしかできない時代
とはいえ、人々は技術革新によって前進することを止められません。「生成AIを使用しないということ」は、業界の選択肢に入っておらず、GitHub Copilotもその一つだ、と語られました。
そして「ビジネスの観点から、法的責任に対する恐怖が製品開発の決定を左右させるのは間違いです。」と。強気ですねw
GitHub Copilotにおける法的リスク
「著作権のあるものを学習し、似通ったものを出力するのではないか?」というユーザーの不安にある程度理解を示された上で、GitHub Copilotにおいては法的リスクは抑えられているとの見解が。
現状のGitHub Copilotにおいては、学習元はPublicリポジトリに限定しているため、守られたコードを学習→出力することはない→法的リスクは低い、ということですね。
確かにCopilotにも、そのコードやプロンプト等が含まれたテレメトリをGitHubに「送信しない」設定があります。Copilot for Businessにおいては、デフォルトでONになっていて、OFFにできないので誤って学習させてしまうこともありません。
そういった意味では、全世界へ向け公開されているコードからしか学習しないよ!ということですね。
公開されているからといって著作権フリーではありませんから、また難しいところではありますが、「誰でも参考にできる」という意味では、似たコードを使って動くものをつくこと自体は、生成AIじゃなくても日頃から行われている人間の学習と同じですね。
着地点
40分のセッションで、いろいろとリスクについて語られましたが、着地点としては、、、
「法的リスクに対する恐怖は理解するよ。でも、それでイノベーションを止めてしまっていいの?GitHub Copilotは学習元が明らかになっているし、Privateや秘匿情報は学習に使われていない。もちろん、あなたのコードも学習させない選択肢がある。さあCopilotを使って進みましょう!」
といったところでしょうか?
Microsoftから、生成AIに関する以下のようなコミットメントも発表されていますので、気になる方は読んでみてください。
マイクロソフト、お客様向けの Copilot Copyright Commitment を発表 - News Center Japan