いっしきまさひこBLOG

AI・機械学習関連、Web制作関連、プログラミング関連、旅行記録などなど。一色政彦。

DEEP LEARNING LAB: AI開発を円滑に進めるための契約・法務・知財 聴講ノート

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

DEEP LEARNING LAB: AI開発を円滑に進めるための契約・法務・知財 - connpass

第3 AIの生成に関する法律問題

  • AIで問題となるのは「提供:第三者提供の場合には原則として本人の同意が必要」

    1. . 書面なりで第三者提供の最初から取っておくのが望ましい
    2. . 誰のモノか分からない状態(=復元できない状態)にしてしまうと規制がかからない
    3. . 以降は細かいので省略
  • 質問への回答: 著作権は著作物に対するモノ。センサーカメラの画像データは著作物ではない

  • 質問への回答: クラウドに預けているデータは貸金庫のようなもので提供しているわけではないと考える
  • 質問への回答: 個人情報保護は民間用。国や大学は違う法規制になっている

第2 AIの生成に関する法律問題

  • 著作権法上の複製と翻案をしてデータを作っている
  • 複製権、上映権、公衆送信権などの権利をまとめて「著作権」と呼んでいる
  • 著作権には一定の例外(=「権利制限規定」)をもうけている: 例えば私的複製や引用は無断にしてよい
  • その例外の1つが「著作権法30条の四」:

    • できたて1月1日から施行されている。著作権を持つ生データから営利的に学習用データセットや学習済みモデルを生成できる
    • サーバーの所在地が重要。作業を日本でしていれば、どこの国のデータを使ってもよい
    • 世界でも珍しい法律。日本はパラダイス。機械学習したかったら、日本に来た方がいい
    • 手塚治虫の漫画をデジタル化してそのまま読めてしまう状態で売れば、それは当然、この法令の適用とはならない
  • 質問への回答: ネットに転がっている画像をデータセットに使える。例えばテレビCMでも同様に利用できる

  • 質問への回答: Webサイトの管理人が「無断で使うな」と書かれている場合は、確かに適用外になる? 利用規約で制限されているなら

1 性能保証・検収・瑕疵(かし)担保

  • 1と2が大切:「1. AIと通常の開発は違うと理解してもらう」「2. 開発プロセスや契約を分割する」「3. 契約内容の工夫」
  • AIと通常の開発は違うと理解してもらう
  • 開発プロセスや契約を分割する
    • AIはやってみないと分からない。アセスメント、PoCをまずはやる。次に開発、追加学習。この4プロセスに分けてしまうなど
  • 契約内容の工夫
    • AIの場合はどこまで作れるか分からないので、準委任契約にするのが通常
    • PoC貧乏: PoCで止まって、次の開発に行ってくれなくて儲からない。というのを避けるために、移行義務を契約に盛り込むなどの対策を
    • PoCの横展開を防ぐために、レポートのみにしてソースコードは渡さない

2 権利と知財

  • AIの場合、材料や中間成果物、成果物などができ、それが価値を持つ
  • ユーザーとベンダーの権利と知財は問題になりやすい
  • 例えばセンサーデータは著作物ではない。契約がなければ法律に従うことになる
  • 一定の条件(営業秘密、限定提供データ)に該当すれば不正競争防止法
    • 具体的には、有用性、非公知性、秘密管理性という要件を満たすこと。普通のセンサーデータは満たさない
    • 契約に「本開発においてのみ使います」と書かれていれば、データはそれにしか使えない
  • 「学習済みモデル」の意味が違う場合があるので最初に意味を特定する必要がある
  • パラメーターは知的財産権の対象ではないので、契約に条項を入れる必要がある
  • ユーザーとベンダーの権利と知財: どっちが権利を持っているかではなく、どう使えるか。利用条件で「実」を取る
  • 「共有」すると後々も問題になる
  • ビジネス上の検討⇒契約条件の検討という順になる
  • 検証段階で制限なくデータを渡すのはやめた方がいい
  • 「権利帰属」と「利用条件」は分けて考えた方がいい
  • 契約の限界を知っておく

3 責任

  • AIと通常のシステム開発は違う
  • 責任の種類を知り、契約でコントロールする

質疑応答

  • 質問: ディープラーニングだけの話ではないか?

    • 回答: AIに明確な定義があるわけではない。今回の話はディープラーニングなどの機械学習に関連した話だった。
  • 質問: ガイドラインの次バージョンは?

    • 回答: 医療といった特定範囲を盛り込むなどのマイナーチェンジになるのではないかと思う。バージョンアップし続ける予定。6月ぐらいに成果物が出てくると思う。
  • 質問: ユーザーが生データを渡した場合に、ベンダーが生成したパラメーターも秘密情報となるか。

    • 回答: データについては秘密保持義務を結んでいるはず。パラメーターはベンダーが生成したものなので、ユーザーの秘密情報というのは難しい。
  • 質問: 業者が何らかの対象の写真を撮った場合に権限はどうなるか?

    • 回答: 画像データには著作権はなく写真は撮った人のものなので、自由に使ってよい。
  • 質問: 写真にアノテーションを付与したのであれば、そのデータに著作権は発生するのか? 専門家が付けたのであれば?

    • 回答: 契約による。法律上、アノテーションはラベルを付けているだけなので権利が発生するわけではない。いくら専門的なアノテーションであっても、もともとあるものを発見したものは創作ではないので、著作物ではない。
  • 質問: 日本の法律内で作った学習モデルをアメリカに持っていった場合、みなし侵害になったりしないか?

    • 回答: 確かにアメリカの法律が適法になる可能性はある。しかし通常、みなし侵害は、海賊版のようなものに適用しており、そうならならいのではないかという意見もある。学習済みモデルは、生データは残っていないので、問題ないのではないかとは思うが。