いっしきまさひこBLOG

Web制作関連、プログラミング関連、旅行記録などなど。

『ここが変だよ、日本のAIプロジェクト』 聴講ノート

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

【緊急開催】キカガク&マスクド・アナライズ共催イベント『ここが変だよ、日本のAIプロジェクト』 - connpass

19:00~19:30 『AIを一つください、という前に』 杉山 阿聖氏(SENSY株式会社 SAILSリサーチャー)

地味で泥臭い

  • 手作業で分類した結果をダブルチェック
  • PythonやSQLのデータの加工
  • などなど
  • 手を汚して少しずつ進めるというのが現実的

各フェーズにおける課題と解決方法

19:35~20:35 『AIベンチャーガチンコトークバトル』 マスクド・アナライズ氏(イキリデータサイエンティスト) & 吉崎 良介氏(株式会社キカガク 代表取締役社長)

AIが、選択肢になる日。

  • 以下、敬称略。
  • マスク:今日はAI導入活用の成功率が多少上がるかもしれない方法について話す。AIベンチャー勤務。お客さんとの窓口として活躍している。
  • 吉崎:エンジニアサイド、ビジネスサイズに分けられる。エンジニアサイドに焦点を当てます。2018年はAzure MLやAutoMLなどがホットになってきた。AutoMLがしたことが、特徴量選択、アルゴリズム選択、ハイパーパラメーターの自動チューニングなど。
  • 吉崎:2018年までのAI事情はどうですか?
  • マスク:うまくいったところはほとんどなかった。良い事例があっても、その裏にはかなりの数の失敗事例がある。
  • 吉崎:成功しているという発表でも、実は局所的だったり裏がある場合も多い。
  • マスク:あとAIやりたいのでお願いします。という丸投げが多かった。
  • 吉崎:契約段階で、発注者との成果物の想定の違いが昔あった。
  • マスク:前処理に時間がかかると試行錯誤する時間が短くなる。説明責任として、もらったお金に対してどういう作業をしたかを示すとよい。
  • 吉崎:法律周りはどうか。
  • マスク:受け取ったデータをどうまで公開するかの契約周りは気にする必要がある。
  • 吉崎:実際に企業でAIは活用されているのか?
  • マスク:あるデータでは、2017年が4.1%、2018年は12.5%。体感ではもっと少ない。理由は単純に予算の問題。
  • 吉崎:活用できていないボトルネックは?
  • マスク:データが部署ごと、部門ごと、データ形式がバラバラといった問題がある。データを集めるための交通整理。AIが役立つかの交通整理が必要。
  • 吉崎:データの整備ができていない。それはどういうことか? まずは教師データと入力変数があるかどうかを明確にすればよい。
  • 吉崎:PoC。期間とか費用とか。
  • マスク:PoCは数百万円ぐらいから始める。
  • 吉崎:ベンチャーだとそれくらい。もっと大きいと桁が1つ違う。
  • 吉崎:人材。まずは社内で育てた方がいい。
  • マスク:採用活動を行ってもこない。
  • 吉崎:AI導入にはROIを測らないといけない。AIをしないとROIは出せない。ニワトリ卵。トップダウンで導入できるならプロトタイプ作成が有効。
  • 吉崎:PDCAサイクルはダメなのか?
  • マスク:製造業の現場などでの改善にはいいけど、AI導入検討ではPDCAの悪いところばかり反映している。DGWA(Do:試す、Go for Broke:当たってくだける、Warm Mind:失敗を許容する暖かい心、ReAction:反応・反響を起こしながら感謝の気持ちを持つ)サイクルがいい。
  • 吉崎:ポジティブループにするにはDGWAはいい。最初の契約の段階でDGWAを共通認識にしておくのが大事。
  • 吉崎:新規事業の場合は、精度のゴールが見えにくい。既存事業の場合は、ゴールが明確になりやすい。ヒューマンインザループ。
  • マスク:偉い人にはヒューマンインザループ。現場の人にはDGWAサイクル。
  • 吉崎:SI開発とAI開発の違いは?
  • マスク:私もギャップに悩んだ。スキルも開発方法も違う。どうやって勉強すれば?
  • 吉崎:社内勉強会をするとよい。キカガクの講座などもトリガーにしてほしい。
  • 吉崎:違いは、精度100%にならないのでテストができないこと。アジャイル的にならざるを得ない。

20:45~21:15 『IoT/AIの利活用におけるデータ取り扱いについて』 小川 貴之氏(弁護士)

  • ビッグデータに関する国の動き:
    • 2017年、未来投資戦略
    • データ契約ガイドライン
    • AIシステム共同開発支援事業(助成金)
  • データに関する法律:
    • データベース著作権
    • 特許を受けた発明
    • 営業秘密(不正競争防止法)
    • 限定提供データ
    • 不法行為
    • 契約(契約不履行)
  • 今後はデータのM&Aが流行する?
    • データ会社と解析会社のジョイントベンチャーを新たに立ち上げる
  • 2013年、JR東日本のSUICAのビッグデータの問題:
    • JR東日本から日立製作所にデータ(※個人の特定はできないもの)を提供。バッシングが起きた
      • 加工が不十分で、特定できるおそれがある
      • 事前の周知がなくて、利用者への配慮に欠けていた
    • 現在の法律に照らすなら:
      • 個人情報保護法に従って、匿名データに加工する。しかしどこまで加工すればよいのか
      • 匿名加工情報用のサーバーを、個人情報用サーバーとは別に用意する必要がある
      • 匿名加工情報をビジネスに使うというプライバシーポリシーをあらかじめ公表しておく