※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。
【緊急開催】キカガク&マスクド・アナライズ共催イベント『ここが変だよ、日本のAIプロジェクト』 - connpass
19:00~19:30 『AIを一つください、という前に』 杉山 阿聖氏(SENSY株式会社 SAILSリサーチャー)
- 展開が早かったので一部しかメモが取れていない(あとでプレゼン資料を見る)
- iOSエンジニア ⇒ 社内ヘルプシステム用チャットボット ⇒ 2019年1月~AIリサーチャー
- 共著『見て試してわかる機械学習アルゴリズムのしくみ 機械学習図鑑』
地味で泥臭い
- 手作業で分類した結果をダブルチェック
- PythonやSQLのデータの加工
- などなど
- 手を汚して少しずつ進めるというのが現実的
各フェーズにおける課題と解決方法
- 『仕事ではじめる機械学習』に従って説明
- 勉強に終わりがない。どうすればよいのか? ⇒
- 何をやればいいのか? ⇒
- それってAIなの? ⇒ AIを使わないで済むならそれでOKとして次へ行こう
- データがあるという理由で選ばない。取り組む価値があることを選ぶ
19:35~20:35 『AIベンチャーガチンコトークバトル』 マスクド・アナライズ氏(イキリデータサイエンティスト) & 吉崎 良介氏(株式会社キカガク 代表取締役社長)
AIが、選択肢になる日。
- 以下、敬称略。
- マスク:今日はAI導入活用の成功率が多少上がるかもしれない方法について話す。AIベンチャー勤務。お客さんとの窓口として活躍している。
- 吉崎:エンジニアサイド、ビジネスサイズに分けられる。エンジニアサイドに焦点を当てます。2018年はAzure MLやAutoMLなどがホットになってきた。AutoMLがしたことが、特徴量選択、アルゴリズム選択、ハイパーパラメーターの自動チューニングなど。
- 吉崎:2018年までのAI事情はどうですか?
- マスク:うまくいったところはほとんどなかった。良い事例があっても、その裏にはかなりの数の失敗事例がある。
- 吉崎:成功しているという発表でも、実は局所的だったり裏がある場合も多い。
- マスク:あとAIやりたいのでお願いします。という丸投げが多かった。
- 吉崎:契約段階で、発注者との成果物の想定の違いが昔あった。
- マスク:前処理に時間がかかると試行錯誤する時間が短くなる。説明責任として、もらったお金に対してどういう作業をしたかを示すとよい。
- 吉崎:法律周りはどうか。
- マスク:受け取ったデータをどうまで公開するかの契約周りは気にする必要がある。
- 吉崎:実際に企業でAIは活用されているのか?
- マスク:あるデータでは、2017年が4.1%、2018年は12.5%。体感ではもっと少ない。理由は単純に予算の問題。
- 吉崎:活用できていないボトルネックは?
- マスク:データが部署ごと、部門ごと、データ形式がバラバラといった問題がある。データを集めるための交通整理。AIが役立つかの交通整理が必要。
- 吉崎:データの整備ができていない。それはどういうことか? まずは教師データと入力変数があるかどうかを明確にすればよい。
- 吉崎:PoC。期間とか費用とか。
- マスク:PoCは数百万円ぐらいから始める。
- 吉崎:ベンチャーだとそれくらい。もっと大きいと桁が1つ違う。
- 吉崎:人材。まずは社内で育てた方がいい。
- マスク:採用活動を行ってもこない。
- 吉崎:AI導入にはROIを測らないといけない。AIをしないとROIは出せない。ニワトリ卵。トップダウンで導入できるならプロトタイプ作成が有効。
- 吉崎:PDCAサイクルはダメなのか?
- マスク:製造業の現場などでの改善にはいいけど、AI導入検討ではPDCAの悪いところばかり反映している。DGWA(Do:試す、Go for Broke:当たってくだける、Warm Mind:失敗を許容する暖かい心、ReAction:反応・反響を起こしながら感謝の気持ちを持つ)サイクルがいい。
- 吉崎:ポジティブループにするにはDGWAはいい。最初の契約の段階でDGWAを共通認識にしておくのが大事。
- 吉崎:新規事業の場合は、精度のゴールが見えにくい。既存事業の場合は、ゴールが明確になりやすい。ヒューマンインザループ。
- マスク:偉い人にはヒューマンインザループ。現場の人にはDGWAサイクル。
- 吉崎:SI開発とAI開発の違いは?
- マスク:私もギャップに悩んだ。スキルも開発方法も違う。どうやって勉強すれば?
- 吉崎:社内勉強会をするとよい。キカガクの講座などもトリガーにしてほしい。
- 吉崎:違いは、精度100%にならないのでテストができないこと。アジャイル的にならざるを得ない。
20:45~21:15 『IoT/AIの利活用におけるデータ取り扱いについて』 小川 貴之氏(弁護士)
- ビッグデータに関する国の動き:
- 2017年、未来投資戦略
- データ契約ガイドライン
- AIシステム共同開発支援事業(助成金)
- データに関する法律:
- データベース著作権
- 特許を受けた発明
- 営業秘密(不正競争防止法)
- 限定提供データ
- 不法行為
- 契約(契約不履行)
- 今後はデータのM&Aが流行する?
- データ会社と解析会社のジョイントベンチャーを新たに立ち上げる
- 2013年、JR東日本のSUICAのビッグデータの問題:
- JR東日本から日立製作所にデータ(※個人の特定はできないもの)を提供。バッシングが起きた
- 加工が不十分で、特定できるおそれがある
- 事前の周知がなくて、利用者への配慮に欠けていた
- 現在の法律に照らすなら:
- 個人情報保護法に従って、匿名データに加工する。しかしどこまで加工すればよいのか
- 匿名加工情報用のサーバーを、個人情報用サーバーとは別に用意する必要がある
- 匿名加工情報をビジネスに使うというプライバシーポリシーをあらかじめ公表しておく
- JR東日本から日立製作所にデータ(※個人の特定はできないもの)を提供。バッシングが起きた