2020-01-30

Data Science Fes 2019 クロージングフォーラム聴講ノート

AI ＆機械学習

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

Data Science Fes 2019 クロージングフォーラム｜EventRegist（イベントレジスト）に参加しました。

15：00～15：55　セッション1　データ/AIのビジネス活用への勘所

ファシリテイタ―：杉山俊幸氏（日経BP 総合研究所主席研究員）
- 自社内のデータ活用は進んできたが、会社間のデータ連携は進んでいない。その解決が今進められている
- インターネットとAIを対比させて20年後に向かって見ると、現在はまだ果実が実る段階ではない。利益を出すことを慌ててはいけない
- インターネットでは、20年前はポータルサイトばかりだったが、今は検索とECで大きな果実が実った
- アワードの審査ポイント「産業・社会的なインパクト」「先進・独自性」「チャレンジ度」
- 大賞＝キューピーの「AI食品原材料検査装置」（協調と競争の二軸が大事で、これは他社にも使ってほしい「協調」の技術）
- 「ディープラーニングビジネス活用アワード」大賞はキユーピー：日経クロストレンド
- 特別賞には、パッケージデザインのプラグの「パッケージデザインの好意度スコアを予測するAIサービス」など
小川亮氏（プラグ代表取締役社長経営管理博士）
- プラグはデザイン＋調査の会社（社員70名）
- 各商品のデザインの評価を調査している： 3000人に調査していてお金がが掛かる、誰かがSNSに秘密の商品をアップしてしまうリスク、などなどの問題がある
- この調査をAIで自動化した：かなり良い精度で当てられるように。すべての案件が客観的に評価できる、情報漏えいがない、仮説検証が低コストで何回もできる、マーケターの時間を大切に使える、などなどのメリットがある
- パッケージデザインを11回評価して決めた。AIで今までとやり方が変わる
- 同じ形式で溜めてきたデータだけはある、AIでいけるのではないか（回帰？　分類？　画像処理？）、秋の大きな展示会に取りあえず応募してみた、依頼先を探すも分からなくて高い、大学との共同研究に手紙を出しても無反応か億単位のお金が必要、やばい展示会・・・、社員の1人「俺がやる」
- 独学で勉強開始、本を読む、似た課題のプログラムを当てはめる、速いPCを1台、･･･と地道に進めていき（1000時間くれ）、何とか展示会に間に合った
- 営業を始めて「試してみたい」という声は多いが、「なぜそういう結果になったかを知りたい」という声が多かった。そこでバージョンアップして「どこが好意度に寄与するのか」をヒートマップで表示できるようにした。また、評価コメントのコトバ（イメージワード）を表示できようにした。これからその新版をリリースする予定
- やりたいことを5段階でいうとまだ1.5ぐらい。例えば「どういう言葉で訴求したらいいか」など
杉山氏からの質問：
- 「俺がやる」誰も手を挙げなかったら？　→　どうしていたか分からないが外注しなくて良かった。自社で行うことでノウハウも溜まった
- AIに携わる人員は？　→　東京大学との共同研究なども進めているが、実質的に1人の社員がやっている。AIのチームを社内外に作るステージに来ている。学生をアルバイトで雇ったりしてもよい（高専生は特に優秀）
- 学生アルバイトを使うメリットは？　→　大学の人は経験値があるので、「理論上はそうではないが、経験上はこうすると速い」などのアドバイスがもらえたりする
大企業のAI活用は？　→　ベンチャーと大企業と大学が組むパターンが増えてきた。そういうフレキシビリティが大切

16：00～16：55氏　セッション２　大学の実践的な教育への取り組みと企業との連携

ファシリテイタ―：加茂倫明氏（POL代表取締役CEO）
- アカデミアのバックグラウンド：現役の理系学生（東大工学部を休学中）
- 2016年9月に共同設立者と起業。日本の科学は停滞傾向、論文数は減少中。研究領域には課題が山積み。それを解決するために起業した
- 研究者の可能性を最大化するプラットフォームを創造する
- LabBase：優秀理系学生の採用プラットフォーム＝採用市場に出にくい理系学生を、検索して一本釣りできるサービス
- LabBaseX：産学連携を加速するナレッジプラットフォーム（2019年3月リリース）＝大学を横断して検索
- 課題意識：産学マッチングの裾野拡大（→データと高性能計算機の提供）、DS（データサイエンス）人材の技能要件の定義明確化／細分化（→適切なジョブマッチング／人材育成）
沼田洋一氏（ADKマーケティング・ソリューションズ事業役員／Data Chemistry代表取締役社長）
- ADKは業界第3位の広告会社グループ
- データとは何か？
  - 量を集める（＝データ）→視点で整理（＝情報）→発見（＝知性・洞察）→判断（＝意思決定）→行動（＝アクション）
  - ロジック×データ＝両方ともあるのが一番良い
  - データに関わる業務領域はたくさんある
- 東京大学／武蔵大学社会学部グローバルデータサイエンスコース／早稲大学と連携
  - データ提供する意味：大規模・シングルソース・定期・クリーニング済みのデータでないと研究・勉強できないのかという思いから提供
  - ADK生活者総合調査：オリジナルの調査データ
  - 企業データを預けることの難しさ：データ漏えいなどを防ぐための契約書など
  - Waseda Integraged Research platform（WIRP）という契約面とシステム面を一括サポートする仕組みを使えばよい
- 企業側が求めているもの＝課題設定が難しくてそれができる人材がいない。想像力はすべてのビジネスの基礎。データサイエンス＋社会科学の想像力が必要とされている
小野陽子氏（横浜市立大学データサイエンス学部助教授）
- YCUでの教育プログラム：ドメインへの興味喚起→数学を含めた基礎教育→アルゴリズム＋統計＋計算機科学→柱となる学問への融合領域→ドメイン・・・
  - プロセス：課題発見→データ定義・収集・加工・分析→解釈・提案→解決
  - 学外での学び：セミナー、企業講座、PDS（インターシップ）、共同研究、修士課程で共同研究
- PDS（Practical Data Science）：学部3年生対象。PBL＝”Probrem” Based Learning、産学連携など
  - PBL実習：実績追体験型、解決プロセス現在進行型、課題未着手型、課題理解型、その他
- YOKOHAMA D-STEP：修士レベル相当だが大学院ではない。産官学連携でデータをもらって、実課題解決型PBLを実施
- WiDS： Women in Data Science（スタンフォード、ICMEを中心に始まった）。ゴール＝Inspire、Educate、Support。ローカルイベントも実施
以下はディスカッション
加茂氏：何がデータサイエンティストには大事か？
- 沼田氏：想像力。売っている商品は女性向けが多いので、気持ちが分かる女性のデータサイエンスとに分析してほしい。
- 小野氏：女性でないとというのは幻想かもしない。現場に出るのが大事。
- 沼田氏：現場は大事。シャンプー売場を見てみないと分からない。
加茂氏：企業がどうデータサイエンスを使うかを1年生にインプットする意図は？
- 小野氏：微積などの基礎学習ばかりでは、興味が持てないところがあるという理由もある。
加茂氏：コミュニケーションに関する課題は？
- 小野氏：私自身は、統計出身だが工学にも興味があったが、工学系からすると統計系は独立とか有位とかじゃなく早く動くものを作れとなると思う。そういう分野ごろに断絶されてる状態ではなく、どの人とも話せるコミュニケーション力が必要になる。WiDSを見ると、統計と計算科学でコミュニケーションが取れない問題は世界共通。
加茂氏：大学へのデータ提供で難しい面は？
- 沼田氏：やはり契約面。誰が責任をとるのか？　大学がまとめて責任をとる契約でないと。調査データなので個人データではないと思っているが、個人情報の問題もある。早稲田はWIRPで楽ちん。
- 小野氏：データがある企業に行くの（＝インターンシップ）が今のところ安心。
加茂氏：文系出身の人が沼田さんのような立ち位置になるには？
- 沼田氏：専門分野の本を10冊ぐらい読む。用語を易しく言い換えできるようになれば大丈夫。
- 小野氏：10冊読めるというのは問題解決したいというドメインへの情熱や興味があったと思う。それがないとどうにもならない。
加茂氏：最後に企業にメッセージを。
- 沼田氏：文系企業でもデータサイエンスの知識を持って話をできるように。妄想力が大事。データは会社にあるが出す側がビビるので契約面を何とかする。
- 小野氏：トレランス、寛容性が大事。コミュニケーションで寛容性がないと、データサイエンスの実施にストップがかかりやすい。

17：05～18：15　セッション3　Data・AI－Readyな社会を私たちが創ってゆくために

小澤健祐氏（ディップ AINOW編集長）
瀧島勇樹氏（経済産業省情報技術利用促進課長）
菅野流飛氏（高専キャリア教育研究所代表取締役社長）　
進行：水無徹郎氏（日経新聞メディアビジネスクロスメディアユニット）
水無氏：
- 政府による「人間中心のAI社会原則」の上にあるビジョンが「AI－Readyな社会」
- 経団連による「AI－Ready化ガイドライン」（企業、個人、社会制度・産業基盤）。指針はレベル1～5に分けられている
  - AI-Ready化ガイドライン
- 5年後にレベル3まで進行していると過程して、今の状況は？ → パネリストそれぞれ見解は分かれた。それを踏まえてディスカッション
小澤氏：
- AINOW編集長。「AI業界の広報になりたい」という思いを持っている。テレビやYouTube、講演など多方面で活動中
- AIドルは数学とプログラミングの勉強をしている
- dipという会社はバイトルなどの人材サービスを扱っている。AINOWは「AI」関連の検索で強い
- 2019年：自然言語処理のBERTが目立った。BERTのGoogle検索への採用など、技術の水平展開だった1年。OCRの技術が確立した
- SIerの限界： B2B2Cモデルにおける課題＝今までのAI市場はPoCで成り立っていた
- AI導入の課題：課題設定（あらゆるフェーズで課題が分からない）。企画←要件定義←PoC←導入と年々遡っている
- 現場特化型（課題把握）の人材育成： 42 Tokyoがオープン
- 課題解決のデジタルシフトが大事ではないか。AI-Readyに向けて
- 2020年はデータ基盤→RPA→AIという形で山を大きくしていくのが理想
瀧島氏：デジタルトランスフォーメーション（DX）の展開
- WEFダボス会議：安陪総理スピーチより「作り上げるべき体制はDFFT（データ・フリー・フロー・トラスト）」
- デジタルトランスフォーメーション（DX）とは何か？　→　デジタル技術を使って、つながり方を変えて、本当にやりたかったことをやる
  - ユーザーの気持ちで再構築する、経営とデジタルは一体である、というこにつながる
- Society 5.0：あらゆる段階でのデータ化
- ネクスト・ジェネレーション・ガバメントの在り方：政府が動画で作った。本もAmazonで売れている
  - 19世紀にモノの大量生産体制ができ、インフラ面も作られた
  - 20世紀には、政府ですることが増えた（GDPの16％が政府の施策）
  - 21世紀次世代は、（小さなユーザーの困ったに対応する）ユーザー起点の政府でないことに問題意識を持っているので、つながり方を変えていくためのプラットフォームを作っていく
  - 「テクノロジーをうまく使いこなすために、政府や公共はどうあるべきか」→ DXやAI社会の実現
- 「2025年の崖」＝DXの必要性を理解しているが、レガシーシステムもあるので実現できない
- IT投資における日米比較：日本は守り、米国は攻めのIT投資をしている
- なぜデジタルレディに投資が向かわない？　→　部門間、経営者、投資額、人材、危機感などの問題。経営者はオポチュニティを掴めているのか。DXがダメなところに良い人材が入るのか
- 「DX推進指標」の策定、「デジタルガバナンスコード」（社長自らが方針を宣言することにインセンティブ）の検討、IPA未踏IT人材、などの対策をしている
- やはりDX推進にはリーダーシップが大事
菅野氏：データ・AI-Readyな社会に備えるためのスタンス考察
- 高専卒業生のイノベーターの価値を見いだし、「高専スタンフォード計画」をスローガンに掲げている
- 高専は現場の実装に強い。未踏スーパークリエイターの高専生の割合は13％、ハッカソンの優勝チームも40％。松尾先生も高専を高く評価している（DCON開催）
- 高専生の行動特性：まず手を動かして結果を出す。不確実性をいったん受け止める
- AI-Readyに求められるスタンスとは？ → PoCではなく、動かせる結果を持ってくる
- 完全な構造（業務改善や事業側）と完ぺきなカオス（発明やDX側）の中間にあるのがイノベーション（新規事業）＝不確実性を楽しめるメンタリティ（まず動く）＝スタンス
- 「20％作る力」＋「80％受け入れる力」ができると日本社会が変わる＝「できないこと、知らないこと、違うこと」を受け入れる寛容さが社会として必要
以下はディスカッション
- 瀧島氏：官僚組織は決められたことの権化みたいに思われているがスーパーカオスでもある。どうブレンドすればよいのか？
  - 瀧島氏：リクルートの上司は問題があったら守ってくれた。そのおかげでできたプロジェクトがあるので感謝している。構造を守る側がそういうスタンスだとパフォーマンスがあがる。
- 小澤氏：カオス側を受け入れるためにはどうすればよいか？
  - 菅野氏：私が言える話でもないが、聞いた話では、トヨタの場合、治外法権の組織を別に作ってしまう、というのは良い。結果が出るまでのリードタイムを許容できるようにする。
  - 瀧島氏：経営者などの工夫が必要な場面はある。
- 小澤氏：そういう組織にするには？
  - 瀧島氏：自由な空間を作ってイノベーションを起こすという宣言を社長がする「デジタルガバナンスコード」が必要。
- 水無氏：会社が変わるのを待つのではなく、個人ができることは？
  - 小澤氏：スタートアップやスピンアウト系が増えているのはそれだから。自分で動いて作ってしまうのが早い。
  - 菅野氏：シリコンバレーではアライアンスが大事で、ゆるふわにつながりたいという人が多い。会社に所属するのではなく、契約にしてフラットにするケースが増えている。
- 小澤氏：大企業では労働基準で働く時間制限もあるので燃え切れない人もいる。
  - 瀧島氏：大企業に入らなければ良い（会場：笑）。若い人から変わっていくのでは。そういう現実から規制を変えていくのが大事。
- 小澤氏：実際に大企業に勤めている人はどんな感じ？
  - 菅野氏：人間関係が嫌だという人間はいないが、仕事がつまらないという人は多い。大手企業は優秀な人は多いので、仕事自体がチャレンジングであればもっと日本も成長できるはず。

2020-01-24

産学連携教育への挑戦～滋賀大データサイエンス学部１期生と共に歩んだ４か月聴講ノート

AI ＆機械学習

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

産学連携教育への挑戦～滋賀大データサイエンス学部１期生と共に歩んだ４か月｜IT勉強会ならTECH PLAY［テックプレイ］に参加しました。

15:00 - 16:00 講演『産学連携教育への挑戦～滋賀大データサイエンス学部１期生と共に歩んだ４か月』

国立大学法人滋賀大学　河本薫氏
株式会社電通関西支社　湊康明氏
株式会社インテージホールディングス　小金悦美氏

産学連携ゼミというこうとで滋賀大学の一期生と取り組んだ結果を説明する。

産学連携ゼミの狙い（河本氏）

大阪ガスを経て滋賀大学の教員になった
データサイエンスの持論
- 「役立つ≠分かる」：研究論文は分かれば書けるが、大阪ガスでは問題解決に役立つとは限らない
- 「データサイエンス（役立つ）≠統計学（分かる）」
- 「データサイエンス力＋データエンジニアリング力＋ビジネス力」と図にまとめられるが、本来は多義的：アルゴリズム開発型、ドメイン深掘型、☆ビジネス支援型☆、サービス創造型
- 求められているのは「ビジネス支援型」←この人材を育てるのが河本氏自身のミッション
データサイエンティストが直面するお題：「最近売り上げが落ちているから、原因が知りたい」など
データサイエンス教育の持論
- 「医者≒データサイエンティスト」: 「臨床実習（問診→検査→治療）≒PBL（課題発見→データ分析→問題解決）」
産学協同教育で、シームレスな人材育成：大学教育と企業教育、それぞれの教える力で強力し合える部分がある
河本ゼミの教育目標：ビジネス支援型データサイエンティストに求められる能力（課題設計力、データ収集と整形、データ分析と解釈、　報告と実装）
河本ゼミのPBL方針：「一気通貫型教育」＆「全体俯瞰型教育」、産学連携して共同教育を行う、コミュニケーション力の育成
PBL演習に必要な3つの外部始動（2019年の例）：
- 【課題発見】ビジネスの悩みや願望：チョコレートの購買状況について何が課題であるかを設計
- 【データ分析】実データ（インテージ社から提供）： 50代女性がチョコレートの購入意向をもつかどうかを分析（行動仮説を探索）
- 【問題解決】当事者へのプレゼン機会：結果を発表
- 「わかる」→「役立つ」への価値観の改革ができた

参加者アンケートの結果について（ディスカッション）

河本氏／小金氏：やらされている感ではなく、積極的・自発的に取り組むようになった
湊氏：アウトプットのためのインプットになったのが大きい

インテージが産学連携ゼミに参画した理由（小金氏）

インテージはさまざまなデータを集めている（市場調査やマーケティングリサーチ）
ビジネスにおけるデータ活用課題：デジタル化＆スピーディな意思決定の時代だが、意思決定につながるアウトプットができるデータサイエンティストが不足している
ビジネスサイドが教育に関与する意義は、データサイエンティストに必要とされる「ビジネス力」の部分を育成する必要があるから（社長：会社の責務として貢献したい）
インテージの増田氏による「現場」の説明：
- 講義するうえで気を付けた点：目的の重要性（何のために？誰が？）、実務と理論のバランス（実利用と研究論文では違う）、データ分析（目的を考えて自らが不足するデータを拡張）
- 議論を通じて感じた点：目的の重要性（自走する学習に発展）、考え方の変化（答えを求める態度から可能性を追求する態度へ）、結果の説明（データ分析に明るくない人への説明を想定）

学生時代にビジネスシーンをイメージすることの必要性（湊氏）

電通若者研究部の研究員としての研究経験などから「若者×テクノロジー」などに取り組む
学生の間にキャリアを意識する瞬間が大切
大学院生時代： “勉強がどう社会還元されるのか、イメージする力”がなかった
バックキャスト思考の重要性：未来やビジネスシーンをイメージする、自分の実力の検証と気付いていない視点の拡張、勉学への意義づけとアクションプランの策定
社会に還元される「イメージ」を持ってもらう：ビジネスでの意思決定手法としてのデータサイエンスを意識させた
自分の実力の検証と気付いていない視点の拡張：「アイデアを出していない」「企画書が書けてない」「ビジネスとして成立していない」といった、ビジネスの基礎力の欠損の提示
勉学への意義づけとアクションプランの策定：ワークシートを活用した振り返り
「報告と実装」では、プレゼンして終わりではなく、アプリケーション開発力も大切
技術が分かるプロデューサー、ビジネス感覚のあるエンジニア＝いわば翻訳者のような人材が必要：アカデミック的素養がある人材にビジネスマインドをインプットするのは価値がある
次世代のリーダーを育てる：多業種合同インターンプログラム「engawa young academy」

16:00 - 17:00 パネルディスカッション

モデレーター：ヤマトホールディングス株式会社　中林紀彦氏
国立大学法人滋賀大学　河本薫氏
株式会社電通関西支社　湊康明氏
株式会社インテージホールディングス　小金悦美氏

人材育成について産学連携のToBe像

中林氏：世界で一番成功しているプログラムは「Insight Data Science Fellows Program」。基礎的なところを教えた後はPBLが大事

日本に必要なモデルは？

河本氏：企業が能動的に大学と連携していくべき。PBLに基づく教育基盤は大学連携でしか難しい。「課題発見をどう教えるのか？」＝大学で数学に詳しい人が教えるのがうまいわけではない。ビジネスを持つ企業の人の方が教えるのがうまい可能性が高い。だからといって杓子定規に分けられないので、大学と企業が一緒に教育内容を考える必要がある。学生は問題と課題の違いが分かっていないことが多いので、そこから教える必要がある。
湊氏：企業への長期インターンをした方がいい。若いうちにビジネスシーンに触れられるから。企業にとってもメリットがあるはず。
小金氏：社内でやりたいという声が挙がったわけではない。実態として仕事が忙しいのにやってられないという状況だった。優秀なデータサイエンティストが2名も大学に教育者として派遣することに本当に価値があるのかという議論はある。
中林氏：人に依存しないサステイナブルなモデルを作っていく必要がある。
河本氏：予算がいただけるならば解消できるかもしれないが。
湊氏：学校法人から企業への対価がペイするものかというとそうではない。学生さんに任せられる業務を3割ぐらいに増やせるのなら、うまくいくのではないか。そういった体制を作る方が現実的。
小金氏：複数の企業が参画できる点は、学生に刺激が与えられる点ではよい。そういった学生はインテージにとっても人材採用の面で魅力的に見える。
河本氏：モチベーションと自信があれば学生は自走する。だからモチベーションを付けてやるのが大事。
湊氏：学生でプログラミングできてもアプリが作れないのが嫌で、アプリ実装サークルなどに入って、企業から時給5000円で請け負って、実践を学ぶ例などがある。こういうおんは良いモデルだと思う。
会場質問：データサイエンスといっても領域はさまざま。企業が欲しい領域の人材と必ずしもマッチングできていない。例えばデータ分析やりたい人と機会学習やりたい人は違うので、ミスマッチが起きると、企業をすぐにやめていってしまう。これについてはどう考えているか？
中林氏：マッチングの精度を上げるにはどうするべきか？
湊氏：人材の取り合いが起きている状況。企業は人材を逃したくないと思うので、社内副業制度を作っていくのが良いと思う。
小金氏：データサイエンスという用語は広義だが、採用時にその人の能力ややりたいことをきっちりと見極めるのは結構難しく、悩ましい。
中林氏：企業は総合職のような形で採用せざるを得ない。専門職を作っても将来的に変化していくので。
会場質問：課題設定の進め方のコツ。
河本氏：そこが核心で、私が得意なところで、大学が果たすべき分野だと思う。そのノウハウこそが日本の財産になる。
小金氏：カリキュラム作成でさんざんディスカッションした。
湊氏：産学協同で参画した三者の距離が遠かったことが、より良い議論につながった。
会場質問：大学生の話が中心だったが、少子高齢化で学び直しが必要になるのでは？
河本氏：滋賀大学では院を作ってリカレント教育にも力を入れ始めた。ただし、休職が必要なので、企業ではなかなか難しい面がある。ニーズはあるが、実現が難しいのが問題。
小金氏：リカレント教育のできる社会になるとよい。データサイエンスを習得できる場が増やせるとよい。最後のまとめとしては、企業としてもデータサイエンスの産学協同をサステイナブルにする必要がある。同じような企業が増えていけばよりやりやすい。
湊氏：リカレント教育は賛成だが、それを実現するには社内体制を整える必要がある。企業で産学連携のイメージができて、仲間がふえていくとよい。

2020-01-24

読書感想『統計学が最強の学問である』

意見と感想読書統計

書籍紹介

　2013年1月出版の本ですが、本屋さんで平積みされていたので気になっていました。audiobook.jpでセールされたので聴いて＆読んでみました。Kindle版もあります。

　オーディオブックの再生時間は7時間3分。比較的短めです。

　本の概要を講義した動画も見つけました。

51分28秒の動画「八嶋智人が『統計学が最強の学問』を講義する！」（ダイヤモンド社）

　「2015年1月20日までの限定公開」と書かれていますが、2020年1月26日時点でまだ視聴できるみたいです。YouTubeの「限定公開」となっているのでリンクは遠慮しておきます。視聴したい人は上記のリンク先を訪問してください。

f:id:misshiki:20200126162640p:plain — 51分28秒の動画「八嶋智人が『統計学が最強の学問』を講義する！」

プロローグ（2:14）
オープニング（4:28）
誕生日のパラドクス（6:31）
西内啓さん紹介（10:14）
ビックデータとサンプリング（3:02）
テレビの視聴率はどうやって調べるのか（3:52）
身長サンプリング調査（6:09）
あの格言は正しいのか（4:36）
統計学にダマされるな！（7:26）
エンドロール（2:56）

概要紹介と感想

　この本の評価コメントを見ると、高い評価が多いですが、低い評価も一定数います。その理由は何となく分かります。この本に何を期待するかで、評価が全く変わるだろうなと思うからです。

　この本は、「統計学」がIT＋ビッグデータにより使えるツールとなったことを事例を繰り出しながら力説します。それによって、それまで統計学を軽視してきた人たちに気付きを与えてくれます。それが高評価の理由。

　一方で、統計学を鳥瞰図的に使い道をざっくりと示しています。この説明は、統計学を知らない人には難しく、知っている人には全く内容がない（＝統計学の内容をかみ砕いて書いている）ようなレベル感になっています。そこが低評価の理由だと思います。

　低評価の理由について擁護しておくと、“ある程度”統計学を知っている人には頭の中が整理できたり、統計学がどうやって成り立ったのかという意味が理解できたりします。これによって、統計学が平均・分散、T検定・カイ二乗検定、多変量解析など、個々の知識でしかなかったものが、立体感を伴って全体像が浮かび上がってきます。というか私はこれを読んで立体感を覚えました。低評価の内容も、読む人によっては高評価になり得るということです。

　だから「この本を聴いて／読んでみたい」という人は、そういったことを意識してから本を手に取った方が幸せだと思います。

　ちなみに目次は以下のようになっています。このうち、第3章までは全ての人が読んでみるとよい部分です。第4章以降は、統計学の知識が少しあった方がより理解しやすいです。

第1章　なぜ統計学が最強の学問なのか？
- 01　統計リテラシーのない者がカモられる時代がやってきた
- 02　統計学は最善最速の正解を出す
- 03　すべての学問は統計学のもとに
- 04　ＩＴと統計学の素晴らしき結婚
第2章　サンプリングが情報コストを激減させる
- 05　統計家が見たビッグデータ狂想曲
- 06　部分が全体に勝る時
- 07　1％の精度に数千万円をかけるべきか？
第3章　誤差と因果関係が統計学のキモである
- 08　ナイチンゲール的統計の限界
- 09　世間にあふれる因果関係を考えない統計解析
- 10　「60億円儲かる裏ワザ」のレポート
- 11　p値5％以下を目指せ！
- 12　そもそも、どんなデータを解析すべきか？
- 13　「因果関係の向き」という大問題
第4章　「ランダム化」という最強の武器
- 14　ミルクが先か、紅茶が先か
- 15　ランダム化比較実験が社会科学を可能にした
- 16　「ミシンを2台買ったら1割引き」で売上は上がるのか？
- 17　ランダム化の3つの限界
第5章　ランダム化ができなかったらどうするか？
- 18　疫学の進歩が証明したタバコのリスク
- 19　「平凡への回帰」を分析する回帰分析
- 20　天才フィッシャーのもう1つの偉業
- 21　統計学の理解が劇的に進む1枚の表
- 22　重回帰分析とロジスティック回帰
- 23　統計学者が極めた因果の推論
第6章　統計家たちの仁義なき戦い
- 24　社会調査法vs疫学・生物統計学
- 25　「ＩＱ」を生み出した心理統計学
- 26　マーケティングの現場で生まれたデータマイニング
- 27　言葉を分析するテキストマイニング
- 28　「演繹」の計量経済学と「帰納」の統計学
- 29　ベイズ派と頻度論派の確率をめぐる対立
終章　巨人の肩に立つ方法
- 30　「最善の答え」を探せ
- 31　エビデンスを探してみよう

　以下、引用しながら、私自身が気に入った内容をまとめていきます。

統計学が最強の武器になるワケ

　冒頭でも「統計学がIT＋ビッグデータにより（昔と比べて）使えるツールとなった」と記述しました。昔と比べて、統計学はあらゆる学問で必須ツールとなっています。それだけでなく、企業内でもデータが増えてきており、大量のデータから意味のある情報を抽出して分析するニーズが高まっています。それを私自身も身近に感じています。これについて筆者は次のように表現しています。

どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができる

　私自身も、ディープラーニングや機械学習を学ぶうえで統計学の知識を身に付ける必要性を感じて、統計検定2級を受験し、合格しました。統計検定は2011年11月の試験開始から徐々に受験者数を伸ばし、私が受験した2019年11月に大幅に伸びています（下の図は「統計検定の記録（分布）｜統計検定：Japan Statistical Society Certificate」からの引用です）。2020年以降も右肩上がりで伸びるのは間違いないだろうと私は見ています。＜ここだけちょっと本の内容から脱線しました＞

f:id:misshiki:20200124023727p:plain — 統計検定の受験者総数の推移

全数調査 vs サンプリング調査

　統計学の知識がないと、「全数調査しないとダメでしょ」という意見に普通なります。しかし統計学は、「その必要はなく、ランダムサンプリングして調査すれば、かなり良い精度で推定できるよ」ということを明らかにしています。目次の見だしにある「1％の精度に数千万円をかけるべきか？」とは、全数調査とサンプリング調査では、（もちろんケースバイケースですが）精度にそれくらいの差しかないことがほとんどということを示しています。

ランダム化

　Web業界では、「A／Bテスト」と呼ばれる比較検証をよくやりますよね。対象ページのAバージョンとBバージョンを用意しておいて、訪れる参照者ごとランダムにAかBかを見せて、どちらがより効果が出るかという手法です。

　これにより、より効果の高いサイトを作っていけます。これは統計学では「ランダム化比較実験」というフィッシャーが打ち立てた方法論なのだそうです。これをベースにロザムステッドが著したのが『実験計画法』です。これについて著者は次のように述べています。

とりあえず研究参加者をランダムに分けて、異なる状況を設定し、その差を統計学的に分析してしまえばいいのだから、これほどわかりやすく強力な研究方法はない

　「ランダム化比較実験」のランダムネスは統計学において非常に重要で、しかも強力です。ランダムネス（＝ランダム化やランダムサンプリング）の有効性については観察や調査（先ほど示したサンプリング調査など）においても言えます。

ランダム化に基づいて条件をコントロールする実験だけでなく、ただ何も手を加えずに調査を行う観察においても統計学は大きな力を発揮するのだ。

　また著者は、疫学研究方面における「ランダム化」の価値を言及していました。

90年台代前半の主要な医学雑誌に掲載された論文を比較検討した結果、疫学研究から示されたリスクの大きさは「ランダム化比較実験とあまり結果に差がない」である。そして、その理由としては「高度な統計手法によって、適切な条件の調整を行うことはできているから」という考察がなされていた。

「平凡への回帰」と回帰分析

　中学や高校の試験で偏差値って出ますよね。そのグラフは釣り鐘状で、中央が一番多く、両端は少ない形になります。このように一般的な傾向として、データは中央に集まってくる、つまり「平凡への回帰」（ゴルトンによる）なわけです。その後、「平均値への回帰」（＝平均値に近づく）とも言い換えられているそうです。このようなことが起こる理由について著者は次のように書いています。

なぜこうした「平均値への回帰」という現象が起こるかと言えば、それは身長だろうが知能だろうが、あるいは生物の特徴だけに限らず、この世のすべての現象がさまざまな「バラつき」を持っているからだ。

　そしてバラつきを持つ事象には、回帰分析が必要だと論じています。

ゴルトンとその弟子から我々が最も学ぶべきは、バラつきを持つ現象に対する理論的な予測がそれほどうまくいかないという点である。だからこそきちんとデータをとって回帰分析を行い、その関係性を分析する必要があるのだ。

　さらに、回帰分析の注意点を示しています。

ただし、回帰分析によって得られた「最もそれらしい予測式」を得ただけでは満足してはいけない。なぜならその予測式は最もデータとの誤差を最小化するように得られたものではあるが、依然として誤差が存在することには変わりないのだ。

　この誤差があることをどう考えればよいか。これに対して、再び（天才）フィッシャーがアイデアを提示したことを著者は説明しています。

だが、フィッシャーはこのように「無制限にデータを得られればわかるはずの真に知りたい値」を真値と呼び、たまたま得られたデータから計算された統計量がどの程度の誤差で真値を推定しているかを数学的に整理することで、無限にデータを集めることなく適切な判断が下せるという考えを示した。

　この後、回帰分析の基本用語として「信頼区間」や「p値（＝有意確率値）」が紹介されます。そして次のように、こららの知識が統計学において非常に重要であることを示しています。

このように、回帰係数の誤差や信頼区間（やp値）といった値を読み解けるようになれば、あなたの統計リテラシーはぐっとレベルアップする。なぜなら以前に述べたようにデータ間の関連性を分析する、あるいはあるデータから何らかの結果を予測する、といった統計学の最も大きな目的のために用いられる手法のほとんどは、広義の回帰分析であるからだ。

　“広義の”回帰分析とは何なのでしょうか？これを著者は「一般化線形モデル」のことであると説明しています（※ちなみに「一般線形モデル：General Linear Model」という似て微妙に異なる用語がある。「一般線形モデル：General Linear Model」は「分散分析／回帰分析／共分散分先など線形で表現可能なモデル」のことで、「一般化線形モデル：GLM＝Generalized Linear Model」は線形回帰を正規分布以外の分布にも一般化したモデル」のことで、ロジスティック回帰などがそれ）。一般化線形モデルという視点で見ると、T検定から回帰分析までさまざまな統計手法を、「基本的に同じ手法」として見なせると著者は主張しています。そして実際に1枚の図にまとめたのが、次の図です。

f:id:misshiki:20200124023745p:plain — 170ページにある「図表25　一般化線形モデルをまとめた1枚の表」を引用

　「カイ二乗検定」は「独立性の検定」を指していると思います。独立性の検定はクロス集計表とカイ二乗検定を使います。

層別解析と重回帰分析

　層別解析について、

「同様の小集団」つまり「層」ごとに区切って分析を行うことを層別解析と呼ぶ

と著者は説明しています。しかし、いつもきれいな層が取得できるわけでありませんよね。ある層の人数が多かったり少なかったりと、「層ごとに偏りがある」という問題が発生することがあります。これに対して著者は次のように説明しています。

こうした問題に対して重回帰分析は威力を発揮する。「性別によって点数が平均的に何点異なるのか」を推定すれば、層別に分けなくてもよくなるのである。

ロジスティック回帰

　重回帰分析は、データの目的変数（結果変数）が気温のような連続値である必要があります。あり／なしといった二値などのカテゴリカルな値の場合は、ロジスティック回帰を使うことになります。著者はロジスティック回帰を次のように説明しています。

もともと0か1かという二値の結果変数を変換し、連続的な変数として扱うことで重回帰分析を行えるようにした、というのがロジスティック回帰の大まかな考え方である。

　因果関係の推論において、2つ以上の要因がある場合には交互作用が含まれる課題が生じることがあります。この場面で役立つのが傾向スコアです。著者は次のように説明しています。

傾向スコアとは、興味のある二値の説明変数について「どちらに該当するか」という確率（＝傾向を示す値）のこと

　「傾向スコア自体は、すでに紹介したロジスティック回帰によって簡単に得ることができる」そうです。

統計学の6つの流派と2つの論者

　統計学に対する言説は分野ごとに特徴があるとのことです。著者は、以下の6つを取り上げています。

実体把握を行う「社会調査法」：
「正確さ」を追究する（＝偏りや誤差が可能な限り小さくなる推定値を効率よく求める）。伝統的な統計学の使い方
原因究明のための「疫学・生物統計学」：
「妥当な判断」を求める（＝p値に基づいて「原因」が見つかるなら、そこまでの正確さにこだわらない）
抽象的なものを測定する「心理統計学」：
目に見えない「抽象的なもの（心や精神など）」を測定する。因子分析を生み出した。回帰分析の他、パス解析を好む。質問紙尺度の作成に心血を注ぐ
機械的分類のための「データマイニング」：
「予測」に役立つ。マーケティングやデータ処理の「現場」で生まれた。1993年黎明期のバスケット分析は有名だが、統計的にはカイ二乗検定の方がより良い。人工知能もこの分野で、ニューラルネットワークやサポートベクタマシン、クラスター分析といった手法がある
自然言語処理のための「テキストマイニング」：
自然言語で書かれた文章を統計学的に分析すること。辞書を使って文章を単語に分ける形態素解析や、辞書を使わないN-Gramといった手法がある
演繹に関心をよせる「計量経済学」：
帰納（個別事例から一般法則を導く方法）に関心をよせる「統計学」とは目的が違う。演繹できないモデルは経済学の進歩に役立たないので、あらゆる手段を用いて当てはまりのよいモデルを作ろうとする

　また、上記の分野をまたいで、「確率自体の考え方」について2つの対立軸を提示しています。

頻度論者： 普通の統計学。シンプルに考えて「観測したデータを基に予測する」
ベイズ論者： ベイズ統計学。合理的に考えて「事前確率を加味して事後確率を予測する」

まとめ

　他にも有用な内容はありましたが、わたしが気になったのは上記の内容でした。

2020-01-10

GitHub Sponsors（オープンソース活動のクラウドファンディング）を始めてみた

意見と感想自作ソフト

2019年5月14日から、GitHub Sponsors（GitHubスポンサー）という機能がGitHubで利用可能です。

・GitHub Sponsorsの公式サイトはこちら（下の図）

f:id:misshiki:20200110155029p:plain — GitHub Sponsorsの公式ページ（キャプチャして引用）

GitHub Sponsorsはいわば、コードをオープンソースで書く人を金銭的に支援するための機能です。イメージ的には、Kickstarterなどのクラウドファンディングのように、気に入ったプロジェクトや人、活動を金銭的に支援して、活動の成功を見守り、対価（リターン）として何らかのサービスを教授できるサービスです。

オープンソース活動の場合の対価は、通常は物ではなく、「優先的にGitHub Issuesやプルリクエストなどに対応してもらう」といった「権利」提供型サービスになるのかなと思います。どれくらいの金額支援に対してはどれくらいのサービスを提供するかはTierという形で、オープンソース開発者／プロジェクト側で作成します。特にTierの基準は用意されていないので、近しいプロジェクトの事例などを参考にしてオリジナルものを作る必要があります。

通常のクラウドファンディングと違うのは、支援が1回きりではなく、毎月で、止めるまで継続されるサブスクリプション制であるという点です。1回のみの支援というオプションはあえて用意されていません。

日本でも何人かはやっている人はいるみたいです。ただし多くはなく、広まっていないようですね。というのも、

オープンソース貢献者個人への金銭的支援を可能にする「GitHub Sponsors」 | スラドオープンソース

というスレッドで話題になったのですが、GitHub Sponsorsのサブスクリプションが、ライブパフォーマンスで受け取る「投げ銭」（＝コンテンツ提供者への金銭提供）と同じで、そのような投げ銭をネット上で行うことは、資金決済法における「為替取引」に該当する可能性があり、法律的に禁止されているから、という意見が以前から多くあるからではないかなと思います。

ちなみに（投げ銭ではなく）「電子決済」であれば、「資金移動」に該当するので、プラットホーム運営者が資金移動業に登録する必要があるようです（例えば電子決済サービスの「ペイペイ」は資金移動業に登録済みなので、個人間でお金の受け渡しができます。もしくは「資金移動」の法律を回避するために、いったんポイントなどを購入してもらい、そのポイントを人に渡す（例：はてなポイント）という方法を採用するケースも多いみたいです）。ただしGitHub Sponsorsのサブスクリプションは、「電子決済」というより、どちらかというと「投げ銭」に近いと思いますが。むしろ「サブスクリプション」と呼んでいるように、（投げ銭ですらなく）「特典の定期購入」だとは個人的に思っています。

状況はクラウドファンディングに近いと思うので、その解説の一つで「Readyfor（レディーフォー）：クラウドファンディングの種類」（下の図）を見ると、

f:id:misshiki:20200110155057p:plain — Readyforのクラウドファンディングの種類ページ（キャプチャして引用）

GitHub Sponsorsのサブスクリプションは、先ほど書いたように「権利の定期購入」と見るのならば「購入型」に該当するのかなと考えています。一切の特典（権利）を渡さず、手紙やメールでお礼を言うぐらいであれば「寄付型」なのかなと思っています。

※以上、思っていることを書きましたが、法律については無知なので、詳しくは法律家に相談してみてください。わたしは本稿の内容に対して一切の責任を取りません。ちなみに自分も「弁護士ドットコム：ソフトウェア開発者への金銭的支援と、資金決済法について」に質問してみましたが、「クラウドファンディングのような方法で資金を集める場合に、……、対価が質問にあるような特典（例：毎月2000円なら開発者側ページに『名前／ロゴ』が掲載される特典）であれば、金融商品取引法の規制対象とはならず、せいぜい特定商取引法の通信販売の規制対象となるだけだろうと思います。」「寄付や投げ銭であれば、規制はありませんが、寄付を受けた金額が年間で110万円を超えれば、超えた部分に贈与税がかかります。」という回答がつきました（※あくまでネット上にある一つの意見であり、これを読んで取った行動は全て自己責任です。念のため）。

前置きが長かったですが、たまに「無料でこれ提供してくれてありがとう。お金払いたいぐらいだよ」と書き込みされることがあったので、試しに自分もGitHub Sponsorsに申請してみました。で、できたページが下記のリンク先です。

- Sponsor @isshiki on GitHub Sponsors

申請してみたい人向けにもう少し体験を書いておくと、申請してもすぐに始まるわけではなく、承認や口座や、米国での課税を免除してもらうためのW-8BENを電子的に記入して提出する必要など、工程がたくさんありました（参考：「Setting up GitHub Sponsors for your user account - GitHub ヘルプ」）。1カ月近くかかるのを見積もった方がいいです。

しかも申請書類が全て英語で、よく分からない。特に難しかったのは、「What are your pronouns?（あなたの代名詞は何ですか？）」という質問。代名詞って「最強の四番打者」とかかと思ったんだけど、たぶん言葉通りに「My pronouns are he him his」と答えるのだと思います（※確信はないです）。恐らくこれは性別問題と関係していて、男性でも「she her hers」と言ってもらいたい人もいるとかかなと思うので。これは英語を文化面も含めて知らないと答えられないですよね。

もう一つがW-8BENで、赤枠で囲まれている欄だけ記入すればよいと思います。記入内容は「( 2019最新版） W8benの書き方完全ガイド / マイナンバー対応 | 稼ぎたい人のためのストックフォト副業ログ」を参考にしました。

GitHub Sponsorsは海外でやっている人でもそこまで多くの支援者が付いているわけではないので、現状のままだと流行ることなく終わりそうという気がしてしまいますね。自分も誰も付かないだろうな...。

それよりも日本人はGitHubスターをあまりつけないらしくて、それでも米国などとの差が出ているって何かで読んだのですが、「まずはみんな気に入ったら気軽にGitHubスターを押す習慣を持とう」という運動が日本で始まればいいなと思っています。自分もほとんどスター押してないから人のことは言えないです。

2020-01-09

第4回 Jetsonユーザー会「Jetson Nano超入門」著者パネルディスカッション＋LT大会聴講ノート

Jetson AI ＆機械学習

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

第4回 Jetsonユーザー会「Jetson Nano超入門」著者パネルディスカッション＋LT大会 - connpass に参加しました。

19:40　 NVIDIA社から

19:50 発表開始 (30分）パネルディスカッション :

Jetson Nano 超入門

Jetsonで何をさせたらおもしろい？

メディアプレイヤー
物体検出は多いが、3Dをグリグリ動かすアプリケーション
画像のディープラーニングでの検出・認識など。ラズパイカメラが標準で使えるので
GPIOはラズパイを意識した作りなので、逆にラズパイにできないことを

Jetson nanoや後継Xavier NXなどのエッジAIデバイスの可能性は？

センサーではないものが検出できる。例えば人の表情でまぶしそうだから照明を調整するなど
推論はデバイスにやらせるという分業が進んでいく。モデルを作る人とアプリを作り人は別に
個人で安くて手に入るので、それを活かして、教育的な活用を進めてほしい
自分だけのカメラが作れるのでは。AIで画風変化とか
PHS（プリントしてはんこシテスキャンする）の自動化？

AIエッジデバイスの産業用途

Jetson nanoをオススメしているが、AIの解釈性の問題などで実現にいたらない。ミッションクリティカルな場面では難しいだろうが、こうすれば使えるなどのユースケースは必要
TX1/TX2ではフルオートメーション、AI監視カメラ、インフラ管理などでの活用は多いが、あまり公開される実例情報としては世の中に出てきにくい
エッジコンピューティングについては日本が世界をリードしてほしい
AIを使いこなす会社が結局は伸びていくのではないかと思う

Jetsonシリーズに期待すること

継続的に提供してほしい。JetPackの提供が終わってしまうなどがないように（JetPackのアップデートは最新のものを使っておくべき）
情報が少ないのが不満
少し高い。普及することで安くなるのでは
ラズパイと比べると、使える周辺機器が少ない。一工夫しないと使えないので、今後は使えるものが増えるとうれしい
オーディオ関係が弱い。ラズパイと同じくらい気軽に使いたい
MicroSDカードの差し替えが頻繁だと壊れやすいので、MicroSDカードの延長ケーブルを使うとよい

汎用AIは実現するのか？

汎用AIといわれてもイメージできない
ドラえもんを作るのは10年後はまだできないと思うけど…
このまま技術を積み重ねていけばできるのではないのか
中身は計算式なので、コンピューティングパワーがまだまだ足りないので、しばらく無理だと思う
生きているうちにドラえもんを見てみたいが、今は虫みたいなものなので、もうワンステップした別理論が必要。だから100年単位が必要だと思う
ドラえもんが出してくれるアイテムの方に興味がある。ほんにゃくこんにゃくなど
複数のセンサーやAIを組み合わせる「マルチモーダル」なAIロボットであれば5年後にはできるだろう

20:40 LT (3枠）(5分）USAHIROU Jetson NanoでJetbotならぬROS対応のRotsonを作ったよ

Jetson Nano+ROS＝Rotson

(5分）LT枠: Deep Stream系

NVIDIA DeepStream SDK | NVIDIA Developer
OpenCVじゃなぜだめか：時間軸の概念がない、CPUリソースを食う
Yoloでの物体検知をやってみる（デモ）
例：Jetson NanoでDeepStreamを使ってYOLOv3-tinyを動かす - やってみた！

資料だけではわかりにくい点もあるかと思いますので、話した内容等は別途ブログにまとめる予定です

第4回 Jetsonユーザー会 LT 『Jetson nanoでDeepStreamを使ってみた』 from JunOhashi

(5分）LT枠: Jetson NanoとGR-ROSEで始めるROS2

LT枠全体

2019-12-23

良資料の紹介「『ダメな科学』を見分けるための大まかな指針」

備忘録統計

ネットサーフィン中にたまたま見つけた資料ですが、良いと思ったので個人的な備忘録も含めての紹介です。

大本（英語）のソース： A Rough Guide to Spotting Bad Science – Compound Interest
日本語化のソース：「ダメな科学」を見分けるための大まかな指針」のポスター - うさうさメモ

「『ダメな科学』を見分けるための大まかな指針」というポスターを見たことがあるでしょうか？ 2014年とちょっと古いですが...。以下は上記の「日本語化のソース」から引用したポスターです。両方とも「Creative Commons — 表示 - 非営利 - 改変禁止」に従って再配布可能のようです（詳しくは上記のリンク先を確認してください）。

うさうさメモに、それぞれの項目の内容が詳しく解説されています。下記リンク先を参照してください。

1. 扇情的な見出し、2. 結果の曲解 - うさうさメモ
3. 利益相反 - うさうさメモ
4. 相関関係と因果関係の混同 - うさうさメモ
5. 推測表現　（おまけ：「科学的風だけど実は科学的証拠ではないもの」の例） - うさうさメモ
6. 小さすぎるサンプルサイズ、7. 代表的でないサンプル - うさうさメモ
8. 対照群がない、9. 盲検試験が行われていない - うさうさメモ
（10. 結果のいいとこ取り、11. 結果に再現性がない、12. ジャーナルと引用数、は解説がないみたい）

2019-12-16

統計検定2級に合格！私の勉強方法と試験対策

意見と感想統計

ちょっとずつ閲覧数が増えてきたので、2級合格までに実践してきた勉強法と試験対策について大幅に追記しました（2020年3月24日）。元々書いていた「 2級合格体験と今後の目標」は後ろに回しました。

理解するための勉強方法

私の場合、理解するための勉強と試験対策は違う勉強の仕方が必要だと感じました。まずは2～3カ月かけて基礎をしっかりと理解すること。その根幹となるのが、正規分布関連から、カイ二乗検定、T検定までを完全に理解することです。これを行うために、以下の順番で勉強しました。特に「完全独習　統計学入門」は真剣に読み込みました。

『マンガでわかる統計学素朴な疑問からゆる~く解説』：最初に読んだ。前半は分かりやすいけど、説明が弱い部分がところどころあって一読で全部理解するのは難しい。まず一読して雰囲気をつかむという使い方がお勧め。
『完全独習　統計学入門』： T検定、カイ2乗検定までが、ステップバイステップですんなり理解できる。3回も読むと統計学の基礎知識が分かるので一番お勧め。オーディオブックもあり、併用すると便利。
「予備校のノリで学ぶ「大学の数学・物理」【確率統計】再生リスト」：上記の完全独習を理解してから、これを視聴すると、より深く理解できる。講義がメチャクチャ分かりやすい。繰り返し視聴すると知識が定着する。その後で、再度、上記のマンガに戻ると「そういうことだったのか」と理解できる。

ここまでで50％ぐらいの勉強が完了です。この後、次の公式書籍にざっと目を通して、試験を受けるには全然知識が足りないことに慌てました。

『改訂版日本統計学会公式認定統計検定2級対応統計学基礎』

基本的には、あまり評判の良くないこの教科書で勉強しましたが、補足で下記の動画やWeb記事を読んだりしました。

「予備校のノリで学ぶ「大学の数学・物理」【確率統計】再生リスト」：ベイズの定理、ポアソン分布、回帰分析（最小二乗法）あたりはこの動画で学べます。
「全人類がわかる統計学 | 統計学入門から、多変量解析、Rでの解析まで。とにかくわかりやすく！」

とりあえず勉強はここまでで100％です。一通り理解したら、すぐに試験対策に入った方がいいです。試験対策の期間が長いほど有利です。

試験対策

試験対策で最初に取り組んだのが、下記の書籍です。Kindle Unlimitedにより無料で読めたからです。タダだからと思って何気に読み始めたら、これが非常に秀逸でした。実は、上記の勉強の後半で足りなかった部分の大半はこの本で身に付けたといっても過言ではないです。

『統計検定２級合格のツボ』

でも試験対策に乗り出したのが、試験の2週間前で、もっと効率的に学びたい、と思っていたところ、下記の動画コンテンツ（いずれも Yuya.K_ASN 氏のYouTubeチャンネル）を見つけました。これが上記の試験対策本を超えて優秀でした。これを試験の2カ月前から繰り返し視聴すれば、合格は間違いないと思います。

※これらが扱っているのは過去問です。視聴するには、過去問の本も購入する必要があります。

『日本統計学会公式認定統計検定 2級公式問題集[2017〜2019年] 』

また、Yuya.K_ASN 氏のYouTube動画では、「どの問題でどの検定を使うか」などの資料に、下記の本を使っていますね。一応、私も買いましたが、演習問題は解いてないです...。

『統計学演習』
「『統計学演習』 - YouTube」

もし最短かつ最安で2級に受かることだけを考えるなら、過去問を買って、Yuya.K_ASN 氏のYouTubeチャンネルの「【2017年6月】統計検定2級解説」再生リストだけを繰り返し視聴すれば、余裕で受かると思います。でも、目的としてしっかりと統計学を身に付けたい場合は、地道に勉強していくことをお勧めします。

以上、自分が感じている「これを勉強したら合格できるよ」という内容の暴露です。せっかく方法を公開したので、誰かのお役に立てればうれしいです。

2級合格体験と今後の目標

2019年11月24日（日曜日）に統計検定2級を受験して合格。本日、Webで合格発表がありました。

統計検定2級に合格しました。
だけど、出題範囲が広くて試験までの勉強時間が足りず、一部の出題範囲は一夜漬だったので、もうちょっと勉強を継続します。
2020年6月21日の試験で準1級を目指します。 pic.twitter.com/FE7KvsJxYC
— Masahiko Isshiki (@isshiki) 2019年12月16日

AI・機械学習をやるうえで必須かと思い、今年の6月ぐらいから徐々に統計学の勉強を始めました。統計学を学んでみると、「機械学習のこれは、統計学のこれのことか」と気付くことが多く、勉強して良かったと思っています。

もう一つの収穫は、統計学の基礎が理解できることと、実践にまで応用できることには開きがあると、実際の問題を解き始めて気付いたことです。実際に問題を前にすると難しく、まだまだだと反省させられます（慣れてくると、問題パターンから解答パターンがある程度は見えてきてしまう感じがしましたが……たぶんそれは2級レベルだから。準1級、1級はもっと難しいのかと）。

ちなみに2級の合格率は43.7％ぐらいみたいです。→参考：受験データ 2018年6月17日試験｜統計検定：Japan Statistical Society Certificate これが準１級の合格率になると20.2％と半分以下にまで下がるのでかなりの難関みたいです。今回のようなつけ刃は通用しないと思うので、もう一度、2級までの内容が完璧になるように、再学習してから、来年6月の準１級の試験に臨みたいと思います。

最終的には1級取得を目指しています。できれば1年後...。

15：00～15：55 セッション1 データ/AIのビジネス活用への勘所

16：00～16：55氏 セッション２ 大学の実践的な教育への取り組みと企業との連携

17：05～18：15 セッション3 Data・AI－Readyな社会を私たちが創ってゆくために

15:00 - 16:00 講演『産学連携教育への挑戦～滋賀大データサイエンス学部１期生と共に歩んだ４か月』

産学連携ゼミの狙い（河本氏）

参加者アンケートの結果について（ディスカッション）

インテージが産学連携ゼミに参画した理由（小金氏）

学生時代にビジネスシーンをイメージすることの必要性（湊氏）

16:00 - 17:00 パネルディスカッション

人材育成について産学連携のToBe像

日本に必要なモデルは？

書籍紹介

概要紹介と感想

統計学が最強の武器になるワケ

全数調査 vs サンプリング調査

ランダム化

「平凡への回帰」と回帰分析

層別解析と重回帰分析

ロジスティック回帰

統計学の6つの流派と2つの論者

まとめ

19:40 NVIDIA社から

19:50 発表開始 (30分）パネルディスカッション :

Jetsonで何をさせたらおもしろい？

Jetson nanoや後継Xavier NXなどのエッジAIデバイスの可能性は？

AIエッジデバイスの産業用途

Jetsonシリーズに期待すること

汎用AIは実現するのか？

20:40 LT (3枠）(5分）USAHIROU Jetson NanoでJetbotならぬROS対応のRotsonを作ったよ

(5分）LT枠: Deep Stream系

(5分）LT枠: Jetson NanoとGR-ROSEで始めるROS2

LT枠全体

理解するための勉強方法

試験対策

2級合格体験と今後の目標

15：00～15：55　セッション1　データ/AIのビジネス活用への勘所

16：00～16：55氏　セッション２　大学の実践的な教育への取り組みと企業との連携

17：05～18：15　セッション3　Data・AI－Readyな社会を私たちが創ってゆくために

19:40　 NVIDIA社から