いっしきまさひこBLOG

AI・機械学習関連、Web制作関連、プログラミング関連、旅行記録などなど。一色政彦。

Colab内にインストール済みのPythonパッケージ一覧

「Colabには最初から数百のPythonパッケージがインストール済み」という説明があったので、ふと思い付いて一覧にしてみました。実際には381個のパッケージがありました。

方法は、Colab上で!pip freezeコマンドを打つだけ。

なお、2020/03/14時点CPU版VMのものです。GPU/TPU版のVMだと違う結果かもしれません。念のため。

以下では、取得したパッケージ名を基にPyPIのサイトへのリンクと概要を自動作成して、概要は日本語に機械翻訳したバージョンも載せました。

※ちなみにこれを実施するプログラムはC#で書きました(ColabのPyPIパッケージを一覧にするC#コード)。

※「en-core-web-sm」「screen-resolution-extra」「xkit」の3つのパッケージがPyPI上では見つからなかったです。仕方ないので、それぞれ!pip show xxxして概要情報とホームページリンクを取得して手動で書き換えました。

Colab内にインストール済みのPythonパッケージ一覧

  • absl-py==0.9.0:
     Abseil Python Common Libraries, see https://github.com/abseil/abseil-py.
     Abseil Python Common Libraries、https://github.com/abseil/abseil-pyを参照してください。
  • alabaster==0.7.12:
     A configurable sidebar-enabled Sphinx theme
     構成可能なサイドバー対応のSphinxテーマ
  • albumentations==0.1.12:
     Fast image augmentation library and easy to use wrapper around other libraries
     高速な画像増強ライブラリと他のライブラリの周りの使いやすいラッパー
  • altair==4.0.1:
     Altair: A declarative statistical visualization library for Python.
     Altair:Python用の宣言型統計可視化ライブラリ。
  • asgiref==3.2.3:
     ASGI specs, helper code, and adapters
     ASGI仕様、ヘルパーコード、およびアダプター
  • astor==0.8.1:
     Read/rewrite/write Python ASTs
     Python ASTの読み取り/書き換え/書き込み
  • astropy==4.0:
     Community-developed python astronomy tools
     コミュニティが開発したpython天文学ツール
  • atari-py==0.2.6:
     Python bindings to Atari games
     AtariゲームへのPythonバインディング
  • atomicwrites==1.3.0:
     Atomic file writes.
     アトミックファイルの書き込み。
  • attrs==19.3.0:
     Classes Without Boilerplate
     定型のないクラス
  • audioread==2.1.8:
     multi-library, cross-platform audio decoding
     マルチライブラリ、クロスプラットフォームオーディオデコーディング
  • autograd==1.3:
     Efficiently computes derivatives of numpy code.
     numpyコードの導関数を効率的に計算します。
  • Babel==2.8.0:
     Internationalization utilities
     国際化ユーティリティ
  • backcall==0.1.0:
     Specifications for callback functions passed in to an API
     APIに渡されるコールバック関数の仕様
  • backports.tempfile==1.0:
     Backport of new features in Python's tempfile module
     Pythonのtempfileモジュールの新機能のバックポート
  • backports.weakref==1.0.post1:
     Backport of new features in Python's weakref module
     Pythonのweakrefモジュールの新機能のバックポート
  • beautifulsoup4==4.6.3:
     Screen-scraping library
     スクリーンスクレイピングライブラリ
  • bleach==3.1.0:
     An easy safelist-based HTML-sanitizing tool.
     簡単なセーフリストベースのHTMLサニタイズツール。
  • blis==0.2.4:
     The Blis BLAS-like linear algebra library, as a self-contained C-extension.
     自己完結型のC拡張としてのBlis BLASのような線形代数ライブラリ。
  • bokeh==1.4.0:
     Interactive plots and applications in the browser from Python
     Pythonのブラウザでのインタラクティブなプロットとアプリケーション
  • boto==2.49.0:
     Amazon Web Services Library
     アマゾンウェブサービスライブラリ
  • boto3==1.11.15:
     The AWS SDK for Python
     Python用AWS SDK
  • botocore==1.14.15:
     Low-level, data-driven core of boto 3.
     boto 3の低レベルのデータ駆動型コア。
  • Bottleneck==1.3.1:
     Fast NumPy array functions written in C
     Cで記述された高速NumPy配列関数
  • branca==0.3.1:
     Generate complex HTML+JS pages with Python
     Pythonで複雑なHTML + JSページを生成する
  • bs4==0.0.1:
     Dummy package for Beautiful Soup
     ビューティフルスープのダミーパッケージ
  • bz2file==0.98:
     Read and write bzip2-compressed files.
     bzip2で圧縮されたファイルを読み書きします。
  • cachetools==3.1.1:
     Extensible memoizing collections and decorators
     拡張可能なメモ化コレクションとデコレーター
  • certifi==2019.11.28:
     Python package for providing Mozilla's CA Bundle.
     MozillaのCAバンドルを提供するPythonパッケージ。
  • cffi==1.14.0:
     Foreign Function Interface for Python calling C code.
     Cコードを呼び出すPythonの外部関数インターフェイス。
  • chainer==6.5.0:
     A flexible framework of neural networks
     ニューラルネットワークの柔軟なフレームワーク
  • chardet==3.0.4:
     Universal encoding detector for Python 2 and 3
     Python 2および3のユニバーサルエンコーディングディテクター
  • chart-studio==1.0.0:
     Utilities for interfacing with plotly's Chart Studio
     plotlyのChart Studioとインターフェイスするためのユーティリティ
  • Click==7.0:
     Composable command line interface toolkit
     構成可能なコマンドラインインターフェイスツールキット
  • cloudpickle==1.2.2:
     Extended pickling support for Python objects
     Pythonオブジェクトの拡張picklingサポート
  • cmake==3.12.0:
     CMake is an open-source, cross-platform family of tools designed to build, test and package software
     CMakeは、ソフトウェアを構築、テスト、およびパッケージ化するために設計されたオープンソースのクロスプラットフォームファミリのツールです。
  • colorlover==0.3.0:
     Color scales for IPython notebook
     IPythonノートブックのカラースケール
  • community==1.0.0b1:
     merge together wellness checks to unify your shit
     あなたのたわごとを統合するためにウェルネスチェックをマージします
  • contextlib2==0.5.5:
     Backports and enhancements for the contextlib module
     contextlibモジュールのバックポートと機能強化
  • convertdate==2.2.0:
     Converts between Gregorian dates and other calendar systems.Calendars included: Baha'i, French Republican, Hebrew, Indian Civil, Islamic, ISO, Julian, Mayan and Persian.
     グレゴリオ暦の日付と他のカレンダーシステムとの間で変換します。カレンダーには次が含まれます:Baha' i、フランス共和党、ヘブライ語、インド市民、イスラム、ISO、ジュリアン、マヤ、ペルシャ。
  • coverage==3.7.1:
     Code coverage measurement for Python
     Pythonのコードカバレッジ測定
  • coveralls==0.5:
     Show coverage stats online via coveralls.io
     coveralls.ioを介してカバレッジ統計をオンラインで表示します
  • crcmod==1.7:
     CRC Generator
     CRCジェネレーター
  • cufflinks==0.17.0:
     Productivity Tools for Plotly + Pandas
     Plotly + Pandasの生産性向上ツール
  • cvxopt==1.2.4:
     Convex optimization package
     凸最適化パッケージ
  • cvxpy==1.0.25:
     A domain-specific language for modeling convex optimization problems in Python.
     Pythonの凸最適化問題をモデル化するためのドメイン固有の言語。
  • cycler==0.10.0:
     Composable style cycles
     構成可能なスタイルサイクル
  • cymem==2.0.3:
     Manage calls to calloc/free through Cython
     Cythonを介してcalloc / freeへの呼び出しを管理する
  • Cython==0.29.15:
     The Cython compiler for writing C extensions for the Python language.
     Python言語のC拡張を記述するためのCythonコンパイラ。
  • daft==0.0.4:
     PGM rendering at its finest
     最高のPGMレンダリング
  • dask==2.9.2:
     Parallel PyData with Task Scheduling
     タスクスケジューリングを使用した並列PyData
  • dataclasses==0.7:
     A backport of the dataclasses module for Python 3.6
     Python 3.6のdataclassesモジュールのバックポート
  • datascience==0.10.6:
     A Jupyter notebook Python library for introductory data science
     データサイエンスの入門用のJupyterノートブックPythonライブラリ
  • decorator==4.4.1:
     Decorators for Humans
     人間用デコレータ
  • defusedxml==0.6.0:
     XML bomb protection for Python stdlib modules
     Python stdlibモジュールのXML爆弾保護
  • descartes==1.1.0:
     Use geometric objects as matplotlib paths and patches
     matplotlibのパスとパッチとしてジオメトリオブジェクトを使用する
  • dill==0.3.1.1:
     serialize all of python
     すべてのpythonをシリアル化する
  • distributed==1.25.3:
     Distributed scheduler for Dask
     Daskの分散スケジューラー
  • Django==3.0.3:
     A high-level Python Web framework that encourages rapid development and clean, pragmatic design.
     迅速な開発とクリーンで実用的な設計を促進する高レベルのPython Webフレームワーク。
  • dlib==19.18.0:
     A toolkit for making real world machine learning and data analysis applications
     現実世界の機械学習およびデータ分析アプリケーションを作成するためのツールキット
  • dm-sonnet==1.35:
     Sonnet is a library for building neural networks in TensorFlow.
     Sonnetは、TensorFlowでニューラルネットワークを構築するためのライブラリです。
  • docopt==0.6.2:
     Pythonic argument parser, that will make you smile
     Pythonic argument parser、それはあなたを笑顔にします
  • docutils==0.15.2:
     Docutils -- Python Documentation Utilities
     Docutils-Pythonドキュメントユーティリティ
  • dopamine-rl==1.0.5:
     Dopamine: A framework for flexible Reinforcement Learning research
     ドーパミン:柔軟な強化学習研究のフレームワーク
  • earthengine-api==0.1.213:
     Earth Engine Python API
     Earth Engine Python API
  • easydict==1.9:
     Access dict values as attributes (works recursively).
     属性としてdict値にアクセスします(再帰的に機能します)。
  • ecos==2.0.7.post1:
     This is the Python package for ECOS: Embedded Cone Solver. See Github page for more information.
     これはECOS:Embedded Cone Solver用のPythonパッケージです。詳細については、Githubページを参照してください。
  • editdistance==0.5.3:
     Fast implementation of the edit distance(Levenshtein distance)
     編集距離(レーベンシュタイン距離)の高速実装
  • en-core-web-sm==2.1.0:
     Does not exist in PyPI index! English multi-task CNN trained on OntoNotes. Assigns context-specific token vectors, POS tags, dependency parse and named entities.
      PyPIインデックスには存在しません! OntoNotesでトレーニングされた英語のマルチタスクCNN。コンテキスト固有のトークンベクトル、POSタグ、依存関係解析、および名前付きエンティティを割り当てます。
  • entrypoints==0.3:
     Discover and load entry points from installed packages.
     インストールされたパッケージからエントリポイントを検出してロードします。
  • et-xmlfile==1.0.1:
     An implementation of lxml.xmlfile for the standard library
     標準ライブラリのlxml.xmlfileの実装
  • fa2==0.3.5:
     The fastest ForceAtlas2 algorithm for Python (and NetworkX)
     Python(およびNetworkX)用の最速のForceAtlas2アルゴリズム
  • fancyimpute==0.4.3:
     Matrix completion and feature imputation algorithms
     行列補完と特徴補完アルゴリズム
  • fastai==1.0.60:
     fastai makes deep learning with PyTorch faster, more accurate, and easier
     fastaiはPyTorchでディープラーニングをより速く、より正確に、より簡単に
  • fastdtw==0.3.4:
     Dynamic Time Warping (DTW) algorithm with an O(N) time and memory complexity.
     O(N)時間とメモリの複雑さを備えたDynamic Time Warping(DTW)アルゴリズム。
  • fastprogress==0.2.2:
     A nested progress with plotting options for fastai
     fastaiのプロットオプションを含むネストされた進行状況
  • fastrlock==0.4:
     Fast, re-entrant optimistic lock implemented in Cython
     Cythonに実装された高速で再入可能な楽観的ロック
  • fbprophet==0.5:
     Automatic Forecasting Procedure
     自動予測手順
  • feather-format==0.4.0:
     Simple wrapper library to the Apache Arrow-based Feather File Format
     Apache ArrowベースのFeather File Formatへのシンプルなラッパーライブラリ
  • featuretools==0.4.1:
     a framework for automated feature engineering
     自動機能エンジニアリングのフレームワーク
  • filelock==3.0.12:
     A platform independent file lock.
     プラットフォームに依存しないファイルロック。
  • fix-yahoo-finance==0.0.22:
     Yahoo! Finance market data downloader +fix for Pandas Datareader's get_data_yahoo()
     Yahoo!金融市場データダウンローダー+ Pandas Datareaderのget_data_yahoo()の修正プログラム
  • Flask==1.1.1:
     A simple framework for building complex web applications.
     複雑なWebアプリケーションを構築するためのシンプルなフレームワーク。
  • folium==0.8.3:
     Make beautiful maps with Leaflet.js & Python
     Leaflet.jsで美しい地図を作成& Python
  • fsspec==0.6.2:
     File-system specification
     ファイルシステムの仕様
  • future==0.16.0:
     Clean single-source support for Python 3 and 2
     Python 3および2のクリーンな単一ソースサポート
  • gast==0.2.2:
     Python AST that abstracts the underlying Python version
     基礎となるPythonバージョンを抽象化するPython AST
  • GDAL==2.2.2:
     GDAL: Geospatial Data Abstraction Library
     GDAL:地理空間データ抽象化ライブラリ
  • gdown==3.6.4:
     Google Drive direct download of big files.
     Googleドライブで大きなファイルを直接ダウンロードします。
  • gensim==3.6.0:
     Python framework for fast Vector Space Modelling
     高速ベクトル空間モデリングのためのPythonフレームワーク
  • geographiclib==1.50:
     The geodesic routines from GeographicLib
     GeographicLibの測地線ルーチン
  • geopy==1.17.0:
     Python Geocoding Toolbox
     Python Geocodingツールボックス
  • gevent==1.4.0:
     Coroutine-based network library
     コルーチンベースのネットワークライブラリ
  • gin-config==0.3.0:
     Gin-Config: A lightweight configuration library for Python
     Gin-Config:Python用の軽量構成ライブラリ
  • glob2==0.7:
     Version of the glob module that can capture patterns and supports recursive wildcards
     パターンをキャプチャでき、再帰的なワイルドカードをサポートするglobモジュールのバージョン
  • google==2.0.3:
     Python bindings to the Google search engine.
     Google検索エンジンへのPythonバインディング。
  • google-api-core==1.16.0:
     Google API client core library
     Google APIクライアントコアライブラリ
  • google-api-python-client==1.7.11:
     Google API Client Library for Python
     Python用Google APIクライアントライブラリ
  • google-auth==1.7.2:
     Google Authentication Library
     Google認証ライブラリ
  • google-auth-httplib2==0.0.3:
     Google Authentication Library: httplib2 transport
     Google認証ライブラリ:httplib2トランスポート
  • google-auth-oauthlib==0.4.1:
     Google Authentication Library
     Google認証ライブラリ
  • google-cloud-bigquery==1.21.0:
     Google BigQuery API client library
     Google BigQuery APIクライアントライブラリ
  • google-cloud-core==1.0.3:
     Google Cloud API client core library
     Google Cloud APIクライアントコアライブラリ
  • google-cloud-datastore==1.8.0:
     Google Cloud Datastore API client library
     Google Cloud Datastore APIクライアントライブラリ
  • google-cloud-language==1.2.0:
     Google Cloud Natural Language API client library
     Google Cloud Natural Language APIクライアントライブラリ
  • google-cloud-storage==1.16.2:
     Google Cloud Storage API client library
     Google Cloud Storage APIクライアントライブラリ
  • google-cloud-translate==1.5.0:
     Google Cloud Translation API client library
     Google Cloud Translation APIクライアントライブラリ
  • google-colab==1.0.0:
     Google Colaboratory tools
     Google Colaboratoryツール
  • google-pasta==0.1.8:
     pasta is an AST-based Python refactoring library
     パスタは、ASTベースのPythonリファクタリングライブラリです。
  • google-resumable-media==0.4.1:
     Utilities for Google Media Downloads and Resumable Uploads
     Google Mediaダウンロードおよび再開可能なアップロードのユーティリティ
  • googleapis-common-protos==1.51.0:
     Common protobufs used in Google APIs
     Google APIで使用される一般的なprotobufs
  • googledrivedownloader==0.4:
     Minimal class to download shared files from Google Drive.
     Googleドライブから共有ファイルをダウンロードするための最小限のクラス。
  • graph-nets==1.0.5:
     Library for building graph networks in Tensorflow and Sonnet.
     TensorflowおよびSonnetでグラフネットワークを構築するためのライブラリ。
  • graphviz==0.10.1:
     Simple Python interface for Graphviz
     Graphviz用のシンプルなPythonインターフェイス
  • greenlet==0.4.15:
     Lightweight in-process concurrent programming
     軽量のインプロセス並行プログラミング
  • grpcio==1.27.1:
     HTTP/2-based RPC framework
     HTTP / 2ベースのRPCフレームワーク
  • gspread==3.0.1:
     Google Spreadsheets Python API
     Google Spreadsheets Python API
  • gspread-dataframe==3.0.4:
     Read/write gspread worksheets using pandas DataFrames
     Pandas DataFramesを使用したgspreadワークシートの読み取り/書き込み
  • gunicorn==20.0.4:
     WSGI HTTP Server for UNIX
     UNIX用のWSGI HTTPサーバー
  • gym==0.15.6:
     The OpenAI Gym: A toolkit for developing and comparing your reinforcement learning agents.
     OpenAIジム:強化学習エージェントを開発および比較するためのツールキット。
  • h5py==2.8.0:
     Read and write HDF5 files from Python
     PythonからHDF5ファイルを読み書きする
  • HeapDict==1.0.1:
     a heap with decrease-key and increase-key operations
     キーの減少およびキーの増加操作を伴うヒープ
  • holidays==0.9.12:
     Generate and work with holidays in Python
     Pythonで休日を生成して操作する
  • html5lib==1.0.1:
     HTML parser based on the WHATWG HTML specification
     WHATWG HTML仕様に基づくHTMLパーサー
  • httpimport==0.5.18:
     Module for remote in-memory Python package/module loading through HTTP
     HTTPを介したリモートメモリ内Pythonパッケージ/モジュールロード用のモジュール
  • httplib2==0.11.3:
     A comprehensive HTTP client library.
     包括的なHTTPクライアントライブラリ。
  • httplib2shim==0.0.3:
     A wrapper over urllib3 that matches httplib2's interface
     httplib2のインターフェイスに一致するurllib3のラッパー
  • humanize==0.5.1:
     Python humanize utilities
     Pythonヒューマナイズユーティリティ
  • hyperopt==0.1.2:
     Distributed Asynchronous Hyperparameter Optimization
     分散非同期ハイパーパラメーターの最適化
  • ideep4py==2.0.0.post3:
     ideep4py is a wrapper for iDeep library.
     ideep4pyは、iDeepライブラリのラッパーです。
  • idna==2.8:
     Internationalized Domain Names in Applications (IDNA)
     アプリケーションの国際化ドメイン名(IDNA)
  • image==1.5.28:
     Django application that provides cropping, resizing, thumbnailing, overlays and masking for images and videos with the ability to set the center of attention,
     注目の中心を設定する機能を備えた画像や動画のトリミング、サイズ変更、サムネイル化、オーバーレイ、マスキングを提供するDjangoアプリケーション
  • imageio==2.4.1:
     Library for reading and writing a wide range of image, video, scientific, and volumetric data formats.
     広範囲の画像、ビデオ、科学、および体積データ形式を読み書きするためのライブラリ。
  • imagesize==1.2.0:
     Getting image size from png/jpeg/jpeg2000/gif file
     png / jpeg / jpeg2000 / gifファイルから画像サイズを取得する
  • imbalanced-learn==0.4.3:
     Toolbox for imbalanced dataset in machine learning.
     機械学習における不均衡なデータセットのツールボックス。
  • imblearn==0.0:
     Toolbox for imbalanced dataset in machine learning.
     機械学習における不均衡なデータセットのツールボックス。
  • imgaug==0.2.9:
     Image augmentation library for deep neural networks
     ディープニューラルネットワーク用の画像増強ライブラリ
  • importlib-metadata==1.5.0:
     Read metadata from Python packages
     Pythonパッケージからメタデータを読み取る
  • imutils==0.5.3:
     A series of convenience functions to make basic image processing functions such as translation, rotation, resizing, skeletonization, displaying Matplotlib images, sorting contours, detecting edges, and much more easier with OpenCV and both Python 2.7 and Python 3.
     変換、回転、サイズ変更、スケルトン化、Matplotlib画像の表示、輪郭のソート、エッジの検出などの基本的な画像処理機能をOpenCVとPython 2.7とPython 3の両方でさらに簡単にする一連の便利な機能
  • inflect==2.1.0:
     Correctly generate plurals, singular nouns, ordinals, indefinite articles; convert numbers to words
     複数形、単数名詞、序数、不定冠詞を正しく生成します。数字を単語に変換する
  • intel-openmp==2020.0.133:
     Intel(R) OpenMP Runtime Library
     Intel(R)OpenMPランタイムライブラリ
  • intervaltree==2.1.0:
     Editable interval tree data structure for Python 2 and 3
     Python 2および3の編集可能な間隔ツリーデータ構造
  • ipykernel==4.6.1:
     IPython Kernel for Jupyter
     Jupyter用IPythonカーネル
  • ipython==5.5.0:
     IPython: Productive Interactive Computing
     IPython:生産的なインタラクティブコンピューティング
  • ipython-genutils==0.2.0:
     Vestigial utilities from IPython
     IPythonのVestigialユーティリティ
  • ipython-sql==0.3.9:
     RDBMS access via IPython
     IPythonを介したRDBMSアクセス
  • ipywidgets==7.5.1:
     IPython HTML widgets for Jupyter
     Jupyter用のIPython HTMLウィジェット
  • itsdangerous==1.1.0:
     Various helpers to pass data to untrusted environments and back.
     信頼できない環境にデータをやり取りするさまざまなヘルパー。
  • jax==0.1.58:
     Differentiate, compile, and transform Numpy code.
     Numpyコードを区別、コンパイル、および変換します。
  • jaxlib==0.1.38:
     XLA library for JAX
     JAX用のXLAライブラリ
  • jdcal==1.4.1:
     Julian dates from proleptic Gregorian and Julian calendars.
     ユリウス暦は、予言的なグレゴリオ暦とユリウス暦から始まります。
  • jedi==0.16.0:
     An autocompletion tool for Python that can be used for text editors.
     テキストエディターに使用できるPython用のオートコンプリートツール。
  • jieba==0.42.1:
     Chinese Words Segmentation Utilities
     中国語セグメンテーションユーティリティ
  • Jinja2==2.11.1:
     A very fast and expressive template engine.
     非常に高速で表現力豊かなテンプレートエンジン。
  • jmespath==0.9.4:
     JSON Matching Expressions
     JSONマッチング式
  • joblib==0.14.1:
     Lightweight pipelining: using Python functions as pipeline jobs.
     軽量パイプライン処理:Python関数をパイプラインジョブとして使用します。
  • jpeg4py==0.1.4:
     libjpeg-turbo cffi bindings and helper classes
     libjpeg-turbo cffiバインディングとヘルパークラス
  • jsonschema==2.6.0:
     An implementation of JSON Schema validation for Python
     PythonのJSONスキーマ検証の実装
  • jupyter==1.0.0:
     Jupyter metapackage. Install all the Jupyter components in one go.
     Jupyterメタパッケージ。すべてのJupyterコンポーネントを一度にインストールします。
  • jupyter-client==5.3.4:
     Jupyter protocol implementation and client libraries
     Jupyterプロトコルの実装とクライアントライブラリ
  • jupyter-console==5.2.0:
     Jupyter terminal console
     Jupyterターミナルコンソール
  • jupyter-core==4.6.2:
     Jupyter core package. A base package on which Jupyter projects rely.
     Jupyterコアパッケージ。 Jupyterプロジェクトが依存するベースパッケージ。
  • kaggle==1.5.6:
     Kaggle API
     Kaggle API
  • kapre==0.1.3.1:
     Kapre: Keras Audio Preprocessors. Keras layers for audio pre-processing in deep learning
     Kapre:Kerasオーディオプリプロセッサ。ディープラーニングでのオーディオ前処理用のKerasレイヤー
  • Keras==2.2.5:
     Deep Learning for humans
     人間のための深層学習
  • Keras-Applications==1.0.8:
     Reference implementations of popular deep learning models
     一般的なディープラーニングモデルのリファレンス実装
  • Keras-Preprocessing==1.1.0:
     Easy data preprocessing and data augmentation for deep learning models
     ディープラーニングモデル用の簡単なデータ前処理とデータ増強
  • keras-vis==0.4.1:
     Neural Network visualization toolkit for keras
     Kerasのニューラルネットワーク視覚化ツールキット
  • kfac==0.2.0:
     K-FAC for TensorFlow
     TensorFlowのK-FAC
  • kiwisolver==1.1.0:
     A fast implementation of the Cassowary constraint solver
     ヒクイドリ制約ソルバーの高速実装
  • knnimpute==0.1.0:
     k-Nearest Neighbor imputation
     k最近傍代入
  • librosa==0.6.3:
     Python module for audio and music processing
     オーディオおよび音楽処理用のPythonモジュール
  • lightgbm==2.2.3:
     LightGBM Python Package
     LightGBM Pythonパッケージ
  • llvmlite==0.31.0:
     lightweight wrapper around basic LLVM functionality
     基本的なLLVM機能の軽量ラッパー
  • lmdb==0.98:
     Universal Python binding for the LMDB 'Lightning' Database
     LMDBのユニバーサルPythonバインディング' Lightning'データベース
  • lucid==0.3.8:
     Collection of infrastructure and tools for research in neural network interpretability.
     ニューラルネットワークの解釈可能性の研究のためのインフラストラクチャとツールのコレクション。
  • lunardate==0.2.0:
     A Chinese Calendar Library in Pure Python
     Pure Pythonの中国語カレンダーライブラリ
  • lxml==4.2.6:
     Powerful and Pythonic XML processing library combining libxml2/libxslt with the ElementTree API.
     libxml2 / libxsltとElementTree APIを組み合わせた強力でPythonicなXML処理ライブラリ。
  • magenta==0.3.19:
     Use machine learning to create art and music
     機械学習を使用してアートと音楽を作成する
  • Markdown==3.2.1:
     Python implementation of Markdown.
     MarkdownのPython実装。
  • MarkupSafe==1.1.1:
     Safely add untrusted strings to HTML/XML markup.
     信頼できない文字列をHTML / XMLマークアップに安全に追加します。
  • matplotlib==3.1.3:
     Python plotting package
     Pythonプロットパッケージ
  • matplotlib-venn==0.11.5:
     Functions for plotting area-proportional two- and three-way Venn diagrams in matplotlib.
     matplotlibで面積に比例した2方向および3方向のベン図をプロットするための関数。
  • mesh-tensorflow==0.1.9:
     Mesh TensorFlow
     メッシュTensorFlow
  • mido==1.2.6:
     MIDI Objects for Python
     Python用のMIDIオブジェクト
  • mir-eval==0.5:
     Common metrics for common audio/music processing tasks.
     一般的なオーディオ/音楽処理タスクの一般的なメトリック。
  • missingno==0.4.2:
     Missing data visualization module for Python.
     Pythonのデータ視覚化モジュールがありません。
  • mistune==0.8.4:
     The fastest markdown parser in pure Python
     純粋なPythonで最速のマークダウンパーサー
  • mizani==0.6.0:
     Scales for Python
     Pythonのスケール
  • mkl==2019.0:
     Math library for Intel and compatible processors
     Intelおよび互換プロセッサ用の数学ライブラリ
  • mlxtend==0.14.0:
     Machine Learning Library Extensions
     機械学習ライブラリの拡張
  • more-itertools==8.2.0:
     More routines for operating on iterables, beyond itertools
     itertoolsを超えて、iterableを操作するためのより多くのルーチン
  • moviepy==0.2.3.5:
     Video editing with Python
     Pythonを使用したビデオ編集
  • mpi4py==3.0.3:
     Python bindings for MPI
     MPIのPythonバインディング
  • mpmath==1.1.0:
     Python library for arbitrary-precision floating-point arithmetic
     任意精度の浮動小数点演算用のPythonライブラリ
  • msgpack==0.5.6:
     MessagePack (de)serializer.
     MessagePack(デ)シリアライザー。
  • multiprocess==0.70.9:
     better multiprocessing and multithreading in python
     Pythonでのマルチプロセッシングとマルチスレッドの改善
  • multitasking==0.0.9:
     Non-blocking Python methods using decorators
     デコレータを使用したノンブロッキングPythonメソッド
  • murmurhash==1.0.2:
     Cython bindings for MurmurHash
     MurmurHashのCythonバインディング
  • music21==5.5.0:
     A Toolkit for Computer-Aided Musical Analysis.
     コンピューター支援の音楽分析のためのツールキット。
  • natsort==5.5.0:
     Simple yet flexible natural sorting in Python.
     Pythonでのシンプルで柔軟な自然な並べ替え。
  • nbconvert==5.6.1:
     Converting Jupyter Notebooks
     Jupyterノートブックの変換
  • nbformat==5.0.4:
     The Jupyter Notebook format
     Jupyterノートブック形式
  • networkx==2.4:
     Python package for creating and manipulating graphs and networks
     グラフとネットワークを作成および操作するためのPythonパッケージ
  • nibabel==2.3.3:
     Access a multitude of neuroimaging data formats
     多数の神経画像データ形式にアクセス
  • nltk==3.2.5:
     Natural Language Toolkit
     自然言語ツールキット
  • notebook==5.2.2:
     A web-based notebook environment for interactive computing
     インタラクティブコンピューティングのためのWebベースのノートブック環境
  • np-utils==0.5.12.1:
     collection of utilities for array and list manipulation
     配列およびリストを操作するためのユーティリティのコレクション
  • numba==0.47.0:
     compiling Python code using LLVM
     LLVMを使用してPythonコードをコンパイルする
  • numexpr==2.7.1:
     Fast numerical expression evaluator for NumPy
     NumPyの高速数値評価
  • numpy==1.17.5:
     NumPy is the fundamental package for array computing with Python.
     NumPyは、Pythonを使用した配列コンピューティングの基本パッケージです。
  • nvidia-ml-py3==7.352.0:
     Python Bindings for the NVIDIA Management Library
     NVIDIA管理ライブラリのPythonバインディング
  • oauth2client==4.1.3:
     OAuth 2.0 client library
     OAuth 2.0クライアントライブラリ
  • oauthlib==3.1.0:
     A generic, spec-compliant, thorough implementation of the OAuth request-signing logic
     OAuth要求署名ロジックの一般的な仕様に準拠した完全な実装
  • okgrade==0.4.3:
     Simple alternative to okpy for grading only
     グレーディングのみのokpyのシンプルな代替
  • opencv-contrib-python==4.1.2.30:
     Wrapper package for OpenCV python bindings.
     OpenCV pythonバインディング用のラッパーパッケージ。
  • opencv-python==4.1.2.30:
     Wrapper package for OpenCV python bindings.
     OpenCV pythonバインディング用のラッパーパッケージ。
  • openpyxl==2.5.9:
     A Python library to read/write Excel 2010 xlsx/xlsm files
     Excel 2010 xlsx / xlsmファイルを読み書きするPythonライブラリ
  • opt-einsum==3.1.0:
     Optimizing numpys einsum function
     numpys einsum関数の最適化
  • osqp==0.6.1:
     OSQP: The Operator Splitting QP Solver
     OSQP:QPソルバーを分​​割する演算子
  • packaging==20.1:
     Core utilities for Python packages
     Pythonパッケージのコアユーティリティ
  • palettable==3.3.0:
     Color palettes for Python
     Pythonのカラーパレット
  • pandas==0.25.3:
     Powerful data structures for data analysis, time series, and statistics
     データ分析、時系列、統計のための強力なデータ構造
  • pandas-datareader==0.7.4:
     Data readers extracted from the pandas codebase,should be compatible with recent pandas versions
     パンダのコードベースから抽出されたデータリーダーは、最新のパンダバージョンと互換性があるはずです
  • pandas-gbq==0.11.0:
     Pandas interface to Google BigQuery
     Google BigQueryへのパンダインターフェイス
  • pandas-profiling==1.4.1:
     Generate profile report for pandas DataFrame
     Pandas DataFrameのプロファイルレポートを生成する
  • pandocfilters==1.4.2:
     Utilities for writing pandoc filters in python
     Pythonでpandocフィルターを作成するためのユーティリティ
  • parso==0.6.2:
     A Python Parser
     Pythonパーサー
  • pathlib==1.0.1:
     Object-oriented filesystem paths
     オブジェクト指向ファイルシステムのパス
  • patsy==0.5.1:
     A Python package for describing statistical models and for building design matrices.
     統計モデルを記述し、設計マトリックスを構築するためのPythonパッケージ。
  • pexpect==4.8.0:
     Pexpect allows easy control of interactive console applications.
     Pexpectを使用すると、インタラクティブコンソールアプリケーションを簡単に制御できます。
  • pickleshare==0.7.5:
     Tiny 'shelve'-like database with concurrency support
     並行性をサポートする小さな' shelve'のようなデータベース
  • Pillow==6.2.2:
     Python Imaging Library (Fork)
     Python Imaging Library(フォーク)
  • pip-tools==4.2.0:
     pip-tools keeps your pinned dependencies fresh.
     pip-toolsは、固定された依存関係を最新の状態に保ちます。
  • plac==0.9.6:
     The smartest command line arguments parser in the world
     世界で最もスマートなコマンドライン引数パーサー
  • plotly==4.4.1:
     An open-source, interactive graphing library for Python
     Python用のオープンソースのインタラクティブなグラフ作成ライブラリ
  • plotnine==0.6.0:
     A grammar of graphics for python
     Pythonのグラフィックスの文法
  • pluggy==0.7.1:
     plugin and hook calling mechanisms for python
     pythonのプラグインおよびフック呼び出しメカニズム
  • portpicker==1.3.1:
     A library to choose unique available network ports.
     使用可能な一意のネットワークポートを選択するライブラリ。
  • prefetch-generator==1.0.1:
     a simple tool to compute arbitrary generator in a background thread
     バックグラウンドスレッドで任意のジェネレーターを計算するシンプルなツール
  • preshed==2.0.1:
     Cython hash table that trusts the keys are pre-hashed
     キーを信頼するCythonハッシュテーブルは事前にハッシュされています
  • pretty-midi==0.2.8:
     Functions and classes for handling MIDI data conveniently.
     MIDIデータを便利に処理するための関数とクラス。
  • prettytable==0.7.2:
     A simple Python library for easily displaying tabular data in a visually appealing ASCII table format.
     視覚的に魅力的なASCIIテーブル形式で表データを簡単に表示するためのシンプルなPythonライブラリ。
  • progressbar2==3.38.0:
     A Python Progressbar library to provide visual (yet text based) progress to long running operations.
     長時間実行される操作の視覚的な(まだテキストベースの)進行状況を提供するPython Progressbarライブラリ。
  • prometheus-client==0.7.1:
     Python client for the Prometheus monitoring system.
     Prometheus監視システム用のPythonクライアント。
  • promise==2.3:
     Promises/A+ implementation for Python
     PythonのPromises / A +の実装
  • prompt-toolkit==1.0.18:
     Library for building powerful interactive command lines in Python
     Pythonで強力なインタラクティブコマンドラインを構築するためのライブラリ
  • protobuf==3.10.0:
     Protocol Buffers
     プロトコルバッファ
  • psutil==5.4.8:
     Cross-platform lib for process and system monitoring in Python.
     Pythonでのプロセスおよびシステム監視用のクロスプラットフォームライブラリ。
  • psycopg2==2.7.6.1:
     psycopg2 - Python-PostgreSQL Database Adapter
     psycopg2-Python-PostgreSQLデータベースアダプター
  • ptyprocess==0.6.0:
     Run a subprocess in a pseudo terminal
     擬似端末でサブプロセスを実行する
  • py==1.8.1:
     library with cross-python path, ini-parsing, io, code, log facilities
     クロスPythonパス、ini解析、io、コード、ログ機能を備えたライブラリ
  • pyarrow==0.14.1:
     Python library for Apache Arrow
     Apache Arrow用のPythonライブラリ
  • pyasn1==0.4.8:
     ASN.1 types and codecs
     ASN.1タイプとコーデック
  • pyasn1-modules==0.2.8:
     A collection of ASN.1-based protocols modules.
     ASN.1ベースのプロトコルモジュールのコレクション。
  • pycocotools==2.0.0:
     Tools for working with the MSCOCO dataset
     MSCOCOデータセットを操作するためのツール
  • pycparser==2.19:
     C parser in Python
     PythonのCパーサー
  • pydata-google-auth==0.3.0:
     PyData helpers for authenticating to Google APIs
     Google APIを認証するためのPyDataヘルパー
  • pydot==1.3.0:
     Python interface to Graphviz's Dot
     GraphvizのDotへのPythonインターフェイス
  • pydot-ng==2.0.0:
     Python interface to Graphviz's Dot
     GraphvizのDotへのPythonインターフェイス
  • pydotplus==2.0.2:
     Python interface to Graphviz's Dot language
     GraphvizのDot言語へのPythonインターフェイス
  • PyDrive==1.3.1:
     Google Drive API made easy.
     Google Drive APIが簡単になりました。
  • pyemd==0.5.1:
     A Python wrapper for Ofir Pele and Michael Werman's implementation of the Earth Mover's Distance.
     Ofir PeleとMichael MermanによるEarth MoverのDistanceの実装のためのPythonラッパー。
  • pyglet==1.4.10:
     Cross-platform windowing and multimedia library
     クロスプラットフォームウィンドウとマルチメディアライブラリ
  • Pygments==2.1.3:
     Pygments is a syntax highlighting package written in Python.
     Pygmentsは、Pythonで記述された構文強調パッケージです。
  • pygobject==3.26.1:
     Python bindings for GObject Introspection
     GObject IntrospectionのPythonバインディング
  • pymc3==3.7:
     Probabilistic Programming in Python: Bayesian Modeling and Probabilistic Machine Learning with Theano
     Pythonの確率的プログラミング:Theanoを使用したベイジアンモデリングと確率的機械学習
  • PyMeeus==0.3.6:
     Python implementation of Jean Meeus astronomical routines
     Jean Meeus天文ルーチンのPython実装
  • pymongo==3.10.1:
     Python driver for MongoDB <http://www.mongodb.org>
     MongoDB用のPythonドライバー&lt; http://www.mongodb.org>
  • pymystem3==0.2.0:
     Python wrapper for the Yandex MyStem 3.1 morpholocial analyzer of the Russian language.
     ロシア語のYandex MyStem 3.1形態素解析ツールのPythonラッパー。
  • PyOpenGL==3.1.5:
     Standard OpenGL bindings for Python
     Python用の標準OpenGLバインディング
  • pyparsing==2.4.6:
     Python parsing module
     Python解析モジュール
  • pypng==0.0.20:
     Pure Python PNG image encoder/decoder
     ピュアPython PNG画像エンコーダー/デコーダー
  • pyrsistent==0.15.7:
     Persistent/Functional/Immutable data structures
     永続的/機能的/不変のデータ構造
  • pysndfile==1.3.8:
     pysndfile provides PySndfile, a Cython wrapper class for reading/writing soundfiles using libsndfile
     pysndfileは、libsndfileを使用してサウンドファイルを読み書きするためのCythonラッパークラスであるPySndfileを提供します
  • PySocks==1.7.1:
     A Python SOCKS client module. See https://github.com/Anorov/PySocks for more information.
     Python SOCKSクライアントモジュール。詳細については、https://github.com/Anorov/PySocksを参照してください。
  • pystan==2.19.1.1:
     Python interface to Stan, a package for Bayesian inference
     ベイジアン推論のためのパッケージであるStanへのPythonインターフェイス
  • pytest==3.6.4:
     pytest: simple powerful testing with Python
     pytest:Pythonによる簡単で強力なテスト
  • python-apt==1.6.5+ubuntu0.2:
     Python bindings for libapt.
     libaptのPythonバインディング。
  • python-chess==0.23.11:
     A pure Python chess library with move generation and validation, Polyglot opening book probing, PGN reading and writing, Gaviota tablebase probing, Syzygy tablebase probing and XBoard/UCI engine communication.
     移動の生成と検証、Polyglotオープニングブックプローブ、PGN読み取りおよび書き込み、Gaviotaテーブルベースプローブ、Syzygyテーブルベースプローブ、XBoard / UCIエンジン通信を備えた純粋なPythonチェスライブラリ。
  • python-dateutil==2.6.1:
     Extensions to the standard Python datetime module
     標準のPython datetimeモジュールの拡張機能
  • python-louvain==0.13:
     Louvain algorithm for community detection
     コミュニティ検出用のLouvainアルゴリズム
  • python-rtmidi==1.4.0:
     A Python binding for the RtMidi C++ library implemented using Cython.
     Cythonを使用して実装されたRtMidi C ++ライブラリのPythonバインディング。
  • python-slugify==4.0.0:
     A Python Slugify application that handles Unicode
     Unicodeを処理するPython Slugifyアプリケーション
  • python-utils==2.3.0:
     Python Utils is a module with some convenient utilities not included with the standard Python install
     Python Utilsは、標準のPythonインストールに含まれていない便利なユーティリティを備えたモジュールです
  • pytz==2018.9:
     World timezone definitions, modern and historical
     世界のタイムゾーンの定義、現代と歴史
  • PyWavelets==1.1.1:
     PyWavelets, wavelet transform module
     PyWavelets、ウェーブレット変換モジュール
  • PyYAML==3.13:
     YAML parser and emitter for Python
     Python用のYAMLパーサーとエミッター
  • pyzmq==17.0.0:
     Python bindings for 0MQ
     0MQのPythonバインディング
  • qtconsole==4.7.1:
     Jupyter Qt console
     Jupyter Qtコンソール
  • QtPy==1.9.0:
     Provides an abstraction layer on top of the various Qt bindings (PyQt5, PyQt4 and PySide) and additional custom QWidgets.
     さまざまなQtバインディング(PyQt5、PyQt4、PySide)および追加のカスタムQWidgetの上に抽象化レイヤーを提供します。
  • regex==2019.12.20:
     Alternative regular expression module, to replace re.
     reに代わる代替の正規表現モジュール。
  • requests==2.21.0:
     Python HTTP for Humans.
     Python HTTP for Humans。
  • requests-oauthlib==1.3.0:
     OAuthlib authentication support for Requests.
     リクエストのOAuthlib認証サポート。
  • resampy==0.2.2:
     Efficient signal resampling
     効率的な信号リサンプリング
  • retrying==1.3.3:
     Retrying
     再試行中
  • rpy2==2.9.5:
     Python interface to the R language (embedded R)
     R言語(組み込みR)へのPythonインターフェース
  • rsa==4.0:
     Pure-Python RSA implementation
     Pure-Python RSA実装
  • s3fs==0.4.0:
     Convenient Filesystem interface over S3
     S3を介した便利なファイルシステムインターフェイス
  • s3transfer==0.3.3:
     An Amazon S3 Transfer Manager
     Amazon S3転送マネージャー
  • scikit-image==0.16.2:
     Image processing routines for SciPy
     SciPyの画像処理ルーチン
  • scikit-learn==0.22.1:
     A set of python modules for machine learning and data mining
     機械学習とデータマイニングのためのPythonモジュールのセット
  • scipy==1.4.1:
     SciPy: Scientific Library for Python
     SciPy:Python用科学ライブラリ
  • screen-resolution-extra==0.0.0:
     Does not exist in PyPI index! Extension for the GNOME Screen Resolution applet
      PyPIインデックスには存在しません! GNOME画面解像度アプレットの拡張機能
  • scs==2.1.1.post2:
     scs: splitting conic solver
     scs:円錐曲線ソルバーの分割
  • seaborn==0.10.0:
     seaborn: statistical data visualization
     シーボーン:統計データの視覚化
  • semantic-version==2.8.4:
     A library implementing the 'SemVer' scheme.
     ' SemVer'を実装するライブラリスキーム。
  • Send2Trash==1.5.0:
     Send file to trash natively under Mac OS X, Windows and Linux.
     Mac OS X、Windows、およびLinuxでネイティブにファイルをゴミ箱に送ります。
  • setuptools-git==1.2:
     Setuptools revision control system plugin for Git
     GitのSetuptoolsリビジョン管理システムプラグイン
  • Shapely==1.7.0:
     Geometric objects, predicates, and operations
     幾何学的なオブジェクト、述語、および操作
  • simplegeneric==0.8.1:
     Simple generic functions (similar to Python's own len(), pickle.dump(), etc.)
     単純な汎用関数(Python独自のlen()、pickle.dump()などに類似)
  • six==1.12.0:
     Python 2 and 3 compatibility utilities
     Python 2および3互換性ユーティリティ
  • sklearn==0.0:
     A set of python modules for machine learning and data mining
     機械学習とデータマイニングのためのPythonモジュールのセット
  • sklearn-pandas==1.8.0:
     Pandas integration with sklearn
     sklearnとPandasの統合
  • smart-open==1.9.0:
     Utils for streaming large files (S3, HDFS, gzip, bz2...)
     大きなファイル(S3、HDFS、gzip、bz2 ...)をストリーミングするためのユーティリティ
  • snowballstemmer==2.0.0:
     This package provides 26 stemmers for 25 languages generated from Snowball algorithms.
     このパッケージは、Snowballアルゴリズムから生成された25言語の26ステマーを提供します。
  • sortedcontainers==2.1.0:
     Sorted Containers -- Sorted List, Sorted Dict, Sorted Set
     ソート済みコンテナ-ソート済みリスト、ソート済み辞書、ソート済みセット
  • spacy==2.1.9:
     Industrial-strength Natural Language Processing (NLP) in Python
     Pythonの強力な自然言語処理(NLP)
  • Sphinx==1.8.5:
     Python documentation generator
     Pythonドキュメントジェネレーター
  • sphinxcontrib-websupport==1.2.0:
     Sphinx API for Web Apps
     Webアプリ用のSphinx API
  • SQLAlchemy==1.3.13:
     Database Abstraction Library
     データベース抽象化ライブラリ
  • sqlparse==0.3.0:
     Non-validating SQL parser
     非検証SQLパーサー
  • srsly==1.0.1:
     Modern high-performance serialization utilities for Python
     Python用の最新の高性能シリアル化ユーティリティ
  • stable-baselines==2.2.1:
     A fork of OpenAI Baselines, implementations of reinforcement learning algorithms.
     OpenAIベースラインの分岐、強化学習アルゴリズムの実装。
  • statsmodels==0.10.2:
     Statistical computations and models for Python
     Pythonの統計計算とモデル
  • sympy==1.1.1:
     Computer algebra system (CAS) in Python
     Pythonのコンピューター代数システム(CAS)
  • tables==3.4.4:
     Hierarchical datasets for Python
     Pythonの階層データセット
  • tabulate==0.8.6:
     Pretty-print tabular data
     プリティプリントの表形式データ
  • tblib==1.6.0:
     Traceback serialization library.
     トレースバックシリアル化ライブラリ。
  • tensor2tensor==1.14.1:
     Tensor2Tensor
     Tensor2Tensor
  • tensorboard==1.15.0:
     TensorBoard lets you watch Tensors Flow
     TensorBoardでは、Tensors Flowを見ることができます
  • tensorboardcolab==0.0.22:
     No project description provided
     プロジェクトの説明がありません
  • tensorflow==1.15.0:
     TensorFlow is an open source machine learning framework for everyone.
     TensorFlowは、誰にとってもオープンソースの機械学習フレームワークです。
  • tensorflow-datasets==2.0.0:
     tensorflow/datasets is a library of datasets ready to use with TensorFlow.
     tensorflow / datasetsは、TensorFlowですぐに使用できるデータセットのライブラリです。
  • tensorflow-estimator==1.15.1:
     TensorFlow Estimator.
     TensorFlow Estimator。
  • tensorflow-gan==2.0.0:
     TF-GAN: A Generative Adversarial Networks library for TensorFlow.
     TF-GAN:TensorFlow用の生成的敵対ネットワークライブラリ。
  • tensorflow-hub==0.7.0:
     TensorFlow Hub is a library to foster the publication, discovery, and consumption of reusable parts of machine learning models.
     TensorFlow Hubは、機械学習モデルの再利用可能な部分の公開、発見、消費を促進するためのライブラリです。
  • tensorflow-metadata==0.21.1:
     Library and standards for schema and statistics.
     スキーマと統計のライブラリと標準。
  • tensorflow-privacy==0.2.2:
     No project description provided
     プロジェクトの説明がありません
  • tensorflow-probability==0.7.0:
     Probabilistic modeling and statistical inference in TensorFlow
     TensorFlowの確率的モデリングと統計的推論
  • termcolor==1.1.0:
     ANSII Color formatting for output in terminal.
     ANSII端末での出力用の色の書式設定。
  • terminado==0.8.3:
     Terminals served to xterm.js using Tornado websockets
     トルネードWebソケットを使用してxterm.jsに提供される端末
  • testpath==0.4.4:
     Test utilities for code working with files and commands
     ファイルおよびコマンドを操作するコードのテストユーティリティ
  • text-unidecode==1.3:
     The most basic Text::Unidecode port
     最も基本的なText :: Unidecodeポート
  • textblob==0.15.3:
     Simple, Pythonic text processing. Sentiment analysis, part-of-speech tagging, noun phrase parsing, and more.
     シンプルでPythonicなテキスト処理。感情分析、品詞タグ付け、名詞句解析など。
  • textgenrnn==1.4.1:
     Easily train your own text-generating neural network of any size and complexity
     任意のサイズと複雑さのテキスト生成ニューラルネットワークを簡単にトレーニングする
  • tflearn==0.3.2:
     Deep Learning Library featuring a higher-level API for TensorFlow
     TensorFlowの高レベルAPIを備えたディープラーニングライブラリ
  • Theano==1.0.4:
     Optimizing compiler for evaluating mathematical expressions on CPUs and GPUs.
     CPUおよびGPUで数式を評価するための最適化コンパイラ。
  • thinc==7.0.8:
     Practical Machine Learning for NLP
     NLPの実用的な機械学習
  • toolz==0.10.0:
     List processing tools and functional utilities
     リスト処理ツールと機能ユーティリティ
  • torch==1.4.0:
     Tensors and Dynamic neural networks in Python with strong GPU acceleration
     強力なGPUアクセラレーションを備えたPythonのテンソルと動的ニューラルネットワーク
  • torchsummary==1.5.1:
     Model summary in PyTorch similar to model.summary() in Keras
     Kerasの model.summary()に似たPyTorchのモデルの概要
  • torchtext==0.3.1:
     Text utilities and datasets for PyTorch
     PyTorchのテキストユーティリティとデータセット
  • torchvision==0.5.0:
     image and video datasets and models for torch deep learning
     トーチの深層学習のための画像とビデオのデータセットとモデル
  • tornado==4.5.3:
     Tornado is a Python web framework and asynchronous networking library, originally developed at FriendFeed.
     Tornadoは、もともとFriendFeedで開発されたPython Webフレームワークおよび非同期ネットワークライブラリです。
  • tqdm==4.28.1:
     Fast, Extensible Progress Meter
     高速で拡張可能なプログレスメーター
  • traitlets==4.3.3:
     Traitlets Python config system
     Traitlets Python構成システム
  • tweepy==3.6.0:
     Twitter library for python
     Python用のTwitterライブラリ
  • typing==3.6.6:
     Type Hints for Python
     Pythonのタイプヒント
  • typing-extensions==3.6.6:
     Backported and Experimental Type Hints for Python 3.5+
     Python 3.5+用のバックポートされた実験的なタイプヒント
  • tzlocal==1.5.1:
     tzinfo object for the local timezone
     ローカルタイムゾーンのtzinfoオブジェクト
  • umap-learn==0.3.10:
     Uniform Manifold Approximation and Projection
     一様多様体の近似と投影
  • uritemplate==3.0.1:
     URI templates
     URIテンプレート
  • urllib3==1.24.3:
     HTTP library with thread-safe connection pooling, file post, and more.
     スレッドセーフ接続プーリング、ファイルポストなどを備えたHTTPライブラリ。
  • vega-datasets==0.8.0:
     A Python package for offline access to Vega datasets
     Vegaデータセットへのオフラインアクセス用のPythonパッケージ
  • wasabi==0.6.0:
     A lightweight console printing and formatting toolkit
     軽量のコンソール印刷およびフォーマットツールキット
  • wcwidth==0.1.8:
     Measures number of Terminal column cells of wide-character codes
     ワイド文字コードのターミナル列セルの数を測定します
  • webencodings==0.5.1:
     Character encoding aliases for legacy web content
     レガシーWebコンテンツの文字エンコードエイリアス
  • Werkzeug==1.0.0:
     The comprehensive WSGI web application library.
     包括的なWSGI Webアプリケーションライブラリ。
  • widgetsnbextension==3.5.1:
     IPython HTML widgets for Jupyter
     Jupyter用のIPython HTMLウィジェット
  • wordcloud==1.5.0:
     A little word cloud generator
     小さな単語クラウドジェネレーター
  • wrapt==1.11.2:
     Module for decorators, wrappers and monkey patching.
     デコレータ、ラッパー、およびモンキーパッチのモジュール。
  • xarray==0.14.1:
     N-D labeled arrays and datasets in Python
     PythonのN-Dラベル付き配列とデータセット
  • xgboost==0.90:
     XGBoost Python Package
     XGBoost Pythonパッケージ
  • xkit==0.0.0:
     Does not exist in PyPI index! library for the manipulation of the xorg.conf
      PyPIインデックスには存在しません! xorg.confを操作するためのライブラリ
  • xlrd==1.1.0:
     Library for developers to extract data from Microsoft Excel (tm) spreadsheet files
     開発者がMicrosoft Excel(tm)スプレッドシートファイルからデータを抽出するためのライブラリ
  • xlwt==1.3.0:
     Library to create spreadsheet files compatible with MS Excel 97/2000/XP/2003 XLS files, on any platform, with Python 2.6, 2.7, 3.3+
     Python 2.6、2.7、3.3+を使用して、任意のプラットフォームでMS Excel 97/2000 / XP / 2003 XLSファイルと互換性のあるスプレッドシートファイルを作成するためのライブラリ
  • yellowbrick==0.9.1:
     A suite of visual analysis and diagnostic tools for machine learning.
     機械学習用の視覚分析および診断ツールのスイート。
  • zict==1.0.0:
     Mutable mapping tools
     可変マッピングツール
  • zipp==3.1.0:
     Backport of pathlib-compatible object wrapper for zip files
     zipファイル用のpathlib互換オブジェクトラッパーのバックポート
  • zmq==0.0.0:
     You are probably looking for pyzmq.
     おそらくpyzmqを探しています。

AWS Innovate 2020招待のヨビノリ動画で「機械学習とはなんぞや」を学ぼう

本日2020年3月10日(火)から4月17日(金)まで「AWS Innovate オンラインカンファレンス」が開催されています。ライブセッションは終わってしまったので、以後はオンデマンドでセッション動画を視聴できます。その目玉企画の一つとして、数学系人気YouTuberのヨビノリたくみ氏の招待講演があります。

ヨビノリとは、「予備校のノリで学ぶ「大学の数学・物理」 - YouTube」のことです。教科書的な網羅性はないのですが、ピンポイントで理解したい項目が動画になっており、非常に分かりやすいので、統計学を中心に私もよく視聴しています。

そのヨビノリたくみ氏が「機械学習」について講演するということで視聴してみました。そこで知らない人や興味がある人に向けてセッション内容をスクリーンキャプチャーベースで紹介します。

セッション概要

[K-2] 招待講演: 機械学習の「そと」と「なか」

機械学習とは何なのか。そして、その機械学習で何ができるのか。という『そと』の話。 そして、その背景にはどのような数学が使われているのか。という『なか』の話について、前提知識なしでわかるように解説する。「これからもっと勉強してみたい!」と思える超入門的な講義です。

誰向けの動画なのか?

機械学習についてはまったく知らない人向けですね。ヨビノリたくみ氏らしくすごく分かりやすいです。AWSはまったく関係がない内容です。

初心者レベルの人で「機械学習と数学をきちんと結び付けたい」と思っている人は視聴してみるとよいです。約48分です。

説明の流れ

イントロ「できること」と「数学」

f:id:misshiki:20200310184607p:plain
イントロ「できること」と「数学」

「機械学習とは何か」の概要説明

f:id:misshiki:20200310184644p:plain
「機械学習とは何か」の概要説明

値の予測(回帰)

f:id:misshiki:20200310184657p:plain
値の予測(回帰)

クラスの識別(分類)

f:id:misshiki:20200310184713p:plain
クラスの識別(分類)

教師あり/教師なし学習

f:id:misshiki:20200310184727p:plain
教師あり/教師なし学習

クラスタリング

f:id:misshiki:20200310184746p:plain
クラスタリング

次元削減

f:id:misshiki:20200310184812p:plain
次元削減

本の紹介1『人工知能プログラミングのための数学がわかる本』

この本は自分も持っていて読みました。きれいに整理された項目で勉強しやすいです。リファレンスとしても使いやすいと感じています。

f:id:misshiki:20200310184832p:plain
『人工知能プログラミングのための数学がわかる本』

本の紹介2『機械学習入門 ボルツマン機械学習から深層学習まで』

この本も自分も持っていて読みました。直感的なイメージで説明してくれているので確かに分かりやすいです。

f:id:misshiki:20200310184848p:plain
『機械学習入門 ボルツマン機械学習から深層学習まで』

本の紹介3『Pythonで機械学習入門: 深層学習から敵対的生成ネットワークまで』

持っておらず読んでいないのでどんな本かは知らないです。

f:id:misshiki:20200310184911p:plain
『Pythonで機械学習入門: 深層学習から敵対的生成ネットワークまで』

本の紹介4『人工知能は人間を超えるか』

この本は最初に買った本ですね。2~3回読んで、Audibleで5回以上聞きました。この本の内容はAudibleで散歩中に聞くとかで十分なぐらい分かりやすいです。自分はAudible初回登録時の「無料期間」で聞いたのですが、無料で聞けるならAudibleがお勧めです。

ただし2015年11月に発売された本で内容が古いですね...。本当は本をアップデートしてほしい。同じくらい良い本もなかなかないので仕方ないんですけど。

f:id:misshiki:20200310184932p:plain
人工知能は人間を超えるか』

内容を視聴したい場合は...

AWS Innovate オンラインカンファレンス」のサイトを訪れてください。

Google Chromeでlocalhostへアクセスするとhttpsにリダイレクトされてしまう問題の解消方法

Google Chromeで「http://localhost:8888」などのlocalhostにアクセスしようとして、以下のように表示され、ページが開けずに困っていないでしょうか?

f:id:misshiki:20200309234635p:plain
ERR_CONNECTION_REFUSED
このサイトにアクセスできませんlocalhost で接続が拒否されました。 次をお試しください - 接続を確認する - プロキシとファイアウォールを確認する

Chromeのキャッシュを消したり、いろいろやったりしたけど分からず、よく見ると、勝手に「https」にリダイレクトされているし、何これと、自分は数時間を費やしてしまいました。同様にお困りの人がいるかもしれないので、同じ問題に当たった人の時間節約のために解決方法を紹介しておきます。

最終的に参考になったのは、こちらの情報でした: Google Chrome redirecting localhost to https - Stack Overflow

原因はHSTS。自分の場合は昔なんかやったような思い当たるふしがありました。解決方法は以下の通り。

  1. Chromeのアドレスバーに「chrome://net-internals/#hsts」と入力して開く
  2. 一番下にある[Delete domain security policies]の[Domain]欄に「localhost」(日にちが経っちゃったので忘れたけど「localhost:8888」かも)を入力して[Delete]キーを押す

f:id:misshiki:20200309235928p:plain
HSTSのドメインを消す

当面これでうまく動作するみたいです。「http://localhost:8888」ってJupyter Notebookが使っているんですよね。

書き殴りですが以上です。

お勧めのMathJax設定方法(構成や日本語表示など)

いろんなところで数式レンダリングにMathJaxを使っています。最近v3を使ってみたのですが、表示が壊れるケースが多く、またv2の最新版に戻しました。

自分のためにも日本語表示方法など調べて対応したので備忘録として知見をまとめておきます。

v3を使ったときに日本語にメイリオ(Windows)を使ってみる例。ローカルで使っていたので汎用的な書き方ではないと思います。

<script>
MathJax = {
  tex: {
    inlineMath: [
      ['$', '$'],
      ['\\(', '\\)']
    ],
    displayMath: [
      ['$$', '$$'],
      ['\\[', '\\]']
    ]
  },
  options: {
    skipHtmlTags: ["script", "noscript", "style", "textarea", "pre", "code"]
  }
};
</script>
<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-chtml.js">
</script>
<style>
mjx-container mjx-utext { font-family: Meiryo !important; }
mjx-container svg text { font-family: Meiryo !important; }
mjx-container[display="true"] { margin: 0 !important; padding: 2px 0 4px 0 !important; }
mjx-mid mjx-c::before { padding-top: 0.13em !important; }
</style>

次にv2に戻したときに書いた例。

<script src='https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.7/MathJax.js?config=TeX-AMS_HTML-full'>
  MathJax.Hub.Config({
    "fast-preview": {disabled:true},
    tex2jax: {
      preview: "none",
      inlineMath: [['$','$'],['\\(','\\)']],
      displayMath: [['$$','$$'],['\\[','\\]']],
      skipTags: ["script", "noscript", "style", "textarea", "pre", "code"],
      processEscapes: true
    },
    "HTML-CSS": {
      undefinedFamily: "Meiryo, STIXGeneral, 'Arial Unicode MS', serif"
    }
  });
</script>

ちなみに、config=[入力形式_出力形式]で定義できます。

  • TeX-AMS_HTML:
    • TeX-AMS:数学の入力にTeX/LaTeX書式のみを使用する(※MathML書式は使わない)。なお「TeX-AMS」とは「AMS(American Mathematical Society:アメリカ数学会)」が開発したTex書式であること示す
    • HTML: HTML&CSSによる出力のみを行う(※MML出力は行わない)
  • ファイル名のサフィックス「-full」は、「完全版」フレーバーであること(※「標準版」フレーバーではない)を示す。「完全版」だと、数学レンダリングに必要なものはすべて事前にロードされる。そのためロード後の数式表示に遅延が発生しない

MathJaxはロードが遅いから(※もっと最適化する方法はあるのかなと思うけど時間的に調べ切れていません)、KaTeXに移行した方がいいのかもだけど、機能面とかどうなんだろうとか思って手をまだ出せていません。

はてなブログのMarkdownにも以下のような数式を書く書式があるけど、通常は$を使って書いてるから面倒くさいですね。

[tex:数式]

取りあえず以下のように書いてみていますが、この書き方で取りあえず問題はあまり出なさそうです。

【ブロックの場合】

<div>
$$
\begin{align}
y=x^{2} \cdots 数式1 \\
y=x^{3} \cdots 数式2
\end{align}
$$
</div>
$$ \begin{align} y=x^{2} \cdots 数式1 \\ y=x^{3} \cdots 数式2 \end{align} $$

【インラインの場合】

数式「<span>$y=x^{2}$</span>」をインラインで書く。

数式「$y=x^{2}$」をインラインで書く。

上記の通りで数式が反映されているのではないかと。

読書感想『ブチ抜く力 ―― 一つの事に魂を売れ』

書籍紹介

 2019年3月出版で約1年前の本ですが、audiobook.jpのセールで買えたので、2019年末に聴いて&読んでみました。Amazonなどでの読者評価もすごく高いです。

 オーディオブックの再生時間は7時間7分。比較的短めです。

概要紹介と感想

 内容としては、非常にシンプルで「何かを為すには、それだけに心血を注げ。それ以外の一切は切り捨てろ」ということです。当たり前のことですが、それが多くの人はできていないよね、ということです。それを与沢さん流に言うと、「ブチ抜く」「一つの事に魂を売れ」という表現になります。ちょっと言葉が汚く聞こえますが、そこがインパクトを生んでいますね。内容自体は紳士的だと思います。

 【目次】は次のとおりです。

  • 第1章◆基本の法則: 「すべての根底にある大原則」
  • 第2章◆ビジネスの法則: 「人と群れるな。誰とも組まず、単独で突っ走れ! 」
  • 第3章◆投資の成功法則: 「勝負は、チャンスが来る前から始まっている」
  • 第4章◆健康の法則: 「一日一日を全力で。その積み重ねが大きな結果に繋がる」
  • 第5章◆情報収集の法則: 「情報収集も3週間。「一人突っ込み」を繰り返し、センターピンを掴まえろ! 」
  • 第6章◆未来予測の法則: 「これからの世界で起きる事を予測し、逆算して今から動こう!

 エッセンスは第1章に詰まっていて、必読です。取りあえずここだけ読んでもよいです。

 ほとんどの人は何らかの仕事をしいてると思うので、第2章も参考になると思います。

 第3章と第4章は、与沢氏自身の直近の実践例です。投資をやっていない人とかダイエットをしていない人にはあまり興味がない話かもしれません。特に第4章はスキップしていい内容かなと……。

 第5章は「センターピン」(後述)を掴む方法を語っています。ここも読んだ方がいいです。

 第6章はどういう姿勢でこれから生きていくべきかという話でしたが、そこまでのインパクトはないですね。

 与沢氏のように、他全部を捨て去って、1つだけをやる、ってことは意外になかなか難しい。それを自分だけの力でやるのは大変です。自分自身もなかなか苦手です。テストの前とか締切の前とかなら専念できるのですが。そこを考えると与沢氏はすごいですね。

 例として、話は脱線しますが、2020年4月に「42 Tokyo(パリ発のエンジニア養成機関)」という次世代型の学校が開講します。その入学試験には、「Piscine(ピシン)」という独特の試験が行われています。Piscineは「スイミングプール」の意味で、つまり約1カ月間かけて入学試験を「泳ぎ切れるか」を測定する試験だそうです。で、私自身がちょっと興味を持って受験者のツイートなどを眺めているのですが、「1日平均、約9時間をPicscineに費やしている」という旨のツイートを見ました。それを見て思ったのが、たった1カ月で約270時間もやれるなら、多くの分野でもうまくいく気がします。これは与沢氏の“ブチ抜く”と同じことだと思いました。

 自己啓発系の本で流行った「一万時間の法則」も同じことですよね。毎日9時間、1つのことに専念すれば、3年×365日×9時間=9855時間(約1万時間)です。これだけやれば、どんな分野でも平均から頭一つ飛び抜けた存在に余裕でなれるでしょう。だけどその1万時間を10年かけてやったとしたら意味が無い。できるだけ早く、短期間で、その量を鬼のようにこなさなければ、大多数と同じ平均レベルに甘んじるのだと思います。与沢氏は、そういうことを“一つの事に魂を売れ”というメッセージで伝えるのだと思いました。

 与沢氏の経歴については、ヒルズ時代の「秒速」から、転落、シンガポールで投資家で大成功まで、知っていましたが、そこまでできるということは、やっぱり持っている意識や信念が他の人と大きく違うということでしょうし。その秘密がこの本には、非常にシンプルなメッセージで書かれていると思いました。

 これから何かを成し遂げたい人、やる気を上げたい人は、特に若い人は、この本から何か感じるものがあるのではないかと思います。そういった人にはお勧めです。

 以下、引用しながら、私自身が気に入った内容をまとめていきます。

ルール 1: 一つの事に魂を売り、ブチ抜いていこう。

 この本は出だしが強烈で、このメッセージだけでこの本1冊すべてを語っていると思います。それが次に引用した2文です。

 たった一つの結果のために、魂を売る。
 皆さんは、そう言い切れるくらいに何かをやり切った経験はあるでしょうか?

 個人的には一時的にはあると言えばあると思います。例えば大学受験した高校3年生と予備校1年の2年間。同じような各種テスト前の勉強とか。原稿を締切日前に書き上げるとか。

 他には、プログラミングやその周辺のITの勉強もすごくやりました。大学を卒業してからITエンジニア(プログラマー)になりました。会社から帰宅して、夜の3時か4時くらいまでIT書籍を読みあさっていました。だから毎日、睡眠時間は3時間程度。ジュンク堂(福岡天神)にあるITエンジニア系本棚の端から端までを主要な本は全部読む気でいました。それを4年間続けました。たぶんこれは「一万時間の法則」であり、与沢氏の言う“一つの事に魂を売ってブチ抜く”に近いかなと思います。

 ここまでやらないと、「毎日9時間それに専念する」というのはできないと思います(※もちろん、学校も仕事も辞めれば「1日中それだけしかやらない」とできるかもだけど、そういう環境はなかなか作り出せないだろうし)。それだけ尋常ではない。若くないとなかなかできないことだと思います。

 与沢氏は、「どうしたら与沢氏のように成功できるんですか?」という質問をよく受けるそうですが、次のように答えています。

 私が実践してきた事は、非常にシンプルです。それは「とにかく一つの目標に全力を注ぎ込み、結果を出すまでやめない」という事。

 これによって、「一つの事に徹底的に集中するから短い時間で上手になり、誰よりも突き抜けることができた」と思っているそうです。

 だけど“一つの事に魂を売る”のはなかなか難しい。誰しもやることがいっぱいですし、そこまで1つのことに時間を掛けられないですから。でも、「それではダメだ」と与沢氏は伝えてきます。言うなれば、これは「飛行機の離陸」と同じなのだと。

 ただ、多くの人は地面から離陸する前に走行を停止してしまう。すると、苦しい状況がずっと続くことになるのです。

 これは何となく直感的に分かります。完全に振り切れていない状態、フルスロットルではない状態、他の全部を遮断して捨て切れていない状態、そんなストイックになりきれていない状態であれば、その他大勢の中から飛び抜けるのは難しいですよね。分かっていても、なかなかできない。与沢氏は「ストイックでいるために、人は何らかの代償を払わなければならない」と語ります。与沢氏はそのあたりの覚悟の仕方がうまいのでしょう。何よりもルール2のような信念を持っていることが大きいのだと思いました。

ルール 2: 最短・最速で圧倒的な結果を出す

 与沢氏は、「なぜ『最短・最強』こそが、最強のソリューションになり得るのか」という理由について、次の3つを挙げています(部分部分を引用)。

  1. 短期間だから人は集中できる
  2. 結果が早く出るので正しい方法論に辿り着きやすい
  3. 最短・最速で結果を出すと「ブチ抜いた存在になれる」

 1と3はこれまでに説明した内容の強調ですね。2は与沢氏独自の理論だと思います。そのやり方はルール4で説明されています(※ルール3の紹介はスキップします)。

 ルール2の最後に、読者/リスナーに対して、次のようにアドバイスしています。

 これまでの常識は全部取り払って、「未だかつてない最短・最速」での目標達成プランを考え、実践してみて下さい。

ルール 4: センターピンを掴め。そして3週間、徹底的にやり切れ。

 ここでまた、インパクトのあるキーワードを出してきました。それが「センターピン」。この用語は、この本の中でタイトル以外で最も大切なキーワードだと感じました。自分はこれについてこれまで意識してきたことがなかったので、私がこの本を高評価する一番のポイントでもあります。個人的に学びがありました。

 では「センターピン」とは何なのか? 「ボウリングでいう真ん中のピンの事」とのこと。どういうことかというと、「その物事のセンターピンは何かという事」を考えること、要するに「『物事の本質は何か』を考える事」が大切なのだと与沢氏は主張します。

 では「なぜそれが大切か?」というと、与沢氏は次のように語ります。

センターピンとなるたった一つの“物事の本質”を的確に捉えさえすれば、物事は想像以上に上手くいきます。

 だからこそ、「目標を達成させるために最初にやる事」なのだと与沢氏は説きます。そして「一つのセンターピンを設定したら、最低3週間は続けてみて下さい」とアドバイスしています。

 これを読むと、上記で説明した私の「プログラミングやその周辺のITの勉強」は間違っている気がしました。センターピンが掴めていない。だからこそ最短・最速で結果を出せないのだと(結果を出せたのか出せてないのか、自分でもよく分からないけども)。与沢氏はこのあたりの努力が的確なのが良いと思います。的確になるように自分なりの理論を持っている。それが与沢氏の強さを生み出しているのだと感じます。見習いたいです。

 簡単に「センターピンを掴む」と言っても、はっきり言って「それが簡単にできたら苦労しないよ」っていう人は少なくないと思います。与沢氏はこれについても、具体的なアドバイスを用意してくれています。

 実は頭の良い人ほど、この「一つに絞る」という作業が苦手です。
 頭の良い人は物事の本質「らしきもの」を掴むのが得意なので、センターピンと思しきものを「これも、あれも」といくつも見つけてしまうのです。

 うわー。耳が痛い。頭は悪いけど、分かるわ。基本的に100%正しいとかないだろうから、「大事なのはこの3つです」とかやってしまいがちです。しかし与沢氏からすれば、これこそが「失敗のもと」で、「最短・最速を不可能にする最大の理由」とのことです。与沢氏は次のようにも説明します。

 センターピン「らしきもの」がたくさんあると、一つひとつの方法に費やす力が分散してしまうので、結果としては中途半端なものになりがちです。

 本当によく分かります。自分自身もやっていることがいっぱいあって、2019年の例では英語・TOEICやったり数学・統計学やったり機械学習・ディープラーニングやったり投資やったり音楽/映画の観賞や読書したり小説書いたり、本当にたくさんやっています。だからやっぱり時間の不足、力の分散を感じていました。ただし、1つに絞って集中し過ぎると疲れてきて、気分転換に他のことも始めてしまいます。そういうところがダメだなって、2019年末にこの本を読んで感じました。だからこそ、2020年は月単位で完全に1つに絞り、与沢流でやってみようかと思っています。たった3週間であれば、毎日9時間頑張れるでしょう? ちなみに個人的には2月は統計学の多変量解析をやっています。と言いつつもこのブログ記事も書いてしまっているので、ダメですね……。ちなみに個人ではなく仕事は、ディープラーニングのライブラリにフォーカスして深掘りしています。

 見習うべき与沢氏のアドバイスは次のとおりです。

 だから、私がセンターピンを決めた時は、必ず他の情報はシャットアウト。一度決めたら、とにかく馬鹿になって愚直にやり抜く。一度ルールを決めたら、もはや考える必要はないのです。

 これだけでもかなり排他的な雰囲気ですが、与沢氏の考えはもっともっと強烈です。それがルール5。

ルール 5: 成功したいなら、人の意見は聞かず、ストイックに突き進め。

 ストイックであろうとする際に、大きな障壁になるのが「他人の意見」です。
……でも、その「意見」の大半は無意味です。
 その理由は「誰かにとっては成功した方法であっても、それが自分自身に適用できるとは限らない」からです。

 まぁ人の意見なんて、しょせん「あなたは私の人生すべての責任を取ってくれるんですか?」というのはあります。何だかんだ言う人は多いけど、「じゃあ、全部面倒見てくれるんですか?」っていう。そういう覚悟もないのに気軽に言ってるだけなので、そこまでまともに聞く必要はないなと思います。自分の人生の責任は自分に降りかかってくるのだから、それがどれだけ人類至上最高の賢人であっても、例えばたとえ孔子であったとしても、「責任を取ってくれないのなら、参考にしたとしても、従う必要などはない」と思うので、与沢氏に賛成です。

 与沢氏は、他人の意見をうのみにするのではなく、自分で考えることが大切だと説きます。

 私が言いたいのは、「人の意見を聞くな」という事ではありません。
 大切なのは、全ての意見に対して、あなたがきちんと自分自身の頭で考え、何が良いかと思える点か、何が悪いと思う点かを自分自身で考え抜いた結果、採用するのかどうかです。

 与沢氏は「『自分で考え、納得した方法』からしか成功は生まれない」と主張しています。確かに確かに。成功者に「具体的にこうしろ」というのを聞いた人が成功できるわけではないでしょう。成功方法は、すべてそれぞれの人が考える必要があるわけです。

 ここまでの内容が第1章の基本部分です。これでやる気になれる人は本は買って手元に置くとよいです。第5章には「3週間でセンターピンを掴む方法」が紹介されています。第1章との関連性も大きいのでこれも引用しながら紹介します。

ルール 29: センターピンを掴むための情報収集・分析は3週間。まずは全体を把握すべく「登場人物」を押さえろ。

 与沢氏は「3週間」という期間を重要視にしているようです。その理由を次のように述べています。

一つの事を集中してやり抜くには、3週間というのが長過ぎず短過ぎず、ちょうどいい期間だからです。

 そしてそれを、1週間ごと3段階に分けることをお勧めしています。その内訳は次のとおりです。ちなみに「フェーズ」名は私が勝手に付けました。

  • 1週目「情報収集」フェーズ: 全体像を把握する
  • 2週目「分析予測」フェーズ: 推論を立てる
  • 3週目「精査決断」フェーズ: センターピンを設定する

 1週目の「全体像を把握する」とは、まずは俯瞰的に全容を押さえてから、物事の細部を理解した方が効率がよい、という考え方です。これは基本的なことなので全面的に納得です。与沢氏がよく使うのが、次の手順とのこと。

「そのテーマにはどんな登場プレイヤーがいるのか」をリサーチする

 これは、例えばビジネス現場や投資の世界であれば、その業界や分野でどんな主要企業があるかを知るということのようです。「リサーチ」というのは「知る」作業を少し大げさに言っていると思います(厳密には「情報収集」くらいの意味でしょう)。ここがまず「全体像を把握する」ということに該当します。

 どれくらい情報収集すればよいのでしょうか? そのヒントを次のように述べています。

 この1週目で学ぶ知識量の目安は、その業界の人なら知っていて当たり前の情報を知るという事。業界に属する人ならば、誰もが知っているレベルの知識を叩き込みましょう。

 2週目は、集めた情報から「推論を立てる」という作業を行います。具体的には次のようにします。

 まずはその業界でトップの存在を中心に、それぞれの登場人物の強みや弱み、特徴を分析していきましょう。

 これは、例えば先ほどと同じくビジネス現場や投資の世界であれば、情報収集した主要企業がなぜ強いのかを自分なりに考えてみるということです。その手法は、統計学などの科学的な手法も使ってもよいと思いますが、普通に論理的に考えればよいでしょう(あるいはある程度なら直感的に考えても良さそうとも思います)。そして、その業界や分野の先行きを予測します。これは「分析&予測」フェーズのことですね。与沢氏はここがキモだと説明しています。

 3週目は、推論を基に「センターピンを設定する」という作業を行います。具体的には次のようにします。

ここがいよいよセンターピンの決断の時です。この2週間に培ってきた知識を基に、自分がセンターピンとして設定するべきは何かを考えましょう。

 「センターピン」とはすなわち、自分がこれから取り組むべき「ただ一つの本質」を指すのでした。そのピンがセンターからズレていたら元も子もありません。誤解や矛盾がないかを「ひたすら自問自答」を繰り返しながら、じっくりと精査していく期間が必要ですよね。そこまでやってから決断を行います。それがこの3週目でやること、つまり「精査&決断」のフェーズということです。

 ところで、「自問自答」はどうやって行えばよいのでしょうか? それについてもヒントを与えてくれています。

 最終的には「自分はAという会社が注目されていくと思う。なぜなら……」と自分の決断に対して、論理的にきちんと人に説明できるレベルかどうかを確認しましょう。

 以上の3週が終わったら実践あるのみ…ではなく、「その前に、ルール30をやらなければならない」と与沢氏は諭します。

ルール 30: 「1人突っ込み」を繰り返し、自説への反論・悪口・対抗記事を論破せよ。

 これは、3週目のセンターピンを常に疑い、検証し続けろ、ということです。与沢氏は語ります。

何度も何度も「この仮説は本当に正しいのか?」と検証しなければいけません。

 具体的な手順は次のとおりです。

自分の決断に対する反証データをひたすら探し、その反証データを自分が論破できるかどうかを自問自答するというもの。反論を探す場所は、テレビでも雑誌でも新聞でもネットでも何でも構いません。

 それでもし、「論破」できなかったら、どうなるのでしょうか?

 もし論破できる確たる根拠が見つからなければ、あなたのセンターピンは間違っている可能性があるので、いま一度、決断を見直してください。

 自分の考えたセンターピンを反証していくのは、苦痛の伴う作業でしょう。与沢氏は、注意点を次のように述べています。

 人間というのは不思議なもので、多くの人は自分が「こうであって欲しい」と思うような情報ばかりを見てしまいます。

 気を付けたいですね。

 あとはルール35まで続きます。本稿では35個のルールのうち、6個だけ(17%分)を、筆者の理解の流れで紹介しました。内容はかなり大ざっぱに抜粋引用したうえに、あくまで私の解釈でしかないので、本稿で興味を持ったら、厳密・正確には本を読んでくださいね。

Data Science Fes 2019 クロージングフォーラム 聴講ノート

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

Data Science Fes 2019 クロージングフォーラム|EventRegist(イベントレジスト) に参加しました。

15:00~15:55 セッション1 データ/AIのビジネス活用への勘所

  • ファシリテイタ―:杉山俊幸氏(日経BP 総合研究所 主席研究員)
    • 自社内のデータ活用は進んできたが、会社間のデータ連携は進んでいない。その解決が今進められている
    • インターネットとAIを対比させて20年後に向かって見ると、現在はまだ果実が実る段階ではない。利益を出すことを慌ててはいけない
    • インターネットでは、20年前はポータルサイトばかりだったが、今は検索とECで大きな果実が実った
    • アワードの審査ポイント「産業・社会的なインパクト」「先進・独自性」「チャレンジ度」
    • 大賞=キューピーの「AI食品原材料検査装置」(協調と競争の二軸が大事で、これは他社にも使ってほしい「協調」の技術)
    • 「ディープラーニングビジネス活用アワード」大賞はキユーピー:日経クロストレンド
    • 特別賞には、パッケージデザインのプラグの「パッケージデザインの好意度スコアを予測するAIサービス」など
  • 小川亮氏(プラグ 代表取締役社長 経営管理博士)
    • プラグはデザイン+調査の会社(社員70名)
    • 各商品のデザインの評価を調査している: 3000人に調査していてお金がが掛かる、誰かがSNSに秘密の商品をアップしてしまうリスク、などなどの問題がある
    • この調査をAIで自動化した: かなり良い精度で当てられるように。すべての案件が客観的に評価できる、情報漏えいがない、仮説検証が低コストで何回もできる、マーケターの時間を大切に使える、などなどのメリットがある
    • パッケージデザインを11回評価して決めた。AIで今までとやり方が変わる
    • 同じ形式で溜めてきたデータだけはある、AIでいけるのではないか(回帰? 分類? 画像処理?)、秋の大きな展示会に取りあえず応募してみた、依頼先を探すも分からなくて高い、大学との共同研究に手紙を出しても無反応か億単位のお金が必要、やばい展示会・・・、社員の1人「俺がやる」
    • 独学で勉強開始、本を読む、似た課題のプログラムを当てはめる、速いPCを1台、・・・と地道に進めていき(1000時間くれ)、何とか展示会に間に合った
    • 営業を始めて「試してみたい」という声は多いが、「なぜそういう結果になったかを知りたい」という声が多かった。そこでバージョンアップして「どこが好意度に寄与するのか」をヒートマップで表示できるようにした。また、評価コメントのコトバ(イメージワード)を表示できようにした。これからその新版をリリースする予定
    • やりたいことを5段階でいうとまだ1.5ぐらい。例えば「どういう言葉で訴求したらいいか」など
  • 杉山氏からの質問:
    • 「俺がやる」誰も手を挙げなかったら? → どうしていたか分からないが外注しなくて良かった。自社で行うことでノウハウも溜まった
    • AIに携わる人員は? → 東京大学との共同研究なども進めているが、実質的に1人の社員がやっている。AIのチームを社内外に作るステージに来ている。学生をアルバイトで雇ったりしてもよい(高専生は特に優秀)
    • 学生アルバイトを使うメリットは? → 大学の人は経験値があるので、「理論上はそうではないが、経験上はこうすると速い」などのアドバイスがもらえたりする
  • 大企業のAI活用は? → ベンチャーと大企業と大学が組むパターンが増えてきた。そういうフレキシビリティが大切

16:00~16:55氏 セッション2 大学の実践的な教育への取り組みと企業との連携

  • ファシリテイタ―:加茂倫明氏(POL代表取締役CEO)
    • アカデミアのバックグラウンド: 現役の理系学生(東大工学部を休学中)
    • 2016年9月に共同設立者と起業。日本の科学は停滞傾向、論文数は減少中。研究領域には課題が山積み。それを解決するために起業した
    • 研究者の可能性を最大化するプラットフォームを創造する
    • LabBase: 優秀理系学生の採用プラットフォーム=採用市場に出にくい理系学生を、検索して一本釣りできるサービス
    • LabBaseX: 産学連携を加速するナレッジプラットフォーム(2019年3月リリース)=大学を横断して検索
    • 課題意識: 産学マッチングの裾野拡大(→データと高性能計算機の提供)、DS(データサイエンス)人材の技能要件の定義明確化/細分化(→適切なジョブマッチング/人材育成)
  • 沼田洋一氏(ADKマーケティング・ソリューションズ事業役員/Data Chemistry代表取締役社長)
    • ADKは業界第3位の広告会社グループ
    • データとは何か?
      • 量を集める(=データ)→視点で整理(=情報)→発見(=知性・洞察)→判断(=意思決定)→行動(=アクション)
      • ロジック×データ=両方ともあるのが一番良い
      • データに関わる業務領域はたくさんある
    • 東京大学/武蔵大学社会学部グローバルデータサイエンスコース/早稲大学と連携
      • データ提供する意味: 大規模・シングルソース・定期・クリーニング済みのデータでないと研究・勉強できないのかという思いから提供
      • ADK生活者総合調査: オリジナルの調査データ
      • 企業データを預けることの難しさ: データ漏えいなどを防ぐための契約書など
      • Waseda Integraged Research platform(WIRP)という契約面とシステム面を一括サポートする仕組みを使えばよい
    • 企業側が求めているもの=課題設定が難しくてそれができる人材がいない。想像力はすべてのビジネスの基礎。データサイエンス+社会科学の想像力が必要とされている
  • 小野陽子氏(横浜市立大学データサイエンス学部助教授)
    • YCUでの教育プログラム: ドメインへの興味喚起→数学を含めた基礎教育→アルゴリズム+統計+計算機科学→柱となる学問への融合領域→ドメイン・・・
      • プロセス: 課題発見→データ定義・収集・加工・分析→解釈・提案→解決
      • 学外での学び: セミナー、企業講座、PDS(インターシップ)、共同研究、修士課程で共同研究
    • PDS(Practical Data Science): 学部3年生対象。PBL=”Probrem” Based Learning、産学連携など
      • PBL実習: 実績追体験型、解決プロセス現在進行型、課題未着手型、課題理解型、その他
    • YOKOHAMA D-STEP: 修士レベル相当だが大学院ではない。産官学連携でデータをもらって、実課題解決型PBLを実施
    • WiDS: Women in Data Science(スタンフォード、ICMEを中心に始まった)。ゴール=Inspire、Educate、Support。ローカルイベントも実施
  • 以下はディスカッション
  • 加茂氏:何がデータサイエンティストには大事か?
    • 沼田氏:想像力。売っている商品は女性向けが多いので、気持ちが分かる女性のデータサイエンスとに分析してほしい。
    • 小野氏:女性でないとというのは幻想かもしない。現場に出るのが大事。
    • 沼田氏:現場は大事。シャンプー売場を見てみないと分からない。
  • 加茂氏:企業がどうデータサイエンスを使うかを1年生にインプットする意図は?
    • 小野氏:微積などの基礎学習ばかりでは、興味が持てないところがあるという理由もある。
  • 加茂氏:コミュニケーションに関する課題は?
    • 小野氏:私自身は、統計出身だが工学にも興味があったが、工学系からすると統計系は独立とか有位とかじゃなく早く動くものを作れとなると思う。そういう分野ごろに断絶されてる状態ではなく、どの人とも話せるコミュニケーション力が必要になる。WiDSを見ると、統計と計算科学でコミュニケーションが取れない問題は世界共通。
  • 加茂氏:大学へのデータ提供で難しい面は?
    • 沼田氏:やはり契約面。誰が責任をとるのか? 大学がまとめて責任をとる契約でないと。調査データなので個人データではないと思っているが、個人情報の問題もある。早稲田はWIRPで楽ちん。
    • 小野氏:データがある企業に行くの(=インターンシップ)が今のところ安心。
  • 加茂氏:文系出身の人が沼田さんのような立ち位置になるには?
    • 沼田氏:専門分野の本を10冊ぐらい読む。用語を易しく言い換えできるようになれば大丈夫。
    • 小野氏:10冊読めるというのは問題解決したいというドメインへの情熱や興味があったと思う。それがないとどうにもならない。
  • 加茂氏:最後に企業にメッセージを。
    • 沼田氏: 文系企業でもデータサイエンスの知識を持って話をできるように。妄想力が大事。データは会社にあるが出す側がビビるので契約面を何とかする。
    • 小野氏: トレランス、寛容性が大事。コミュニケーションで寛容性がないと、データサイエンスの実施にストップがかかりやすい。

17:05~18:15 セッション3 Data・AI-Readyな社会を私たちが創ってゆくために

  • 小澤健祐氏(ディップ AINOW編集長)
  • 瀧島勇樹氏(経済産業省 情報技術利用促進課長)
  • 菅野流飛氏( 高専キャリア教育研究所代表取締役社長) 
  • 進行:水無徹郎氏(日経新聞メディアビジネス クロスメディアユニット)
  • 水無氏:
    • 政府による「人間中心のAI社会原則」の上にあるビジョンが「AI-Readyな社会」
    • 経団連による「AI-Ready化ガイドライン」(企業、個人、社会制度・産業基盤)。指針はレベル1~5に分けられている
    • 5年後にレベル3まで進行していると過程して、今の状況は? → パネリストそれぞれ見解は分かれた。それを踏まえてディスカッション
  • 小澤氏:
    • AINOW編集長。「AI業界の広報になりたい」という思いを持っている。テレビやYouTube、講演など多方面で活動中
    • AIドルは数学とプログラミングの勉強をしている
    • dipという会社はバイトルなどの人材サービスを扱っている。AINOWは「AI」関連の検索で強い
    • 2019年: 自然言語処理のBERTが目立った。BERTのGoogle検索への採用など、技術の水平展開だった1年。OCRの技術が確立した
    • SIerの限界: B2B2Cモデルにおける課題=今までのAI市場はPoCで成り立っていた
    • AI導入の課題: 課題設定(あらゆるフェーズで課題が分からない)。企画←要件定義←PoC←導入と年々遡っている
    • 現場特化型(課題把握)の人材育成: 42 Tokyoがオープン
    • 課題解決のデジタルシフトが大事ではないか。AI-Readyに向けて
    • 2020年はデータ基盤→RPA→AIという形で山を大きくしていくのが理想
  • 瀧島氏: デジタルトランスフォーメーション(DX)の展開
    • WEFダボス会議:安陪総理スピーチより「作り上げるべき体制はDFFT(データ・フリー・フロー・トラスト)」
    • デジタルトランスフォーメーション(DX)とは何か? → デジタル技術を使って、つながり方を変えて、本当にやりたかったことをやる
      • ユーザーの気持ちで再構築する、経営とデジタルは一体である、というこにつながる
    • Society 5.0: あらゆる段階でのデータ化
    • ネクスト・ジェネレーション・ガバメントの在り方: 政府が動画で作った。本もAmazonで売れている
      • 19世紀にモノの大量生産体制ができ、インフラ面も作られた
      • 20世紀には、政府ですることが増えた(GDPの16%が政府の施策)
      • 21世紀次世代は、(小さなユーザーの困ったに対応する)ユーザー起点の政府でないことに問題意識を持っているので、つながり方を変えていくためのプラットフォームを作っていく
      • 「テクノロジーをうまく使いこなすために、政府や公共はどうあるべきか」→ DXやAI社会の実現
    • 「2025年の崖」=DXの必要性を理解しているが、レガシーシステムもあるので実現できない
    • IT投資における日米比較: 日本は守り、米国は攻めのIT投資をしている
    • なぜデジタルレディに投資が向かわない? → 部門間、経営者、投資額、人材、危機感などの問題。経営者はオポチュニティを掴めているのか。DXがダメなところに良い人材が入るのか
    • 「DX推進指標」の策定、「デジタルガバナンスコード」(社長自らが方針を宣言することにインセンティブ)の検討、IPA未踏IT人材、などの対策をしている
    • やはりDX推進にはリーダーシップが大事
  • 菅野氏: データ・AI-Readyな社会に備えるためのスタンス考察
    • 高専卒業生のイノベーターの価値を見いだし、「高専スタンフォード計画」をスローガンに掲げている
    • 高専は現場の実装に強い。未踏スーパークリエイターの高専生の割合は13%、ハッカソンの優勝チームも40%。松尾先生も高専を高く評価している(DCON開催)
    • 高専生の行動特性: まず手を動かして結果を出す。不確実性をいったん受け止める
    • AI-Readyに求められるスタンスとは? → PoCではなく、動かせる結果を持ってくる
    • 完全な構造(業務改善や事業側)と完ぺきなカオス(発明やDX側)の中間にあるのがイノベーション(新規事業)=不確実性を楽しめるメンタリティ(まず動く)=スタンス
    • 「20%作る力」+「80%受け入れる力」ができると日本社会が変わる=「できないこと、知らないこと、違うこと」を受け入れる寛容さが社会として必要
  • 以下はディスカッション
    • 瀧島氏: 官僚組織は決められたことの権化みたいに思われているがスーパーカオスでもある。どうブレンドすればよいのか?
      • 瀧島氏: リクルートの上司は問題があったら守ってくれた。そのおかげでできたプロジェクトがあるので感謝している。構造を守る側がそういうスタンスだとパフォーマンスがあがる。
    • 小澤氏: カオス側を受け入れるためにはどうすればよいか?
      • 菅野氏: 私が言える話でもないが、聞いた話では、トヨタの場合、治外法権の組織を別に作ってしまう、というのは良い。結果が出るまでのリードタイムを許容できるようにする。
      • 瀧島氏: 経営者などの工夫が必要な場面はある。
    • 小澤氏: そういう組織にするには?
      • 瀧島氏: 自由な空間を作ってイノベーションを起こすという宣言を社長がする「デジタルガバナンスコード」が必要。
    • 水無氏: 会社が変わるのを待つのではなく、個人ができることは?
      • 小澤氏: スタートアップやスピンアウト系が増えているのはそれだから。自分で動いて作ってしまうのが早い。
      • 菅野氏: シリコンバレーではアライアンスが大事で、ゆるふわにつながりたいという人が多い。会社に所属するのではなく、契約にしてフラットにするケースが増えている。
    • 小澤氏: 大企業では労働基準で働く時間制限もあるので燃え切れない人もいる。
      • 瀧島氏: 大企業に入らなければ良い(会場:笑)。若い人から変わっていくのでは。そういう現実から規制を変えていくのが大事。
    • 小澤氏: 実際に大企業に勤めている人はどんな感じ?
      • 菅野氏: 人間関係が嫌だという人間はいないが、仕事がつまらないという人は多い。大手企業は優秀な人は多いので、仕事自体がチャレンジングであればもっと日本も成長できるはず。

産学連携教育への挑戦~滋賀大データサイエンス学部1期生と共に歩んだ4か月 聴講ノート

※これはセミナー聴講時の個人的なノートをそのまま公開したものです。誤字誤植や勘違いがある可能性があるのでご了承ください。

産学連携教育への挑戦~滋賀大データサイエンス学部1期生と共に歩んだ4か月|IT勉強会ならTECH PLAY[テックプレイ] に参加しました。

15:00 - 16:00 講演『産学連携教育への挑戦~滋賀大データサイエンス学部1期生と共に歩んだ4か月』

  • 国立大学法人 滋賀大学 河本 薫氏
  • 株式会社電通 関西支社 湊 康明氏
  • 株式会社インテージホールディングス 小金 悦美氏

産学連携ゼミというこうとで滋賀大学の一期生と取り組んだ結果を説明する。

産学連携ゼミの狙い(河本氏)

  • 大阪ガスを経て滋賀大学の教員になった
  • データサイエンスの持論
    • 「役立つ≠分かる」: 研究論文は分かれば書けるが、大阪ガスでは問題解決に役立つとは限らない
    • 「データサイエンス(役立つ)≠統計学(分かる)」
    • 「データサイエンス力+データエンジニアリング力+ビジネス力」と図にまとめられるが、本来は多義的: アルゴリズム開発型、ドメイン深掘型、☆ビジネス支援型☆、サービス創造型
    • 求められているのは「ビジネス支援型」←この人材を育てるのが河本氏自身のミッション
  • データサイエンティストが直面するお題:「最近売り上げが落ちているから、原因が知りたい」など
  • データサイエンス教育の持論
    • 「医者≒データサイエンティスト」: 「臨床実習(問診→検査→治療)≒PBL(課題発見→データ分析→問題解決)」
  • 産学協同教育で、シームレスな人材育成: 大学教育と企業教育、それぞれの教える力で強力し合える部分がある
  • 河本ゼミの教育目標: ビジネス支援型データサイエンティストに求められる能力(課題設計力、データ収集と整形、データ分析と解釈、 報告と実装)
  • 河本ゼミのPBL方針: 「一気通貫型教育」&「全体俯瞰型教育」、産学連携して共同教育を行う、コミュニケーション力の育成
  • PBL演習に必要な3つの外部始動(2019年の例):
    • 【課題発見】ビジネスの悩みや願望: チョコレートの購買状況について何が課題であるかを設計
    • 【データ分析】実データ(インテージ社から提供): 50代女性がチョコレートの購入意向をもつかどうかを分析(行動仮説を探索)
    • 【問題解決】当事者へのプレゼン機会: 結果を発表
    • 「わかる」→「役立つ」への価値観の改革ができた

参加者アンケートの結果について(ディスカッション)

  • 河本氏/小金氏: やらされている感ではなく、積極的・自発的に取り組むようになった
  • 湊氏:アウトプットのためのインプットになったのが大きい

インテージが産学連携ゼミに参画した理由(小金氏)

  • インテージはさまざまなデータを集めている(市場調査やマーケティングリサーチ)
  • ビジネスにおけるデータ活用課題: デジタル化&スピーディな意思決定の時代だが、意思決定につながるアウトプットができるデータサイエンティストが不足している
  • ビジネスサイドが教育に関与する意義は、データサイエンティストに必要とされる「ビジネス力」の部分を育成する必要があるから(社長:会社の責務として貢献したい)
  • インテージの増田氏による「現場」の説明:
    • 講義するうえで気を付けた点: 目的の重要性(何のために? 誰が?)、実務と理論のバランス(実利用と研究論文では違う)、データ分析(目的を考えて自らが不足するデータを拡張)
    • 議論を通じて感じた点: 目的の重要性(自走する学習に発展)、考え方の変化(答えを求める態度から可能性を追求する態度へ)、結果の説明(データ分析に明るくない人への説明を想定)

学生時代にビジネスシーンをイメージすることの必要性(湊氏)

  • 電通若者研究部の研究員としての研究経験などから「若者×テクノロジー」などに取り組む
  • 学生の間にキャリアを意識する瞬間が大切
  • 大学院生時代: “勉強がどう社会還元されるのか、イメージする力”がなかった
  • バックキャスト思考の重要性: 未来やビジネスシーンをイメージする、自分の実力の検証と気付いていない視点の拡張、勉学への意義づけとアクションプランの策定
  • 社会に還元される「イメージ」を持ってもらう: ビジネスでの意思決定手法としてのデータサイエンスを意識させた
  • 自分の実力の検証と気付いていない視点の拡張: 「アイデアを出していない」「企画書が書けてない」「ビジネスとして成立していない」といった、ビジネスの基礎力の欠損の提示
  • 勉学への意義づけとアクションプランの策定: ワークシートを活用した振り返り
  • 「報告と実装」では、プレゼンして終わりではなく、アプリケーション開発力も大切
  • 技術が分かるプロデューサー、ビジネス感覚のあるエンジニア=いわば翻訳者のような人材が必要: アカデミック的素養がある人材にビジネスマインドをインプットするのは価値がある
  • 次世代のリーダーを育てる:多業種合同インターンプログラム 「engawa young academy」

16:00 - 17:00 パネルディスカッション

  • モデレーター:ヤマトホールディングス株式会社 中林 紀彦氏
  • 国立大学法人 滋賀大学 河本 薫氏
  • 株式会社電通 関西支社 湊 康明氏
  • 株式会社インテージホールディングス 小金 悦美氏

人材育成について産学連携のToBe像

日本に必要なモデルは?

  • 河本氏: 企業が能動的に大学と連携していくべき。PBLに基づく教育基盤は大学連携でしか難しい。「課題発見をどう教えるのか?」=大学で数学に詳しい人が教えるのがうまいわけではない。ビジネスを持つ企業の人の方が教えるのがうまい可能性が高い。だからといって杓子定規に分けられないので、大学と企業が一緒に教育内容を考える必要がある。学生は問題と課題の違いが分かっていないことが多いので、そこから教える必要がある。

  • 湊氏: 企業への長期インターンをした方がいい。若いうちにビジネスシーンに触れられるから。企業にとってもメリットがあるはず。

  • 小金氏: 社内でやりたいという声が挙がったわけではない。実態として仕事が忙しいのにやってられないという状況だった。優秀なデータサイエンティストが2名も大学に教育者として派遣することに本当に価値があるのかという議論はある。

  • 中林氏: 人に依存しないサステイナブルなモデルを作っていく必要がある。

  • 河本氏: 予算がいただけるならば解消できるかもしれないが。

  • 湊氏: 学校法人から企業への対価がペイするものかというとそうではない。学生さんに任せられる業務を3割ぐらいに増やせるのなら、うまくいくのではないか。そういった体制を作る方が現実的。

  • 小金氏: 複数の企業が参画できる点は、学生に刺激が与えられる点ではよい。そういった学生はインテージにとっても人材採用の面で魅力的に見える。

  • 河本氏: モチベーションと自信があれば学生は自走する。だからモチベーションを付けてやるのが大事。

  • 湊氏: 学生でプログラミングできてもアプリが作れないのが嫌で、アプリ実装サークルなどに入って、企業から時給5000円で請け負って、実践を学ぶ例などがある。こういうおんは良いモデルだと思う。

  • 会場質問: データサイエンスといっても領域はさまざま。企業が欲しい領域の人材と必ずしもマッチングできていない。例えばデータ分析やりたい人と機会学習やりたい人は違うので、ミスマッチが起きると、企業をすぐにやめていってしまう。これについてはどう考えているか?

  • 中林氏: マッチングの精度を上げるにはどうするべきか?

  • 湊氏: 人材の取り合いが起きている状況。企業は人材を逃したくないと思うので、社内副業制度を作っていくのが良いと思う。

  • 小金氏: データサイエンスという用語は広義だが、採用時にその人の能力ややりたいことをきっちりと見極めるのは結構難しく、悩ましい。

  • 中林氏: 企業は総合職のような形で採用せざるを得ない。専門職を作っても将来的に変化していくので。

  • 会場質問: 課題設定の進め方のコツ。

  • 河本氏: そこが核心で、私が得意なところで、大学が果たすべき分野だと思う。そのノウハウこそが日本の財産になる。

  • 小金氏: カリキュラム作成でさんざんディスカッションした。

  • 湊氏: 産学協同で参画した三者の距離が遠かったことが、より良い議論につながった。

  • 会場質問: 大学生の話が中心だったが、少子高齢化で学び直しが必要になるのでは?

  • 河本氏: 滋賀大学では院を作ってリカレント教育にも力を入れ始めた。ただし、休職が必要なので、企業ではなかなか難しい面がある。ニーズはあるが、実現が難しいのが問題。

  • 小金氏: リカレント教育のできる社会になるとよい。データサイエンスを習得できる場が増やせるとよい。最後のまとめとしては、企業としてもデータサイエンスの産学協同をサステイナブルにする必要がある。同じような企業が増えていけばよりやりやすい。

  • 湊氏: リカレント教育は賛成だが、それを実現するには社内体制を整える必要がある。企業で産学連携のイメージができて、仲間がふえていくとよい。