1.はじめに
1-1 講師自己紹介
1-2 セミナーの狙い
2.演習環境の構築
2-1 Pythonのインストール(ディストリビューションAnaconda利用)
2-2 各種ライブラリ(NumPy,SciPy,matplotlib,IPython,pandas,mglearn,scikit-learn)のインストール
2-3 統合開発環境Spyderのインストール
2-4 Pythonの実行方法(インタプリタ,コマンド渡し,統合開発環境)
3.Python入門講座
3-1 Pythonの特徴
3-2 なぜいまPythonか?
3-3 Pythonの基本文法
3-4 コーディング方法(統合開発環境Spyderの使い方含む)
3-5 各種ライブラリ(NumPy,SciPy,matplotlib,scikit-learn,mglearnなど)の使い方
3-6 機械学習アルゴリズムの実装方法
3-7 サンプルコードを用いた実践演習
3-8 参考書・情報源の紹介
4.機械学習概論
4-1 機械学習の概要
4-2 三大学習法(教師あり学習,教師なし学習,強化学習)
4-3 機械学習データセットの紹介
4-4 機械学習におけるデータの著作権
4-5 専門書・参考書の紹介
5.教師あり学習
5-1 教師あり学習の概要
5-2 クラス分類と回帰
5-3 過剰適合と適合不足
5-4 モデル複雑度と精度
5-5 多クラス分類
5-6 各種教師あり学習アルゴリズムの基礎理論と実践演習
5-6-1 k-最近傍法(クラス分類,回帰)
5-6-2 線形モデル(線形回帰,Ridge回帰,Lasso回帰,ロジスティック回帰)
5-6-3 サポートベクトルマシン(線形モデル,非線形モデル)
5-6-4 決定木
5-6-5 アンサンブル学習(ランダムフォレスト,アダブースト)
6.教師なし学習
6-1 教師なし学習の概要
6-2 データの前処理とスケール変換
6-3 次元削減と特徴量抽出
6-4 各種教師なし学習アルゴリズムの基礎理論と実践演習
6-4-1 主成分分析(次元削減)
6-4-2 k-平均法(クラスタリング)
6-4-3 凝集型クラスタリング
6-4-4 DBSCAN(クラスタリング)
7.実装上の注意事項
7-1 データの前処理(スケール変換など)
7-2 実データの読み込み方法
7-3 モデル選択(パラメータの設定方法)
8.まとめと質疑応答
【注意事項】
本セミナーでは,演習を行いますので,以下の条件を満たしたノートパソコンを持参して下さい.
1)プラットフォームは,Windows,Linux,MacOSを問いません.
2)演習環境を統一したいので,事前にAnacondaを用いて,Python 3.x(バージョン3系)をインストールしておいて下さい.
3)Anacondaを利用すると,演習で必要な標準・外部ライブラリがほとんど自動インストールされますが,mglearnのみ個別インストールが必要となります.個別インストールは,Windowsでは,Anaconda Promptを開き,pip install mglearnでインストールできます.
4)演習で使用するサンプルコードは,USBメモリで準備しますが,万が一に備えて,ノートパソコンは無線WiFi機能を搭載したものを推奨します.なお,USBメモリや無線WiFi(インターネット)への接続が,社内ルールでNGの方は,事前に配布いたします.
5)本セミナーでは,Pythonの統合開発環境(IDE)として,Spyderを用いて説明を行います.事前にSpyderをインストールしておいていただけるとスムーズに演習が行えます.なお,Anacondaを利用した場合は,Spyderは自動インストールされます.
6)教師あり学習,教師なし学習とも,「各種学習アルゴリズムの基礎理論と実践演習」では,当日の進行状況に応じて,すべての手法が取り上げられない可能性があります.