★ 大量のデータを扱っていて、データの山から知識を引き出したい、機械学習で有効活用したい方へ。
★ 手っ取り早くPythonを学びたい方、代表的な機械学習(教師あり学習、教師なし学習)を学びます。
1.はじめに
1.1 講師自己紹介
1.2 セミナーの狙い
2.演習環境の構築
2.1 Pythonのインストール(ディストリビューションAnaconda利用)
2.2 各種ライブラリ(NumPy、SciPy、matplotlib、IPython、pandas、mglearn、scikit-learn)のインストール
2.3 統合開発環境Spyderのインストール
2.4 Pythonの実行方法(インタプリタ、コマンド渡し、統合開発環境)
3.Python入門講座
3.1 Pythonの特徴
3.2 なぜいまPythonか?
3.3 Pythonの基本文法
3.4 コーディング方法(統合開発環境Spyderの使い方含む)
3.5 各種ライブラリ(NumPy、SciPy,matplotlib、scikit-learn、mglearnなど)の使い方
3.6 機械学習アルゴリズムの実装方法
3.7 サンプルコードを用いた実践演習
3.8 参考書・情報源の紹介
4.機械学習概論
4.1 機械学習の概要
4.2 三大学習法(教師あり学習、教師なし学習、強化学習)
4.3 機械学習データセットの紹介
4.4 機械学習におけるデータの著作権
4.5 専門書・参考書の紹介
5.教師あり学習
5.1 教師あり学習の概要
5.2 クラス分類と回帰
5.3 過剰適合と適合不足
5.4 モデル複雑度と精度
5.5 多クラス分類
5.6 各種教師あり学習アルゴリズムの基礎理論と実践演習
5.6.1 k-最近傍法(クラス分類、回帰)
5.6.2 線形モデル(線形回帰、Ridge回帰、Lasso回帰、ロジスティック回帰)
5.6.3 サポートベクトルマシン(線形モデル、ソフトマージン、非線形モデル)
5.6.4 決定木
5.6.5 アンサンブル学習(ランダムフォレスト、アダブート)
6.教師なし学習
6.1 教師なし学習の概要
6.2 次元削減と特徴量抽出
6.3 各種教師なし学習アルゴリズムの基礎理論と実践演習
6.3.1 主成分分析(次元削減)
6.3.2 k-平均法(クラスタリング)
6.3.3 凝集型クラスタリング
6.3.4 DBSCAN(クラスタリング)
7.実装上の注意事項
7.1 データの前処理(スケール変換など)
7.2 テスト誤差の最小化(交差検証)
7.3 ハイパパラメータの最適化(グリッドサーチ)
7.4 実データの読み込み方法
8.まとめと質疑応答