■スモールデータの解析の実態とその方法論■
■スモールデータの収集・解析の考え方■
■現実の問題の解決へのスモールデータの活用■

実務に使えるスモールデータ解析
~特徴選択・不均衡データ解析・異常検知~
※本セミナーは、【Live配信】のみの開催に変更になりました。(4/7更新)

※受付を終了しました。最新のセミナーはこちら

セミナー概要
略称
スモールデータ
セミナーNo.
st200501
開催日時
2020年05月18日(月) 10:30~16:30
主催
サイエンス&テクノロジー(株)
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
価格
非会員:  49,500円 (本体価格:45,000円)
会員:  46,970円 (本体価格:42,700円)
学生:  49,500円 (本体価格:45,000円)
価格関連備考
49,500円 ( 会員受講料 46,970円 )
定価:本体45,000円+税4,500円
会員:本体42,700円+税4,270円

【2名同時申込みで1名分無料!(1名あたり定価半額の24,750円)】
※2名様とも会員登録が必須です。
※同一法人内(グループ会社でも可)による2名同時申込みのみ適用いたします。
※3名様以上のお申込みの場合、1名あたり定価の半額で追加受講できます。
※受講券、請求書は、代表者に郵送いたします。
※請求書および領収証は1名様ごとに発行可能です。
 (申込みフォームの通信欄に「請求書1名ごと発行」と記入ください。)
※他の割引は併用できません。
備考
【Live配信対応セミナー】
・本セミナーはビデオ会議ツール「Zoom」を使ったライブ配信セミナーとなります。
・お申込み受理の連絡メールに、接続テスト用のURLを記載しております。
 お手数ですが予め「Zoom」のインストールが可能か、接続可能か等をご確認ください。
  (Zoomはインストールせずにwebブラウザからのご利用も可能です。)
・セミナー視聴用URLは、後日別途メールにてご連絡申し上げます。
 セミナー開催日時に、視聴サイトにログインしていただき、ご視聴いただきます。
・開催日時にリアルタイムで講師へのご質問も可能です。
・タブレットやスマートフォンでも視聴できます。
※セミナー資料は印刷物を開催日までに発送させていただく予定です。
※開催日直前にお申し込みいただいた場合は、テキストの到着がセミナー開始日時に間に合わない恐れがあります。
 Zoom上ではスライド資料は表示されますので、セミナー視聴には差し支えございません。
 印刷物は後日お手元に届くことになります。
講座の内容
受講対象・レベル
現実のデータの解析に興味のある技術者・研究者(線形代数・微積.統計などの初歩の知識を前提とする)
習得できる知識
スモールデータ解析に必要な技術、変数選択法、不均衡データの解析手法、異常検知
趣旨
 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。
プログラム
1.スモールデータとは
 1.1 スモールデータの特徴
 1.2 スモールデータ解析の現状

2.スモールデータ解析の方法論:次元削減と回帰分析
 2,1 主成分分析(PCA)
  2.1.1 PCAとは
  2.1.2 直交展開
  2.1.3 PCAの導出
  2.1.4 PCAと特異値分解
 2.2 最小二乗法
  2.2.1 回帰分析とは
  2.2.2 相関係数の意味
  2.2.3 最小二乗法の導出
  2.2.4 最小二乗法の幾何学的意味
  2.2.5 多重共線性の問題
 2.3. 部分的最小二乗法(PLS)
  2.3.1 PLSとは
  2.3.2 潜在変数モデル
  2.3.3 PLSモデルの導出
  2.3.4 NIPALSアルゴリズム
  2.3.5 PLSから重回帰モデルへの変換
  2.3.6 クロスバリデーションによるパラメータチューニング

3.スモールデータ解析の方法論:入力変数選択
 3.1 入力変数選択とは
 3.2 スパースモデリング
  3.2.1 スパースとは
  3.2.3 リッジ回帰
  3.2.3 Lasso回帰
  3.2.4 エラスティックネットモデル
  3.2.5 Group Lasso
 3.3 変数クラスタリングによる入力変数選択
  3.3.1 スペクトラルクラスタリング
  3.3.2 NC法のコンセプト
  3.3.3 NCSCアルゴリズムの導出
  3.3.4 NCSCを用いた変数クラスタリングと入力変数選択
  3.3.5 製薬プロセスへの応用例

4.スモールデータ解析の方法論:不均衡データ解析
 4.1 サンプリング手法
  4.1.1 サンプリング手法とは
  4.1.2 アンダーサンプリングとオーバーサンプリング
 4.2 ブースティング
  4.2.1 ブースティングとは
  4.2.2 AdaBoost
  4.2.3 RandomForest
 4.3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  4.3.1 何故,ブースティングとサンプリング手法を組み合わせるか
  4.3.2 RUSBoost
  4.3.3 HUSDOS-Boost
 4.4 不均衡データ解析の大規模検診データへの適用例

5.スモールデータ解析の方法論:異常検出
 5.1 異常検出とは
 5.2 多変量統計的プロセス管理(MSPC)
  5.2.1 MPSCとは
  5.2.2 T2統計量とQ統計量の幾何学的意味
 5.3 自己符号化器(オートエンコーダー)
 5.4 異常検出問題の医療データ解析への応用例

6.スモールデータの収集・解析の考え方
 6.1 必要となるデータの質の問題
 6.2 データ収集の際の留意点
 6.3 スモールデータ解析の手法選択

  □質疑応答□
関連するセミナー
関連する書籍
関連する通信講座
関連するタグ
フリーワード検索