
ソフトウェアデータの分析に役立つ強靭な(ロバスト)統計手法
![]()
セミナータイトル
外れ値の多いソフトウェアデータを効果的に活用するための統計手法を修得するために!
ソフトウェアデータの分析に役立つ強靭な(ロバスト)統計手法
セミナー概要
セミナー番号 | j100550 |
会 場 | |
日 時 | 2010年5月25日(火) 10:30~17:30 |
聴講料 | 1名につき47,250円(税込、資料付き) ※昼食は付いておりません 同時複数申込の場合1名:42,000円 主催:株式会社日本テクノセンター お問い合わせ 03-3599-5811 mail:http://www.rdsc.co.jp/contact/ |
【講座の内容】
【受講対象者】
・ソフトウェア開発組織の管理に携わる方、プロジェクトリーダ、ソフトウェア開発者、データ分析や統計手法に関心のある方なら誰でも 者
【修得知識】
・Excelを利用してロバストな統計量を計算できるようになる
【講師の言葉】
世の中には測定結果としての数値データが溢れています。人口、川の長さ、山の高さ、震度、降雨量など、私達の生活は様々な数値に囲まれています。人は数字を正しいものと思いがちですが、測定データには誤りがつきものです。ソフトウェアの測定データも同じ、いやそれどころか、私達の日常生活で見聞きする数値とは桁外れに大きな誤りを含んでいることが多いのです。さらに、ソフトウェア自体の多様性、それを開発する人間の多様性などにより、従来の統計学で扱うにはあまりにも外れ値の多い不安定なデータであるというのが現状です。ソフトウェアのデータはいくら分析しても実りが少ないと思われている方も多いのではないかと推察します。実り豊かなものにするために、CMMI<注2>のようなモデルに則って、組織の成熟度を上げて安定した状態にするのは一つの有効な方法ですが、どんなに成熟度を上げても外れ値は必ずでてきます。
本講演では、ソフトウェアデータのように外れ値の多いデータに向いた統計手法を分かりやすく解説します。
<注2>CMMIはアメリカ合衆国特許商標庁に登録されています
【プログラム】
Ⅰ. はじめに
Ⅱ. 数値データの正しさ
人口、川の長さ、山の高さなどの正しさ
Ⅲ.ソフトウェアデータの正しさ
Ⅳ.ソフトウェアデータの特徴
外れ値が多く、全体的傾向を見誤る可能性がある。外れ値が多い原因には、以下のようなものがある。
・測定誤りや定義の一貫性に欠けるデータ
・様々な標準化の仕方と徹底度合い
・開発に関わる人達が本質的にもつ多様性
・ソフトウェアが本質的にもつ多様性
・ソフトウェアの規模の変化によるばらつき
Ⅴ. 組織の成熟度
組織の成熟度を上げることにより、外れ値は減っていくが、成熟度を上げることでは解決できない外れ値もある。
Ⅵ. 強靭な(ロバスト)統計量/手法
ソフトウェアデータには外れ値が多いため、次のようなロバストな統計量や手法を活用するとよい。以下の全てにExcel<注1>を用いた計算方法も示す。
1.中央値、トリム平均
平均値との比較で説明する
2.四分位偏差、箱ひげ図
標準偏差と管理図との比較で説明する
3.パーセントランク、パーセンタイル
偏差値との比較で説明する
4.順位相関係数
相関係数との比較で説明する
5.累乗回帰式
回帰直線との比較で説明する
6.r最小二乗法
最小二乗法との比較で説明する
<注1>Excelは米国Microsoft社の米国および世界各国における商標または登録商標です
![]()
| 関連セミナーのご案内 |
| 4月2日(金) CUDA/GPGPUアーキテクチャとプログラミングのための基礎知識 |
| 4月6日(火) アダプティブアレーアンテナおよびMIMO技術の基礎と測定・評価法 |
