標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
標準偏差はデータのばらつきを示すが、正規分布を前提とするため、他の分布では有効ではない。正規分布以外の場合はパーセンタイルを利用し、最小値、第1四分位点、中央値、第3四分位点、最大値で表現することが一般的。

標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


標準偏差とパーセンタイル


2つの指標を使い分ける


正規分布でないデータの指標化


標準偏差はデータの広がりを表す指標ですが、データが正規分布の形になっていることが前提ですので、注意が必要です。


データが正規分布に従っているときには、1シグマ範囲に68%のデータが入りますが、データが正規分布から大きく離れた分布の形をしているときはこの性質は成り立ちません。


正規分布になっていないデータの広がりを表すときには、標準偏差ではなくパーセンタイルを利用します。



パーセンタイルは、値の小さい順にデータを並べ替えたとき、あるパーセントの順番にあるデータの値を示します。


例えば、0パーセンタイルは最小値で、100パーセンタイルは最大値、50パーセンタイルは中央値と同じ値になります。


正規分布の形をしていないデータの広がりを表現するときは、最小値、25パーセンタイル、中央値、75パーセンタイル、最大値を利用することが多いです。


25パーセンタイルのことを第1四分位点75パーセンタイルのことを第3四分位点と呼ぶこともあります。



標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

標準偏差とパーセンタイル:データの真実【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】