データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
統計数字を「読む」とは、その背後にある出来事や事柄を推論することである。データの解釈は一通りではなく、読む主体によって異なる。例えば、500ccのコップに250ccの水がある場合、「もう半分しかない」と捉えるか「まだ半分ある」と捉えるかは人それぞれである。さらに、データの質(透明度など)に注目する人もいるだろう。データの解釈にはその論理やプロセスを明らかにする必要がある。例えば、平成14年度の交通事故データからは、都内では全国と比べて死亡事故の頻度が低いことがわかり、これは都市の交通渋滞や安全設備の充実などが原因と考えられる。このようなデータの読み方は、仕事や学習に役立ち、統計学の基礎知識が必要となる。

データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】



統計数字の読み方(interpretation of data)


統計数字(データ)を「読む」とは、統計数字を通じてその背後にあるできごとやことがらを推論することである。


統計数字の「意味するところ」を知ることであるといってもよいが、「意味するところ」は一通りではなく、さまざまである。


読む当の主体も「意味するところ」にかかわる。


たとえば、容量500ccのコップに250ccの水が入っていることに対し、「もう半分しか残っていない」とするか「まだ半分しか飲んでいない」とするかは、データを読む人による。


さらにいうなら、人によっては水の量でなく水の質(透明度など)を問題にするかもしれない。


より具体的な例では、「国民の税負担」のデータに対し、「公共サービスのレベルを維持するためにはやむをえない」とする立場か「税金の無駄遣いが多い」とする立場かでは、データの読み方は異なることが予想される。


あるいは、選挙の結果に対し「選挙に負けたのだから責任をとって退陣すべき」かあるいは「逆風の割にはよく戦った」とするかは、結論を先取りした議論になるであろう。


したがって、「データは語る」、あるいは「データをして語らしめる」といういい方は、必ずしも適切ではない。


もし、データにおのずから客観的な意味がただ一通りあるとすると、それが導き出された状況や、データの作成者の立場を離れて、意味が一人歩きしかねない。


また、「客観的」を称してある特定の主観が不当におしつけられるおそれもある。


したがって、データを読む際、どのような論理やプロセスでその結論や解釈を得たかをある程度明らかにするか、少なくとも(たずねられたり反論された場合)その用意はしておくことが必要である。


実際、頭の中で漠然とした常識によってあいまいに組み立てられる結論も、文章化してみると、いくつかの常識には必ずしも根拠がなく、また重要な論理が飛躍していたり、あるいは計算が誤っていたり、早合点で不正確であることに気づく。


次のデータを読んで文章化してみよう。その際、


@論理プロセスをはっきりする


Aデータあるいはその重要な計算結果を文章中に入れる(2、3ヵ所)


B一般に広く知られている事実以外の特殊なことがらを入れない


C結論を明確に示す


D文章は簡潔に要点のみを書く。字数は400字程度


平成14年度交通事故のデータは次のようである。


全国     都内
発生件数  936,721    88,512
死者数   8,326      376
負傷者数  1,167,865    101,037


このデータ(だけ)をもとにして、これから推論されることをその推論理由とともに、2点述べなさい(結論だけには点数を与えない)。



回答例


全国対都内の比較をしてみると、発生件数では10.6対1、死者数では22.1対1、負傷者数では11.5対1で、都内では全国との比較で死亡事故の頻度がほぼ半分であることがわかる。


これには都市の過密による交通渋滞、速度低下、あるいは交通安全設備の強化、住民の安全意識の徹底などが可能な原因として考えられるが、このデータだけでは特定できない。


さらに発生件数対負傷者数の比は、全国、都内でそれぞれ1対1.25、1対1.17で、事故1件あたり1人ないしは1人強が負傷している。


それは運転者自身(あるいは同乗者)あるいは通行人あるいは関係車の運転者、同乗者であろう。


しいていえば全国の方が負傷者がわずかに出やすいが、これは運転者の自身の負傷が多いためであろう。


負傷者対死者数の比較は、全国で140人に1人、都内で269人に1人で、やはり都内では相対的に死亡事故が起きる頻度が、対負傷者では半分以下となっている。


これは発生件数との比較でもいえて、全国で113件で1人、都内で、235件に1人となっている。


統計的知識の必要性の理由


比較的単純な現象(交通事故)を通しても、都市では交通渋滞によって交通事故が起きにくくなっているのかもしれないが、それでも一つや二つに出合うものである。


それだけに、このような論理立て、整理、文章化することはやさしそうで、案外知恵を要求される。


このことは仕事や生活の上で生かせるし、大学の学習でも役立つであろう。


しかし、現象が複雑になってくるといい意味での常識が通ぜず、かえって常識の誤りが判断をあやうくすることもしばしばである。


ここでデータ読みに役立つのが、統計学の基礎知識である。



データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

データ解釈術:統計数字の背後を読み解く【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】