バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
バラツキは日常生活の多くの場面で見られ、その効用は統計学でも重要です。個別データを活用し、その情報をできるだけ減少させずに統計データとしてまとめる最も効果的な方法は度数分布を用いることです。ただし、平均値のみでは不十分で、データの分布の広がりを示す特性値も必要です。この分布の広がりを理解することで、異なる体型や好みなど、個体間の多様性がどのように社会や生態系において役立っているかが明らかになります。例えば、遺伝子の多様性は生物がさまざまな環境に適応するのに役立ち、人間関係や意見の多様性も社会の進歩に寄与します。バラツキがなければ、世界は単調で退屈なものになってしまうでしょう。

バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


日常いたるところにバラツキあり


体型が同じだと、混んでいる電車に乗っているとき、肩と肩、尻と尻がぶつかりあって、窮屈で困るでしょう。


それぞれ体型が異なるから、満員電車にあんなに詰めこむことができるので、みなが同じ寸法、格好ではそうはいきません。


もっとも乗車効率がよいのは、つまりたくさん詰めこむことができるのは、男女半々のときだそうです、という記事を読んだことがあります。


女性の体型が三角形、男性の体型が逆三角形になっていて、すきまなく詰め込むからであるといいます。


ほかに陰陽説、引力説、心理説といろいろありました。どの説も眉唾の感じはあります。


ここで言いたいことは、すべてのデータにはバラツキがあるということです。


果物屋の店主は、できるだけバラツキが小さくなるように選んで、果物を高く積み上げたり、小皿に並べたりします。


反対に客のほうは、些細なバラツキを発見して果物を選ぼうとします。


中年のおばさんなど、あちこちさわるものだから店主は渋い顔をしています。


バラツキをめぐるちょっとした駆け引きは日常至るところにあります。



バラツキの効用


地球上における生物の種類は何百万種にもおよぶといいます。


材料は同じ遺伝子のもととアミノ酸その他であるのに、神はよくそれだけの変種を設計したものだと感心します。


形だけとってみても、どんな想像力豊かなイラストレーターもおよばない種がいくらでもいます。


なぜそんなに種のバラツキが大きいのでしょうか。


地球の資源を最大限に活用するためです。


種によって違うものを食物とし、それぞれ違う環境が住みやすいように作られています。


できるだけ競合関係を小さくするねらいです。


したがって、極寒の極地、炎熱の砂漠、常闇の深海にさえ適応した生物がいるのです。


このようなバラツキの効用は、人間関係だけをとってみても納得できます。


若い人が好きなタイプの相手を選ぶのも、会社が人材を集めて発展するのも、世の中が異なる意見の活力で進歩するのもそうです。


バラツキのない世界を考えると気味が悪いともいえます。


コピー人間が遺伝子操作で可能になるらしいですが、想像しただけで不気味です。


体型くらいなら似ていてもよいですが、考えること、なすことのすべてが一緒だったらどうなることでしょう。


バラツキがないと困る例としては、以下があります。


@出勤時にバラツキがあるからラッシュが多少は軽減される


A好みの異性が好き好きだから血をみないですむ


Bジグゾーパズルの何百何千という多数のピースの形がそれぞれ異なるからこそ、ただひとつのパズルの解が得られる


バラツキという名の特性値


たくさんの個別データが持っている情報をできるだけ減らさないで、統計データとしてまとめるには、度数分布がもっともすぐれています


ところがそれらの分布データをまとめて、ただ1個の統計データである平均値としてしまうと、もとの情報が著しく失われてしまいます。


度数分布の特性値として、平均値だけではダメで、分布の広がりを表す特性値も最低必要です


分布の広がりとは、個々のデータのバラツキのことです。


もっともこの言葉は、工場での製品検査などで使われ出したものらしいです。


バラツキという言葉の感じからは、データ個数があまり多くない場合のほうが適切なような気がします。


一方、データの広がりというときは、データ個数の多い度数分布を想定してしまいます。
もちろん単なる言い回しの違いです。



バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

バラツキの魔法:統計学が解き明かす日常【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】