未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
損失の期待値を最小にする行動選択は、不確実な未来に対処するための重要な意思決定の枠組みである。この考え方は、損失関数と危険関数を用いて具体化される。損失関数は、特定の行動が引き起こす可能性のある損失を金額で表し、各状況と行動の組み合わせに割り当てる。一方、危険関数は、特定の状況下での平均的な損失、つまり損失の期待値を計算する。例えば、雨の日に傘を持っていくかどうかの決定や、インフルエンザの疑いがある旅行者の入国許可問題などが挙げられる。どちらの関数も、未来が不確実である中で、最も損失が少ない行動を選択するためのガイドとなる。結局のところ、最良の意思決定は、損失を最小化する行動を選ぶことである。

未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


損失の期待値が少ない行動


朝、家を出るときに、傘を持っていくかどうかを考えることがあると思います。


今日雨が降るかどうかは、朝の天気予報をみればわかりますが、予報が「雨が降る確率」で表されているように、その情報は不確かです。


傘を持っていっても、結局雨が降らなければ、邪魔になるだけです。


また、傘を持っていかなくても雨が降ると、濡れてしまって風邪をひくかもしれません。


意思決定とは、この例のように、次にどういう行動をするかを決めることをいいます。


次の行動を決めるときに参考にする情報は、未来についての情報ですから、常に不確かです。


したがって、上の例のように、ある行動を起こしたが、その行動は結果的に間違っていたということが常に起こりえます。


そこで、間違った行動を起こしたときの損失を考えて行動を決定する必要があります。


さらに重要なのは、当然のことですが、


今から起こす行動が正しい行動なのか、それとも間違った行動なのかは、今の時点では不確かである。


ということです。それを承知の上で意思決定をするために、


今から起こす行動によって起きる損失の期待値を考えて、損失の期待値が少ない行動を選ぶ


という原理を採用します。



行動のもっともよい決め方:損失関数


先の雨傘の例のように、現実の状況に適切でない間違った行動をとると、何らかの損失が生じます


そこで、かつて問題になったインフルエンザ発生の疑いのある国からの旅行者の入国許可問題を考えてみましょう。


インフルエンザ発生の疑いのある国への渡航した人が帰ってくると、


@ほんとうにウイルスをもっている


A実際にはウイルスをもっていない


という2通りの状況が考えられます。


もちろん、この人がどちらであるかはわかりません。一方、日本側の行動は、


@入国を許可しない(空港ホテルに停留させる)


A入国を許可する


の2通りが考えられます。


このとき、その状況と行動の組み合わせによって、以下のような結果が生じます。


@ウイルスあり ⇒ 入国不許可により被害を未然に防ぐことができる。入国許可によりウイルスが蔓延する可能性がある。


Aウイルスなし ⇒ 入国不許可により観光や仕事ができなくなる。入国許可により特に問題はおこらない。


さて、問題なのは、状況は確実にはわからないので、いま行動を決めたとしても、それが正しい行動か間違った行動かはわからないことです。


ウイルスをもっているかどうかは検査しなければわかりませんし、検査してもほんとうに正確な結果がわかるかどうかはわかりません。


ウイルスをもっているかどうかについての推測にすぎません。


また、検査するのにはお金と時間がかかりますから、そもそもすべての入国者を検査することはできないかもしれません。


そこで、とりあえず検査(推測)を行ったとして、それぞれの推測結果に対して、それぞれよかれと思う行動を決めることにします。


この、推測結果ー行動の組を、ここでは「行動の決め方」jとよぶことにします。


たとえば、


@検査の結果、ウイルスがあると推測 ⇒ 入国不許可


A検査の結果、ウイルスがないと推測 ⇒ 入国許可


というのは、ごく常識的な、ひとつの行動の決め方です。あるいは、


@検査の結果、ウイルスがあると推測 ⇒ 入国不許可


A検査の結果、ウイルスがないと推測 ⇒ やっぱり入国不許可


というやりかた、すなわち、検査にお金がかかるので、検査などをせず、とにかく鎖国してしまえば安全というのも、ひとつの行動の決め方です。また、


@検査の結果、ウイルスがあると推測 ⇒ それでも入国許可


A検査の結果、ウイルスがないと推測 ⇒ 当然入国許可


というやり方もあります。


これは結局、検査などをせず、たいしたことではないから入国させてしまおうという考えです。


どの行動の決め方が一番いいかを選ぶのが、意思決定です。意思決定の考え方の指針として、


もっともよい行動の決め方とは、損失を最小にする決め方である


とします。そこで、損失をお金で表すという考えにしたがって、状況と行動の組み合わせに対して、発生する損失の額を見積もって割り振ります。


これを損失関数といいます。


行動のもっともよい決め方:危険関数


では、ひとつの行動の決め方について、ある状況が生じたときの損失はいくらになるでしょうか。


それは、何ともいえません。


なぜならば、行動の決め方では、ひとつの推測に対してひとつの行動が決まっているのであって、ひとつの状況に対してひとつの行動が決まっているわけではないからです。


推測は不確実ですから、あるひとつの状況においても、推測の結果にはいくつかの可能性があります。


たとえば、ほんとうはウイルスがあるというひとつの状況においても、推測の結果は


@ウイルスがあると推測(検査が正解)


Aウイルスがないと推測(検査が見逃し)


の2通りの状況が考えられます。


そこで、ほんとうはウイルスがあるというひとつの状況において、ウイルスがあると推測する確率と、ウイルスがないと推測する確率を見積もります。


こうすると、ほんとうはウイルスがあるという状況での平均損失、すなわち損失の期待値を計算することができます。


これを危険関数といいます。



未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

未来予測の羅針盤:損失最小化の行動選択術【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】