喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】 | Google Gemini・Python・エクセルを使った講義で最速マスター

セミナー案内             AIデータサイエンス動画           インスタグラム

喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】
観察研究では、人為的操作ができない喫煙や飲酒などの曝露の影響を調べます。リスク差やリスク比は性別や年齢などの要因が異なるため、効果の指標として解釈することはできません。因果関係を調べるには、現在の病気の有無ではなく、新たに病気が発生するかどうかを調べることが重要です。ある時点での調査は横断研究、時間を追って調査を行うのは縦断研究と呼ばれます。横断研究は、ある一時点での状況を把握するのに有用で、縦断研究は時間をかけて因果関係を追跡する方法です。観察研究では、調査対象に介入しないため、因果関係の評価は困難ですが、適切な方法を用いれば評価可能です。

喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】▼▼▼▼▼▼▼▼
チャンネル登録はこちら


目次  喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


観察研究における曝露群と非曝露群


ランダム化研究では、例えば、対象者が薬を飲むか飲まないかをランダムに決める、という人為的操作をします。


つまり、ある人には薬を飲むように介入し、他のある人には薬を飲まないように介入するのです。


このように、


対象者に介入行為をして、その影響を調べる研究のことを介入研究と言います。


介入研究では、薬物を投与したり、手術をしたり、といったように、主として治療の効果を調べます。


それに対して、観察研究では、対象者に介入行為をしません


よって、


対象者に介入行為をしないで、その影響を調べる研究のことを観察研究と言います。


観察研究では、喫煙や飲酒といった、人為的操作のできないもの、つまり、介入できないものの影響を主として調べます。


タバコを吸いたくない人にタバコを吸うように介入することなんてできませんよね。


このように介入できないものを、しばしば曝露と呼びます


その要因がある(例えば喫煙ありの)人たちを曝露ありグループとか曝露群、その要因がない(例えば喫煙なしの)人たちを曝露なしグループとか非曝露群と呼ぶこともあります



観察研究での因果関係の評価


観察研究では、人為的操作のできないものの影響を主として調べます。


因果関係が調べられる条件のうち、調べたい要因が人為的に操作可能である、が満たされないことになります。


人為的に操作可能でないということは、ランダム割り付けできないということです。


その結果として、調べたい要因(原因)以外のすべての条件がグループ間で等しい、という前提も満たされないことになります。


例えば、喫煙の影響を調べようとしたとき、喫煙ありグループと喫煙なしグループで、性別や年齢といったいろいろな要因が異なっている可能性が高いです。


一般に、観察研究では単純に因果関係を調べることができないのです。


単純にとわざわざ言っているということは、単純ではない方法を使えば因果関係が調べることができるのです。


リスク差とリスク比


簡単で時間のかからない調査


飲酒と心疾患の間の関係を知りたいとしましょう。


最も簡単に時間をかけずにこの関係を調べようと思ったら、現在、飲酒の習慣のある人とない人を集めてきて、現在の心疾患の状況を調べればよいと思うかもしれません。


そうすると、


現在飲酒の習慣があって、現在心疾患に罹っている人
現在飲酒の習慣があって、現在心疾患に罹っていない人
現在飲酒の習慣がなくて、現在心疾患に罹っている人
現在飲酒の習慣がなくて、現在心疾患に罹っていない人


の4パターンの人がいるはずです。


この4パターンそれぞれの人数がデータとして得られることになります。


集計したら次の表のようになったとしましょう。


飲酒あり、心疾患あり 200人
飲酒あり、心疾患なし 600人
飲酒なし、心疾患あり 120人
飲酒なし、心疾患なし 1080人


リスク差を計算してみると、


200/800―120/1200=0.15


となります。


リスク比を計算してみると、


200/800/120/1200=2.5


となります。


これらの指標からだけで、飲酒すると、飲酒しない場合に比べて、心疾患を発症する人が100人中15人増える、飲酒すると、飲酒しない場合に比べて、心疾患を発症する危険性が2.5倍増える、とは解釈できません。


飲酒ありの人たちと飲酒なしの人たちで、きっと性別や年齢といったいろいろな要因が異なっているから、効果の指標としては解釈できないのです。
しかし、問題はそれだけではないのです。


有病と発症


現実的ではないけれども、もし仮に、飲酒ありの人たちと飲酒なしの人たちでいろいろな要因が完全に一致していたとしましょう。


それでも因果関係は調べられないのです。


リスク差やリスク比を効果の指標として解釈することはできないのです。


なぜでしょうか?


ここで調べているのは、飲酒の状況も心疾患の状況も、両方とも現在の状況です。


きっと、心疾患になったから飲酒をやめた人がいるでしょう。


このような人は、(飲酒なし、心疾患あり)に含まれます。


もしかすると、最近飲酒するようになった人がいるかもしれません。


このような人は、(飲酒あり、心疾患なし)に含まれることになります。


それに、飲酒したことで心疾患に罹って死亡した人もいるはずです。


現在死亡しているので、(飲酒あり、心疾患あり)には含まれません。


もちろん、飲酒しないで心疾患に罹って死亡した人もいるでしょう。


これでは、飲酒すると心疾患になりやすいかどうか、なんてわかるわけありません。


飲酒すると心疾患になりやすいかどうかのように、原因と結果の間の関係を調べようとするときには、「現在病気であるかどうか」を調べるのではなくて、「新たに病気になるかどうか」を調べることが重要なのです。


現在病気であることを有病としい、新たに病気になることを発症とか発生あるいは罹患と言います


横断研究と縦断研究


現在の時点での飲酒の状況と心疾患の状況を調べるように、


ある一時点で調査を行う研究を横断研究と言います。


これに対して、飲酒ありの人となしの人を集めてきて、何年間か追跡調査して心疾患が発生するかどうかを調べるように、


時間を追って調査を行う研究を縦断研究と言います。


これまでの話だと、いかにも横断研究が役立たずのように思えるかもしれませんが、必ずしもそういうわけではありません。


例えば、どの国で肥満の割合が高いか、といった比較をしたいときには、横断研究が大いに役立ちます。


縦断研究にはいくつかの方法があります。



喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】


セミナー詳細                    解析ご相談                    LINEでお友達

喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】

喫煙と飲酒の影響を探る観察研究の重要性【東京情報大学・嵜山陽二郎博士のAIデータサイエンス講座】