【今日の授業】疫学と統計

今日は数学系の授業が二つなので、結構大変な日です。

午前中は疫学です。最初は疫学で使う様々な指標を学ぶ時期らしく、データを加工して作った指標を大量に学びます。今日は


Effectを測る指標と言うことで、Rate Ratio(RR)、Rate Difference(RD)、Rate Difference %(RD%)などが中心でした。それぞれ、健康への危険要因にさらされた人の中での病気のRateまたはRisk(r1)と危険要因にさらされていない人のRateまたはRisk(r2)を比較した物で、RRはr1/r0、RDはr1-r0、RD%はr1-r0/r1で求められます。要するに、危険要因にさらされた人が病気となった原因として、危険要因が影響したと思われる値がどれくらいかということを調べる数値のようです。

レクチャーの後は演習です。演習では、今世紀の半ばに行われた英国における喫煙と病気の関係について調べた調査のデータを使って、病気の原因のどの程度が喫煙によるかを上記の指標を用いて分析してみるというものでした。喫煙者と非喫煙者で肺ガンの発生が顕著に違うと言うことが数字から分かりました。これだけ明確な数字が出ると、生物学的に喫煙は肺ガン発生に影響するということも推測できるそうです。

午後は統計でした。統計は、前回のレクチャーで習ったことを使った演習をまずやって、その後次のセクションのレクチャーに移るということで、他の授業のように習ったことをすぐ演習するというスタイルと若干違っています。週2回なので、前のレクチャーのことは覚えているし、なにより少し時間がたってからもう一度やるのは、より記憶に残ってよいと思います。ということで、前回のレクチャーで習った、Standard Errorを使って実際のデータを分析してみました。グループ4人でやったのですが、概念を理解するのにみんな苦しんでいるようで、相互に教えあって、さらにTutorにも聞いてという感じで進みます。これくらいの規模でInteractiveに進むのがやはり理解促進には良いようです。その後のレクチャーでは、Significance Testという概念を習いました。要するに、データの信頼性を測る手法ということのようで、例えば、まず危険要因への曝露が健康に影響しないという仮説を立てて(Null Hypothesis)、であれば両者の相違は起こらないはずなので、実際のデータが違っているようであれば、この際が生じるチャンスがどれくらいあるのか検証し、そのチャンスが大きければ、仮定は間違っているの危険要因が健康に影響していると言えるという流れで検証するそうです。このとき、チャンスを測るために、差のStandard Errorを計算するのですが、その後P-valueやZなどの概念が出てきて、これにあてはめて計算して、数値がいくつ以下だったら、両者に差が出ない確立が低いので、影響していると判断できるとのことでした。この辺は、原理を考えるよりも、覚えてしまった方が良さそうです。次の演習で実際に使うのでこのときまでにもう一度整理したいと思います。

こうして新しい概念がたくさん登場するのですが、週の前半はじっくりと復習する暇もなく、翌日の授業に備えなければなりません。水曜の政策の授業は、読み物が他よりもかなり多いことが判明してきました。今日も指定された教科書の章を読むだけで、3時間くらいかかってしまい、疫学の予習が十分できませんでした。政策の授業の予習は週末も使った方が良さそうです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です