【今日の授業】疫学、統計

今日の午前中は、疫学の授業ですが、先週からの引き続きで、調査のデザイン。先週どの調査方法にするかを選択して、リスクファクター(Indoor air pollution)と結果(ARI)の測定の方法など話し合いましたが、今週はそれをポスター二枚にまとめる作業でした。測定の仕方で若干疑問が残っていた(村落からランダムに選んで測定してしまうとoutcomとの関係付けが弱くなる)ので、その点を少し議論し、また対象の選び方など細かいところも話しましたが、結局はポスター二枚なので、細部までは書ききれませんでした。一人よくしゃべるお兄ちゃんがいて、非常にクレバーなので彼との議論はとても楽しいのですが、時々違う方向に突っ走るところがあって、修正するのが結構大変。その後、他のグループのポスターを見て、疑問点をポストイットに書いて貼っていき、その後各グループが質問に答える形で発表していきました。

午後は統計。まずはコンピューターを使った演習。先週習ったcoeficient corelationについて、Stataを使って実習。scatter diagramを作り、そこに関係があるのかないのかcorelationを現す線を引くというもの。二人一組で、もう一人に説明しながら進め、分からないところはチューターに助けてもらい、Interpretationの仕方などよくわかりました。corelationで、-1から1までの数値で関係を表して、絶対値が1に近いほど、関係があるとの説明だったのですが、これをどのような時に使うのかについては結局分からずじまい。y=a+bxの等式にして、aとbのP-valueを見る方が、分かりやすいし説明もしやすいようです。

演習の後はサンプリングについてのレクチャー。今回も前回と同様、具体的な内容なので非常に分かりやすく思いました。2ステップのランダムサンプルについてですが、クラスターを選ぶときに、それぞれのサイズが違った場合にどう調整するかという話。それぞれの個人または世帯が、同様の確立で選ばれることがランダムであることの条件ということで、クラスターはランダムに選んで、そこから取るサンプルを変えるか、クラスターのサイズを考慮して選ぶか二通りの方法があるのですが、統計学では後者を採用するようで、その具体的な方法を学びました。具体的には、対象となる個人すべてにクラスターごとに並べて番号を割り振って、必要なサンプル数で割った数からランダムに数字を選び、そこからはシステマティックに次のサンプルを選ぶというもの。多分、次の演習で実際にやってみるはずなので、そこでやるとほぼ完璧に理解できると思います。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です