Open Box with STAT

基本的な統計学と疫学的手法,それらの文献等,R等の統計ソフトの使い方をブログ記事やYoutubeを用いて解説します.

Matched dataにはmatched analysisが必要か?

はじめに

観察研究の研究デザインの一つである症例対照研究(case control study)では,交絡を制御する一つの手段としてマッチングをおこなうことがしばしばあります*1

Modern Epidemiologyの勉強会(Chapter 8 Case-Control Studiesの会)*2で,@_vol_de_nuitさんから下記疑問が出ました.

マッチングしたら,どのような解析をしたら良いのでしょうか.条件付きロジスティック回帰分析が教科書的にすすめられますが,BMJの論文で普通のロジスティック回帰分析でも問題ないという報告がありました.どういうことでしょうか?

www.bmj.com (この論文はオープンアクセスです)

本記事では,上記論文を元に分かりづらいところは補いながら,マッチングした時の解析方法を整理していきます.またコホート研究ではなく,症例対照研究という条件のもと説明していきます.

Point

  • Matched analysisは二種類ある
  • マッチングの方法により,Matched analysisの方法を選ぶべき

マッチングの方法

マッチングには2つの方法があります.(マッチングの名前は私が便宜上つけただけで,正式なものではありません)

1. 1対少数マッチング: Caseに対して,Controlを1対1(〜少数)でマッチングさせる方法.ペアができるイメージ.

2. 層化マッチング: 事前にマッチング変数をいくつかの層に分けておき,その中でケースとコントロールをマッチングさせる方法

イメージは下の図の通りです.

f:id:shuntaro-web:20190830180937j:plain
マッチングの方法

Matched analysis

マッチングしたデータ(Matched data)に対する解析方法(Matched analysis)は2つあります34

1. 条件付きロジスティック回帰分析

2. 通常のロジスティック回帰分析+マッチング変数を説明変数に加える

多くの教科書でMatched dataに対しては条件付きロジスティック回帰分析をしなさいと書かれていますが,マッチングの方法により解析方法は変わります.

1対少数マッチングに対しては条件付きロジスティック回帰分析をおこなう必要があります.一方で層化マッチングに対しては通常のロジスティック回帰分析(マッチング変数を説明変数に加える)で解析することができます.

f:id:shuntaro-web:20190830204108j:plain

マッチング方法とMatched analysisとの関係
論文では同じ原集団(Source population)に対し,2つのマッチング方法に対応したMatched analysisを適用したシミュレーションの結果が載せてありました.どちらの方法でも点推定値は真値と同じであり,精度(95%信頼区間)は「層化マッチング」と「通常のロジスティック回帰分析+マッチング変数を説明変数に加える」方法の方が高いという結果でした.1対少数マッチングではCaseにマッチしないControlは解析に利用することができませんが,層化マッチングではそのような取り逃がしがなくサンプルサイズが大きくなることが多いからです.

どちらの方法を選ぶか?

この論文では,上記理由より「層化マッチング」と「通常のロジスティック回帰分析+マッチング変数を説明変数に加える」の組み合わせをオススメしています.

では,「1対少数マッチング」と「条件付きロジスティック回帰分析」の組み合わせの使い所はどこでしょうか.それはどうしても1対少数マッチングしかできないときです.例えば兄弟内でマッチングする時がそれにあたります.

まとめ

  • マッチングの方法は,1対少数マッチングと層化マッチングがある
  • Matched analysisは,条件付きロジスティック回帰分析と通常のロジスティック回帰分析(マッチング変数を説明変数に加える)がある
  • 1対少数マッチングは条件付きロジスティック回帰分析で解析するべし
  • 層化マッチングは通常のロジスティック回帰分析(マッチング変数を説明変数に加える)で解析するべし
  • 基本的には,「層化マッチング」と「通常のロジスティック回帰分析+マッチング変数を説明変数に加える」の組み合わせがオススメ

本記事では,マッチングをおこなうべきか?という議論はしませんでした.選択バイアスと絡んだ深い話になりますので,また次の機会に...

*1:と言いますか,あるようです.私は症例対照研究でマッチングをしたことはありません

*2:この読書会は素晴らしい会です.ビデオはYoutubeにあげられています.

www.youtube.com

*3:上記論文では,1の方法のみをMatched analysisとし,2の方法はStandard analysisとしていました.しかし2の方法もMatched dataに対して工夫した解析手法であるため,本記事ではどちらともMatched analysisとし整理しました.

*4:Mantel-Haenszel法でも解析できますが,より多くの交絡因子を調整できるロジスティック回帰分析で話を進めます