Negative controlについて

2023年6月2日
疫学

こんにちは、すきとほる疫学徒です。

本日は、観察研究において因果推論の頑健性を確認するために用いられる手法である、Negative controlに関して説明していきたいと思います。

なお、本記事は以下の文献を参考に執筆されています。

Lipsitch M, Tchetgen Tchetgen E, Cohen T. Negative controls: a tool for detecting confounding and bias in observational studies. Epidemiology. 2010 May;21(3):383-8. doi: 10.1097/EDE.0b013e3181d61eeb. Erratum in: Epidemiology. 2010 Jul;21(4):589. PMID: 20335814; PMCID: PMC3053408.

本ブログは、私が業務上知り得たいかなる情報にも基づかず、一般論もしくは広く公開された情報のみに基づき執筆されています

本ブログは、私個人の責任で執筆され、所属する組織の見解を代表する物ではありません

1 Negative controlとは何か
2 Negative controlを使用した実例
3 Negative controlの選択基準について
4 もうちょっとNegative controlの具体例を
5 終わりに
6 すきとほる疫学徒からのお願い

Negative controlとは何か

Negative controlには、Negative control outcome (NCO)とNegatice control exposure (NCE)の2タイプが存在します。

ちなみに、Negative controlは交絡因子だけではなく、選択バイアス、測定バイアスのインパクトを可視化する場合にも使用されますが、話をシンプルにするため、この記事では交絡因子に対するNegative controlについてのみ説明していきます。

今、とある薬剤Xが患者の健康アウトカムYに与える因果効果を推定したいという状況にあるとしましょう。

また、薬剤X-健康アウトカムYの因果関係に影響する全ての交絡因子をUとします。

この時、NCOとは、

「交絡因子に対し、薬剤X-健康アウトカムY間と同じ構造を有するが、薬剤Xとは因果関係を有さないアウトカムO」と定義されます。

また、NCEとは、

「交絡因子に対し、薬剤X-健康アウトカムY間と同じ構造を有するが、健康アウトカムYとは因果関係を有さない曝露E」と定義されます。　

図にすると以下です。

Negative Control Outcome

Negative Control Exposure

O・E共に、A-Y間に存在する交絡因子Uを共有しているが、A-OおよびE-Yというパスが伸びていないことがお分かり頂けるかと思います。

では、上記の過程が完璧に成立している際に、A-OおよびE-Yの間の因果関係を推定する解析を行うと、どのようなことが分かるかを考えてみましょう。

既にA-OおよびE-Yの間には、因果関係が存在しないことは分かっているので、正しく交絡因子を除去した解析が行えていれば、「A-OおよびE-Yの間には因果関係があるとは言えない」という結果になるはずです。

もし「A-OおよびE-Yの間には因果関係がある」という解析結果となった場合、それは「説明しきれない交絡因子Uが存在している」ということを示唆します。

この時、OおよびEはA-Yと交絡因子Uを共有しているわけですから、A-Yの因果関係を推定するために行った解析においても、同様に説明しきれない交絡因子Uが交絡バイアスをもたらしていると言うことができるわけです。

反対に、「A-OおよびE-Yの間には因果関係があるとは言えない」という解析結果となった場合、それは解析において適切に交絡因子Uが考慮されていることを示唆するため、A-Yの因果関係の推定においても、交絡因子Uによる交絡バイアスの影響がない、ということを示すことができます。

つまり、本来見たかったA-Yの因果関係の推定において、結果の頑健性を保証することができるわけですね。

Negative controlを使用した実例

抽象的なお話だけでは分かりにくいと思うので、薬剤疫学において実際にNegative controlを使用した例を紹介したいと思います。

紹介するのは、こちらの論文です。

Pharmacoepidemiology and Drug Safetyという、薬剤安全性におけるリーディングジャーナルに掲載された論文です。

Levintow SN, Orroth KK, Breskin A, Park AS, Arredondo JHF, Dluzniewski P, Navar AM, Sørensen HT, Brookhart MA. Use of negative control outcomes to assess the comparability of patients initiating lipid-lowering therapies. Pharmacoepidemiol Drug Saf. 2021 Dec 11. doi: 10.1002/pds.5396. Epub ahead of print. PMID: 34894377.

面白いのは、この研究、「メインの解析があって、その頑健性の証明のためにNegative controlを使った」というわけではなく、「ある薬剤AとNegative control outcomeの因果効果を推定した解析は、unbiasedなものであるかどうか」ということそのもので論文を書いているんです。

おそらく、この次にやりたい研究があり（薬剤Aと心血管疾患の間の因果関係の推定）、その前哨戦として、まず「やりたい研究をやった際、適切にバイアスがコントロールできるか」ということを確かめるために、Negative control outcomeを用いた研究をやったのでしょう。

非常に慎重な態度であり、「特に交絡因子の影響を受けやすい観察研究においては、これくらい慎重にならねばならないな」と、私も大変感銘を受けました。

では、論文の中身の紹介に入りましょう。

筆者らは、アメリカの診療報酬請求データを用いて、PCSK9阻害薬、エゼミチブ、またはhigh-intensity statinのいずれかを2015年から2018年の間に使用開始した成人を特定しました。

そして、PCSK9阻害剤 vs エゼミチブ、およびPCSK9阻害剤 vs high-intensity statinという2種類の解析を行いますが、この時にアウトカムとしてPCSK9阻害薬、エゼミチブ、またはhigh-intensity statinのいずれとも因果関係のない幾つかのアウトカムを設定し、「関連があるとは言えない」という正しい結論が解析から導き出されるかを確かめます。

この際、曝露：PCSK9阻害剤とアウトカム：心血管疾患に対するNegative controlとして、専門家集団が潜在的な交絡因子に関するメカニズムを考慮し、10種類のNegative contol outcomeを選出しています。

専門家集団は、PCSK9阻害剤-心血管疾患における交絡因子として大きく2つが存在するとし、frailityを交絡因子としたNegative control outcomeとして4つを、そしてhealth-seeking behaviorを交絡因子としたNegative control outcomeとして6つを設定しています。

前者は、たとえばaccidentやfractureです。

そして後者は、たとえばinfluenza vaccineやcolon cancer screeningです。

この際に置かれている仮定は、

「frailtyがある患者はPCSK9阻害剤を投与されやすく、かつ心血管疾患のリスクが上昇する。同様に、frailtyがある患者はaccident/fractureを経験するリスクが上昇する。さらに、PCSK9阻害剤の投与とaccident/fractureの間には因果関係はない」、または

「health-seeking behaviorを有する患者はPCSK9阻害剤を投与されやすく、かつ心血管疾患のリスクが低下する。同様に、health-seeking behaviorがある患者はinfluenza vaccine/colon cancer screeningを受ける可能性が高い。さらに、PCSK9阻害剤の投与とinfluenza vaccine/colon cancer screeningの間には因果関係はない」というものです。

この時、もし解析結果がPCSK9阻害剤とそれぞれのNegative control outcomeの間に因果関係があることを示したならば、それは本来見たいと思っているPCSK9阻害剤-心血管疾患の関係においても、frailtyもしくはhealth-seeking behaviorに関する説明しきれない交絡因子が存在することを示唆するわけです。

解析後、本来は因果関係がないはずなのに、PCSK9阻害剤群において幾つかのNegative control outcomeのリスクが低いという結果が示されました。

これにより筆者らは、「PCSK9阻害剤-心血管疾患の因果関係を推定する際には、frailtyもしくはhealth-seeking behaviorに関する説明しきれない交絡因子が存在し、それらの交絡因子の影響を除外するための工夫が必要である」と結論づけています。

Negative controlの選択基準について

さて、上に述べた実例では、「専門家集団が、交絡因子のメカニズムを考慮し、10個のNegative control outcomeを選出した」と書かれていました。

では、実際に我々がNegative controlを選択する際には、どのような基準で選択すれば良いのでしょうか？

理想的なNegative controlを使用した場合、A-NCOもしくはNCE-Oに因果関係がないことを除き、この２変数の共通原因のセットUは、本来因果関係を測定したいA-Yの共通原因のセットと完全に一致します。

この時、NCOとアウトカムYはU-comparableなアウトカムであると表現されます（もしくはNCEとAはU-comparableな曝露である）。

ここで注意しなければならないのが、設定したNCOまたはNCEがU-comparableかどうかはデータからは判断できず、あくまでも推定の域を出ないということです。

U-comparableの仮定が崩れることで、Negative controlを用いることで、本来因果関係を明らかにしたいA-Yにおいて、交絡バイアスの有無を誤って推定してしまうということが生じ得ます。

その一つ目が、A-NCO間には、A-Y間の交絡でない未測定の交絡U2が含まれていた場合です。

この場合、A-NCOに関連があることを示唆する結果が出たとしても、「A-Yの関連はbiasedである」とは言えません。

二つ目は、A-NCO間の交絡が、A-Y間の交絡の一部のみしか共有していなかった場合です。

この場合、A-NCOに関連がないことを示唆する結果が出たとしても、「A-Yの関連はbiasedでない」とは言えません。

さて、ここで肝心なのは、「ではどのようにしてU-comparableであるNCOまたはNCEを発見できるのか」ということでしょう。

私自身は、一つのNCO・NCEを設定することでU-comparableである状況を作り出せるのは、極めて限られた状況でしか実現できないと感じています。

A-Yの交絡因子の中には、既知の科学では発見できていないような未測定の交絡因子Uが存在すると考えた方が妥当だと思いますが、この際、この交絡因子Uをも共有できるようなNCO・NCEを発見すると言うのは、かなり非現実的に感じます。

ですので、Negative controlの実例で紹介した論文で行ってたように、オリジナルのA-Yの因果関係を推定する上で、特に懸念となる交絡因子（frailty、health-seeking behavior）をターゲットにして、それぞれの交絡因子を共有するようなNCO・NCEを設定していく、というアプローチの方が現実的だと感じています。

ただこの場合、設定したNCO・NCEは”frailty・health-seeking behaviorに対してU-comparableである”ということまでしか言えませんので、A-Y間にfrailty・health-seeking behavior以外の交絡因子Uが存在する場合は、仮にNeagtice controlを用いた解析で関連を示唆しない結果が出たとしても、A-Yの関連は依然として交絡因子Uによりbiasedとなっているリスクがあるため、注意が必要です。

もうちょっとNegative controlの具体例を

さて、残りのパートでもう少しNegative controlの具体例を紹介していきましょう。

交絡因子に対するNegative control

・海水浴と感染症の関連

とある海水浴場で泳いだ客において、消化器系の感染症が多発しました。

研究者は海水が何らかの細菌に汚染されていた可能性を考慮し、海水浴の有無を曝露に、そして感染症の発症をアウトカムにして回帰分析を行いました。この際、交絡因子Uの影響が懸念されたため、NCEとして”海水浴場には来たが、海には入らずビーチで過ごしていた”という事象を設定しました。

海水の汚染が感染症の原因だとすると、海に入らずビーチで過ごしていた客は汚染されるリスクがありませんので、2変数間には因果関係が存在しません。また、海水浴をした客も、ビーチに来た客も（海水浴はしなかったが）、属性などの背景因子が高確率で類似していることが想定できます。

・妊娠中の薬剤Xの曝露と児の奇形発症の関連

妊娠初期における薬剤Xへの曝露が、児における奇形を発症させるリスクが懸念されていました。

研究者は、2変数間の因果関係を調べるために回帰分析を行ったものの、上の例同様に交絡因子Uの影響が懸念されます。

この時、NCEとして妊娠中期または後期における薬剤Xへの曝露を設定し、交絡因子の影響を確かめる解析を行いました。

妊娠中期・後期の薬剤曝露は児の奇形に影響しないため、理論的には2変数間には因果関係が存在せず、また曝露時期は違えど、同じ薬剤を内服していることから、妊婦の背景因子は高い確率で共通していることが想定されます。

Recall biasに対するNegative control

この記事では主に交絡因子に対するNegative controlを説明してきましたが、冒頭に書きました通り、Negative controlは交絡因子以外のバイアスに対しても用いることができます。

一つ目の例として、Recall biasに対してNegative controlを設定した例を紹介します。

Recall biasとは、Measurement biasの一つであり、アウトカムを持つ（もしくは持たない）ことが曝露の測定（recall）に影響を与えることで生じるbiasです。

例えば、とある薬剤Xと有害事象Yの因果関係を測定するための研究を行った際、薬剤Xの曝露は患者の報告により測定するとします。この際、マスメディアなどで「薬剤Xが有害事象Yを起こす可能性あり？！」といったニュースが流れ、患者自身もその可能性があることを知っていたとすると、有害事象Yを経験した患者ほど、「過去に薬剤Xに曝露した」という経験を思い出しやすくなります。この時、本来は薬剤Xと有害事象Yの間には因果関係がなかったとしても患者の報告上は、有害事象Yを経験した患者で薬剤Xに曝露したことが高頻度で報告されますので、見かけ上は因果関係があるように見えてしまいますね。

これがRecall biasです。

さて、本記事の執筆において参考にした論文では、NCEとして以下の例を取り上げていました。

本来研究者が調べたかった関連は、”小児期の感染症曝露とその後の多発性硬化症の発症”の因果関係です。

解析結果は、2変数間に因果関係があることを示唆していましたが、研究者はRecall biasの存在を疑っていました（多発性硬化症を発症した人ほど、小児期に感染症に罹ったことを思い出しやすくなり、見かけ上の因果関係があるように見えてしまっている）。

このため、研究者はNCEとして手足の骨折、扁桃腺摘出、脳震盪の経験の有無を尋ねる質問をあらかじめ質問紙に追加しておりました。

その結果、これらの疾患はその後の多発性硬化症の発症とは因果関係がないはずなのに、解析上は関連ありという結果となり、小児期の感染症曝露と多発性硬化症発症の間にもRecall biasが存在する可能性が示唆されました。

Immortal time biasに対するNegative control

Immortal time biasは日本語で不死時間バイアスと呼ばれるバイアスで、Selection biasの一つです。

曝露群もしくは非曝露群のどちらかにおいて、”アウトカムを発症し得ない時間”を追跡期間に含めてしまうことで生じるバイアスです。

例えば、心血管疾患で緊急入院をした患者において、入院3日目の薬剤X投与が在院死亡率を低下させるかどうかを明らかにしたかっとしましょう。

この際、曝露群・非曝露群を同様に入院時点から追跡してしまうと、Immortal time biasが生じるリスクが生まれます。

なぜなら、薬剤Xに曝露した群というのは、「入院３日目までは死なずに、薬剤Xの曝露を受けられた群（つまり、この３日間がImmortal time）」になり、曝露群においてのみ入院後の3日間分だけ生存期間が多く見積もられてしまっているからです。

さて、本記事の執筆において参考にした論文が例として取り上げていたNCEは以下です。

本来研究者が調べたかった関連は、”鼻用コルチコステロイドへの曝露と喘息”の因果関係です。

この場合、鼻用コルチコステロイドに曝露するまでに時間が、理論上は喘息を起こし得ないImmortal timeだと考えられています。

Immortal biasの影響を測定するため、研究者らはNCEとして”一度のみの鼻用コルチコステロイド使用”を設定しました。

一度の鼻用コルチコステロイド使用で喘息が予防できるとは考えられず、またこのNCEは初回の解析とImmortal time biasを共有しています。

結果、NCEを用いた解析でも鼻用コルチコステロイド使用と喘息の発症の間には関連が見つかり、そのため研究者は初回の解析もImmortal time biasに影響を受けていると結論づけるに至りました。

終わりに

以上で、Negative controlに関する説明は終わりです。

いかがでしたでしょうか？

非常にシンプルなテクニックですが、U-comparableの仮定を満たしたNegatice controlを設定できれば、着目している曝露-アウトカム間の因果推論を行う際に、その頑健性を強化することができますよね。

Bias、特に未測定の交絡因子の問題が常につきまとうデータベース研究のおいては、大変使い勝手の良いツールだと感じています。

Biasを考慮する上で、このようにシンプルかつ強力なツールの存在を知るたびに、「先人の疫学者たちは、なんて賢い人たちなんだ」と感動しておりますが、Negative controlもそのような感動を与えてくれるツールの一つでした。

長くなりましたが、本日もご覧くださりありがとうございました。

すきとほる疫学徒からのお願い

本ブログは、読者の方が自由に記事の金額を決められるPay What You Want方式を採用しています。

「勉強になった！」、「次も読みたい！」と本ブログに価値を感じてくださった場合は、以下のボタンをクリックし、ご自身が感じた価値に見合うだけの寄付を頂戴できますと幸いです。

もちろん価値を感じなかった方、また学生さんなど金銭的に厳しい状況にある方からのご寄付は不要です。

引き続き情報発信していく活力になりますので、ぜひお気持ちに反しない範囲でご寄付をお願い致します！

ご寄付はこちらから

薬剤疫学、製薬キャリアに関する最新情報はこちらから

フォローする

前の記事
記事がありません
次の記事

2021年12月22日
データベース研究における妥当性指標間の優先順位の付け方

Negative controlについて

Negative controlとは何か

Negative controlを使用した実例

Negative controlの選択基準について

もうちょっとNegative controlの具体例を

交絡因子に対するNegative control

Recall biasに対するNegative control

Immortal time biasに対するNegative control

終わりに

すきとほる疫学徒からのお願い

データベース研究における妥当性指標間の優先順位の付け方

疫学の最新記事8件

【DeSCデータベース編】日本で使える医療大規模データベースの”一歩進んだ”解説

【疫学専門家の脳内を暴露】疫学思考をリアルな研究相談での会話を通してお伝え！

【保存版】観察研究を視覚化！デザインダイアグラムの描き方ガイドライン

【保存版】研究の必需品！一歩進んだTable 1の描き方ガイドライン