こんにちは、すきとほる疫学徒です。
”ゼロから始める 僕の、私の、初めての疫学研究”は、これまで疫学研究をほとんど行ったことがない方を対象に、「ゼロから研究を立ち上げ、掲載までもっていく」力を身につけて頂くためのシリーズ記事です。
疫学研究の土台となるClinical Question/Research Questionの作り方に始まり、研究計画の作り方、解析のやり方(これは別シリーズ、”初心者のためのRで医療ビックデータ解析”で解説中)、論文の書き方、投稿先の決定の仕方、レビュワーコメントへの対処の仕方など、疫学研究を完遂させる上で必要なノウハウを、ひととおりカバーするつもりです。
本シリーズで紹介する疫学研究の実践法は、あくまでも一つの型でしかありません。
取り掛かりやすさを優先するために、本シリーズでは研究実践において使えるフレームワークをいくつか紹介していくことになると思いますが、そのフレームワークが全ての疫学研究にうまくハマるわけではありませんし、状況によってはフレームワークから離れて思考を展開した方が良い場合もあります。
そうしたフレームワークの活用も含めて、研究者の数ほど研究方法があると思っておりますが、本シリーズは守・破・離で言えば”守”に該当するフェーズであると思っています。
「何から始めたらいいか分からない」という初心者が、最初の一歩として世界中で使われるフレームワークを活用しながら、疫学研究に取りかかるための橋渡しになれれば嬉しいと思っております。
本記事はパート2にあたりますので、未読の方はこちらからご覧ください。
Research Questionってなに?
パート1では、疫学研究の種であるClinical Questionについて解説しました。
Research Questionとは、Clinical Questionを研究に耐えうる形に昇華させた”問い”です。
ですので、ただ単に「こういうことが気になるから研究してみよう」とぼんやりと浮かんだ疑問を指すのではありません。
これからお伝えするような幾つかの観点からClinical Questionをトンカンとカスタマイズしていき、その先に完成するのがResearch Questionです。
Research Questionを創り上げるためには疫学の専門知識が必要であり、これが研究当初から疫学の専門家をプロジェクトにアサインするべきと言われる理由です。
腕のある疫学専門家は、使用できるデータソース、予算や時間、その研究で生じうるバイアスの種類と大小、先行研究と比較した新規性など、様々な観点を考慮したうえで、Clinical QuestionをResearch Questionへと発展させます。
もし疫学の専門家を入れずにResearch Questionを何となくで創り上げてしまったとすると、あとあと「そもそもこのResearch Questionは実現可能性がない」、「先行研究と比べて新規性が乏しく、やる意義がない」という大惨事に陥りかねません。
たとえば、すでに沢山の予算と人手を使ってしまってデータを集めて、解析の段階でようやく疫学家・統計家に相談したところ、そもそもチャレンジしているResearch Questionの実現可能性がなく、全てパァになってしまった、なんていうことも起こり得ます。
また、かろうじて論文化できたとしても、Research Questionの科学的意義が乏しければ、投稿してもどのJournalからもアクセプトされることはなく、Journalの海を長らく漂うことになるでしょう。
Research Questionは、研究という大海原を公開する際の羅針盤のようなものです。
疫学研究は、取り組むテーマを決めたら自動で曝露やアウトカムの定義が決まると言うわけではなく、仮説を設定し、定義し、その仮説の揺らぎに対応できるように感度分析的に異なる定義をし、と、方法論の各パートでベストな選択ができるように、迷いながらも前に進んでいきます。
そんな時に、立ち返るのはResearch Questionです。
「ここは、曝露の定義をAともBとも設定できるけれど、どうすべきだろうか?」
と悩み、
「Research Questionはこうだから、ここはAでいこう」
と、Research Questionを軸にして全ては決定されます。
だから、Research Questionには研究という長い航海を支えるための強度が必要なのです。
では、研究に耐えうるためのResearch Questionを創り上げるためにはどうしたら良いのか。
使い勝手の良いツールがあるので、一緒に勉強していきましょう。
PICO (PECO)
PICO (PECO)は、Clinical Questionを定式化し、Research Questionへと構造化するためのツールです。
Population
Intervention/Exposure
Comparator
Outcome
これらの頭文字をとって、PICO (PECO)と呼ばれます。
例えば、「新しく開発された薬剤Aって、どれくらい安全なんだろう?」
というClinical Questionがあったとしましょう。
これから、PICO (PECO)を使って、このClinical Questionを構造化していきます。
なお、今回は観察研究を例にするので、取り上げるのはPECOです。
Population
Populationとは、その研究の対象集団のことです。
「対象集団って、薬剤Aを飲んだ人でしょ?」と思うかもしれません。
いえいえ、PECOを作るのは、そんな単純な話ではないのです。
研究においては、Populationを母集団とすると、その母集団全体を代表するように標本を抽出してこなければなりません。
この時、「薬剤Aを飲んだ人」をPopulationにしてしまうと、”全世界のありとあらゆる薬剤Aを飲んだ人”を母集団にし、代表可能性があるような集団を抽出しなければなりませんが、それってどんな集団ですか?
決めようがありませんよね。
ですので、Populationを研究で問うことができる状態にするには、より具体的に定義を決めなければなりません。
例えば、
・国や地域はどこか?
・年齢や性別はどうか?
・既往歴はどうか?
・年月はどうか?
などですね。
こうしてPopulationを具体的に定義づけることで、研究の対象にすべき母集団の輪郭が見えてきます。
だからこそ、「どういった集団から、いつデータを集めたら良いか」という研究のSettingを落とし込んでいくことができるのですね。
ここでは、薬剤Aを2018年に開発された成人に投与される肺がんの抗がん剤とし、以下のようにPopulationを決めてあげましょう。
Population: 2018年以降に肺がんの確定診断をされた20歳以上の日本人
論文のMethodにおけるInclusion/Exclusion Criteriaは、このPopulationをより具体的に落とし込んだものですね。
このことからも、研究がResearch Questionを軸にして発展していくということがお分かり頂けるかと思います。
Exposure
Exposureとは、その研究の主たる曝露のことです。
PICOの場合はIntervention、すなわち介入になります。
この場合は、薬剤Aですね。
実際に論文を書く時には、単に「薬剤Aの内服」を曝露とするだけでは不十分で、より詳細な定義を決めていかねばなりません。
・薬剤Aを何回内服したら曝露ありとするのか?
・比較群の薬剤にスイッチした場合は?
・中断した際は?どうなれば継続とみなす?
などですね。
しかしながら、そういった詳細な曝露の定義は、感度分析という形で複数定義、複数解析を行い、結果の頑健性を確認することが多く、そのためResearch Questionでそこまで詳細な定義を固めてしまうと、仮説の揺らぎに対応できなくなってしまいます。
ですので、ここではExposureはシンプルに薬剤Aとだけ定めておきましょう。
もちろん、詳細を定めてしまっても後々支障がないのだとしたら、少しでも詳細に記載しておいた方がベターだと私個人は思っております。
Comparator
Comparatorは、Exposureと対をなす比較群のことです。
薬剤Aの安全性を検証するためには、当然「同じような他の薬剤と比べてどうか」という基準で検証をしなければなりません。
ここで大切なことは、薬剤Aと比較可能性のある薬剤を選ぶということです。
薬剤Aは肺がんの治療のために使われる抗がん剤でした。
もし薬剤Aがファーストラインで使われる抗がん剤だとすると、比較群としてセカンドライン以降に使われる薬剤を選ぶことは適切でしょうか?
もちろん適切ではありませんよね。
ファイーストラインの抗がん剤を投与される患者と、セカンドライン以降の抗がん剤を投与される患者とではまるで状態が違いますので、その2剤を投与された患者間で安全性を比較したとしても、フェアな比較ができるわけがありません。
同じように、静脈投与である薬剤Aに対して、経口投与である薬剤を比較するのもフェアではありませんね。
また、薬剤Aが肺がんの中でも特にバイオマーカーXを有する患者に対して使われる薬剤だとすると、バイオマーカーXを有さない患者に対して使われる薬剤を比較群にセットするのもフェアではありません。
これらは全て、比較研究における比較のフェアさ、つまり2群の患者間の交換可能性という観点からの議論です。
ちなみに薬剤疫学の場合は、Indication Biasと呼ばれます。
このように、Indication Biasを最小限にするための適切な比較群はなんなのか、それを踏まえてComparatorを設定してあげましょう。
ここでは、
薬剤Aと同じ投与経路で、同じステージの患者に対して使われ、また肺がん治療の専門医からみても実際に同等の状態の患者に使われると納得感を得られる薬剤BをComparatorに設定することにしましょう。
Outcome
最後は研究のアウトカムです。
今回のClinical Questionは、「薬剤Aの安全性はどのようであるか」というものでしたので、アウトカムも安全性に関連したものになります。
しかしながら、ここで「Outcome = 安全性」とするだけでは、当然ながら不十分です。
安全性に関するアウトカムは山ほど存在しますので、これだけでは何をアウトカムにすれば良いかわかりません。
よく論文のタイトルで「Association between A and patient outcomes」などという表現を見ますが、”patient outcome”という用語からは患者を対象にした研究であるということしか読み取れず、アウトカムの情報が全く伝わってきませんので、個人的には不適切なタイトルであると思っております。
ですので、どのような安全性の中でもどのようなアウトカムに着目しているのかをReserach Questionで明示せねばなりません。
例えば、薬剤Aの治験の結果からは、特に肺炎のリスクが高いことが懸念されているとしたら肺炎をアウトカムに設定するなど。
ここで大切なことは、「この際だから、いろんなアウトカムを見ちゃえ」と、そのアウトカムを見る上で十分なRationaleを設定できないにも関わらず、単に自分の興味本位で手当たり次第にアウトカムを設定することです。
統計解析において、解析の数が増えれば増えるほど、αエラーと呼ばれる問題が起こりやすくなり、「本当は関連がないのに、解析上は関連があるかのように見えてしまう」という状態になります。
アウトカムは、必ず生物学的、臨床的、疫学的なRationaleに乗っ取り、必要最低限のものを設定しましょう。
FINER
さて、PICOでClinical QuestionをResearch Questionへと構造化したあとは、FINERを使い、Research Questionのクオリティをアセスメントします。
FINERは、
Feasibility
Interesting
Novel
Ethical
Relevant
それぞれの頭文字をとっています。
Feasibility
Feasibilituはその名の通り、研究の実現可能性のアセスメントです。
サンプルサイズは十分か、(比較研究であれば)両群の背景はバランシングできるか、曝露やアウトカムの誤測定リスクは許容範囲ないかどうかなど、疫学研究をやる上では様々な観点から実現可能性をチェックせねばなりません。
そのためには当然、その分野のドメイン知識、疫学・統計学などのメソドロジーの知識、そして(2次データ利用研究の場合は)使用するデータベースの知識という、3本柱の専門性が必要になります。
いずれかが欠けていると、適切な実現可能性調査を行えなくなりますので、事前に専門家をプロジェクトにアサインすることで、十分な専門性を担保してから実現可能性調査を行いましょう。
実現可能性調査に関しては、お伝えすべきことが山のようにあるために、こちらから始まる一連の記事で紹介しております。
Interesting
Interestingは、そのResearch Questionの科学的な興味深さです。
ここで注意が必要なのが、「誰にとっての」興味深さかということです。
研究を行うわたし、
ではなく、
その研究の先にいる患者、医療者、そして他の研究者にとっての「興味深さ」ですね。
このことを考えるたびに、わたしの学部生時代、初めて卒論の執筆に取り掛かった時のことを思い出します。
研究テーマを決めるために、指導教官の下を訪れ、「こんなことが知りたい、あれに興味がある」と熱弁していました。
そんなわたしに指導教官は一喝。
「君の興味などどうでもいい。気になることがあるなら、自由研究でやればいい。論文というのは、Publicにとっての課題、Publicの関心に応えるために書くものである」
冷静になって思い返せば、良いResearch Questionというのは、自分の興味とPublicの興味、双方を満たすものだと思うのですが、「研究はPublicのためにやるもの」なんていう考えが微塵もなかった学部生のわたしにとっては、指導教官の一言は頭の中を走り抜ける稲妻のようなものでした。
こうした反省から、わたし自身がResearch Questionを考える際には、Feasibility同様に該当するドメイン分野の専門家に必ずヒアリングをし、その研究に面白みがあるかどうかを確認するようにしています。
Novel
Novelは、その研究の新規性です。
たとえFeasibleでInterestingなResearch Questionであろうと、すでに誰かが明らかにしているならば、研究を行う意義はありません。
日本で行われている研究に、しばしば「〜は他国では調査されているが、日本ではまだ調査されていない」という言い回してNovelを強調している論文がありますが、残念ながら「日本では行われていないから」というのは、Novelの根拠としては脆弱です。
世界の研究者から見て、そのResearch Questionを日本で行うことに十分な意義が感じられるというのなら話は別ですが、そのようなRationaleの提示なしに、「日本ではまだ行われていない」とだけ主張しても、レビュワーからは「Novelでない」と判断されてしまうことでしょう。
Ethical
Ethicalは、研究の倫理性です。
たとえば、介入研究を行う際。
介入を受けた、もしくは受けないことで明らかに被験者の利益が損なわれる場合は、Ehicalではないと判断されます。
Relevant
Relevantは、その研究の重要性です。
そのResearch Questionに答えることによって、医療政策や実臨床のプラクティスに意味のある影響をもたらすことができるかどうかということを意味します。
論文で言うと、最終的にConclusionに記載する、その研究のImplicationにも繋がってきますね。
何らかの2つのグループ間でアウトカムを比較する因果推論では、しばしば「研究結果が有意であればImplicationがあるが、有意でなければImplicationがない」という状況が生じます。
しかしながら、こういった状況になってしまうのは、そもそものResearch QuestionがRelevantではなかったからであり、RelevantなResearch Questionであれば、結果が有意であっても有意でなくても、読者に対して重要なImplicationを提供できるのだと思います。
終わりに
いかがでしたでしょうか?
疫学研究に慣れ親しんだ方には、全く真新しいところのない記事になってしまいました。
PICOとFINER、項目にするとたった9項目しかありませんので、「たったそれだけ?」と思うかもしれません。
しかしながら、この9項目の精度をどれだけ上げられるかによって、その後の論文のいく末が決まると言ってしまっても過言ではないと思います。
どれだけオシャレな解析をしても、どれだけ大量のデータを集めたとしても、そもそものResearch QuestionがInterestingでない、Relevantでないなど、イケていないものであれば、せっかく書き上げた論文もJournalからAcceptされることはなく、長い間Journalの海を彷徨うことになるでしょう。
私も、何度かそう言った経験をして、その度に「あー、しまった。。。もっと誠実にFINERのアセスメントをしておくべきだった」と後悔しました。
ですので、Research Questionを創り上げる際には、必ずドメイン知識を持つ医療者(専門医)、疫学家・統計家、そして使用するデータに深い造形を持つ方にしっかりとコンサルし、意見をもらうようにしましょう。
すきとほる疫学徒からのお願い
本ブログは、全ての記事をフリーで公開しており、「対価を払ってやってもいいよ」と思ってくださった方のみに、その方が相応しいと思っただけの対価をお支払い頂けるPay What You Want方式を採用しています。
教育に投資できる方だけがさらに知識を身につけ、そうでない方との格差が開いていくという状況は、容認されるべきではないと考えているからです(そもそも私程度の記事によって知識の格差が広がると考えていることが、勘違いかもしれませんが)。
私自身も高校卒業後は大学・大学院の学費、生活費と自分で工面する中で、親の支援を得られる友人たちがバイトをせずに学習に集中したり、海外留学や旅行などの経験を積んだりする様子を見て、非常に悔しい想いをした経験があるので、そういった悔しさも本ブログの原動力の一つになっています。
読者の皆様におかれましては、「勉強になった!」、「次も読みたい!」と本ブログに価値を感じてくださった場合のみ、ご本人の状況が許す限りにおいて、以下のボタンからご自身が感じた価値に見合うだけの寄付を頂戴できますと幸いです。
もちろん価値を感じなかった方、また学生さんなど金銭的に厳しい状況にある方からのご寄付は一切不要です。