本記事には不正確な情報が含まれている場合があります、問題があれば修正・削除しますので、ご指摘願います。
こんにちは、きっちゃん(@I_am_Entraineer)です。
新型コロナウイルスの感染拡大が続いており、外出を控えている方が多いかと思います。私もいつも行くジムが閉鎖になり、替わりに家や公園でトレーニングをやっています。環境が変化してストレスに感じることも多いかと思います。しかし長い人生ですので、1年2年そんな時期があっても仕方ないな!くらいの気持ちでのんびりトレーニングを続けられると良いですね。
新型コロナウイルスに罹患しているかどうか、PCR検査を利用しています。PCR検査について、わかりやすく書かれていた記事がありましたので、紹介いたします。
PCR検査は特定の遺伝子(今回の場合は新型コロナウイルス)を増幅して、DNAが確認できれば陽性、確認できなければ陰性と判定するようです。増幅させるには、目的の病原体のDNA配列にくっつけられるプライマー(短いDNA)が必要なようです。新しいウイルスですから、これにくっつけられるプライマーも新たに検証されたものと考えられます。このあたりの経緯が国立感染症研究所に掲載されており、また病原体検出マニュアルPDFも公表されています。
検査手法の整備自体が最近なされたことが書かれれおり、現場の苦労が感じられます。
さてこの新型コロナウイルスに関するPCR検査は、精度がそれほど高くないことで有名です。感染者が検査を受けて陽性結果が出る確率を「感度」と言いますが、感度は70%程度とのことです。
PCR検査を受けて陰性と判定されたとしても、「感染していない」とは言い切れないようです。ではこの言い切れない程度はどの程度なんでしょうか?これは、今たまたま勉強していた統計学でよく出てくる問題のようでして、「ベイズの定理」を使えば求められるようです。今回はこの「ベイズの定理」を使って計算してみたいと思います。
ベイズの定理とは?
ベイズの定理の詳細は以下をご確認ください。
簡単に言うと、「事前確率と事後確率は違う」ということです。。。いやわかんないですよね。
もっと簡単な例えがあったので紹介すると、電車で隣に座っていた人が「かつらを被っている確率」が30%(事前確率)だとしたとき、「生え際が不自然」という情報が加わると「かつらを被っている確率」は70%(事後確率)まで高まるよね?ということだそうです。つまり状況によって確率が変化するということを示していて、この考え方がはやりの機械学習にも応用しているようです。
PCR検査が陽性で感染者である確率は?
ベイズの定理の式は以下のようになっています。
展開して以下のように使われることが多いようです。
わかりやすいように、それぞれの確率が何に相当するか以下に示します。
・事象A:PCR検査の検査結果。A1が陽性、A2が陰性
・事象B:感染者かどうか。B1が感染者、B2が非感染者
・P(B1|A):PCR検査が陽性で感染者である確率
・P(A|B1):感染者がPCR検査が陽性となる確率
・P(A|B2):非感染者がPCR検査が陽性となる確率
これを式に当てはめると、以下のようになります。
このことから、「PCR検査が陽性で感染者である確率」は、「感染者である確率」の影響を受けることがわかります。
思考実験してみよう
上記を利用して、色々仮定をした実験をしてみたいと思います。PCR検査の感度(感染者が陽性になる確率)は70%、特異度(非感染者が陰性になる確率)は99%としましょう。2020/4/9時点でPCR検査で陽性になった人は4667人だそうです。これは検査を受けた方だけですので、どうでしょう、エイヤで実際にコロナウイルスに罹患している人数は10倍の5万人としましょうか。では日本人1.2億人が全員検査したとするとどうなるでしょうか?
項目 | 記号 |
[CASE1] 日本人全員が検査対象 |
||
---|---|---|---|---|
検査対象者 | --- | 120,000,000 | ||
罹患者 | --- | 50,000 | ||
罹患率 | --- | 0.04% | ||
感染者である確率 | P(B1) | 0.04% | ||
感染者でない確率 | P(B2) | 99.96% | ||
感染者がPCR検査が陽性となる確率 | P(A|B1) | 70.00% | ||
感染者がPCR検査が陰性となる確率 | P(Ac|B1) | 30.00% | ||
非感染者がPCR検査が陽性となる確率 | P(A|B2) | 1.00% | ||
非感染者がPCR検査が陰性となる確率 | P(Ac|B2) | 99.00% | ||
PCR検査が陽性で感染者である確率 | P(B1|A) | 2.84% | ||
PCR検査が陰性で感染者である確率 | P(B1|Ac) | 0.01% |
全然精度があがりません。やたら滅多に検査をしても、感染者だけを抽出することは困難であることがわかります。
では、検査対象を絞ってみます。厚生労働省のHPを見ると、PCR検査実施人数は約6万人とあります。陽性患者の大体10倍くらいの人数が検査を受けているようです。ということで、感染者数5万人に対して、「コロナっぽいな」と感じた50万人が検査を受けたとしましょう。
項目 | 記号 |
[CASE2] コロナっぽい人 50万人が検査対象 |
||
---|---|---|---|---|
検査対象者 | --- | 500,000 | ||
罹患者 | --- | 50,000 | ||
罹患率 | --- | 10.00% | ||
感染者である確率 | P(B1) | 10.00% | ||
感染者でない確率 | P(B2) | 90.00% | ||
感染者がPCR検査が陽性となる確率 | P(A|B1) | 70.00% | ||
感染者がPCR検査が陰性となる確率 | P(Ac|B1) | 30.00% | ||
非感染者がPCR検査が陽性となる確率 | P(A|B2) | 1.00% | ||
非感染者がPCR検査が陰性となる確率 | P(Ac|B2) | 99.00% | ||
PCR検査が陽性で感染者である確率 | P(B1|A) | 88.61% | ||
PCR検査が陰性で感染者である確率 | P(B1|Ac) | 3.26% |
全然精度が違います。PCR検査の感度以上に陽性患者を抽出できており、検査を有効活用できているように感じます。それでも10%の方は陰性なのに陽性判定を受けます。陽性判定を受けたからには患者は入院せざるを得ず、感染者がたくさんいる場所に収容されるわけです。判定を受けた時点では非感染者であったとしても、隔離されているとはいえ、感染者が多くいる場所で過ごすとどうなりますでしょうか。何となく想像できますよね。
おわりに
申し訳ありませんが私は統計学の初学者ですし、感染症の専門家でもありません。ですからこの考察が正しいかどうかもわからず、デマになるかもしれない不安があります。ただ、「どんどんPCR検査を増やすべきだ!」とか、「簡易キットで調べて安心した」と話す方が見かけられたので、ちょっとでも考えるヒントになればと思い記事にしました。参考になれば幸いです。