新型コロナ:高齢化率を用いた死亡率の年齢調整の近似計算
日本の死亡率は東+東南アジアの中では二番目に高いということが政府を批判する文脈でよく主張されています。しかし、これは誤りです。
COVID-19は年齢が高いほど死に至る率が高くなります。そのため、死亡率は高齢化が進行した国では自然と高くなってなります。したがって、死亡率を比較や分析に使うときには、人口構成が同じになるような数学的補正を施す必要があります。この補正を年齢調整と呼びます。
年齢調整をするためには死者の年齢構成のデータが必要です。
ただ、、ほとんどの国ではそのデータの入手が困難なので、年齢調整できる国は限られています。また、年齢調整の計算は簡単なんですが、国が多数になると面倒です。
そこで、高齢化率で近似的に年齢調整することを試みました。前の記事にも書きましたが、だいたいうまく近似できています。この記事にその詳細を書きます。
まず、近似式を示します。A国とB国の死亡率を比較するときの近似式は次のようになります。
(B国の近似値)=(B国の死亡率)×(A国高齢化率)/(B国高齢化率)
これはA国の人口構成にB国の死亡率を合わせるような補正になっています。
簡単ですね。簡単すぎてうまく働くのか不安になります。
ということで、まず適度に高齢化の進行が異なる韓国で試しました。
結論を最初に言っておくと、うまく働きます。高齢化率に大きな差があると少し誤差が大きくなるようですが、それでも生の数字を使うよりは近似的年齢調整値の方がはるかに正確な値になります。
韓国と日本の人口構成比は次のようになっています。
年代 | 日本 | 韓国 | 補正係数 |
80- | 9.1% | 3.4% | 2.68 |
70-79 | 12.8% | 6.7% | 1.91 |
60-69 | 12.6% | 12.0% | 1.05 |
50-59 | 13.0% | 16.5% | 0.79 |
40-49 | 14.6% | 16.3% | 0.90 |
30-39 | 11.2% | 14.0% | 0.80 |
20-29 | 10.1% | 13.3% | 0.76 |
10-19 | 8.8% | 9.5% | 0.93 |
0-9 | 7.8% | 8.3% | 0.94 |
補正係数は高齢化率の単純な比で、これを用いて年齢調整をします。
韓国のCOVID-19の死亡の年齢構成と年齢調整後の数値は次のようになります。ここでは死亡率として、100万人あたりの死亡数を用いています。
年代 | 死者/100万人 | 年齢調整値 |
80- | 2.48 | 6.65 |
70-79 | 1.50 | 2.87 |
60-69 | 0.74 | 0.78 |
50-59 | 0.29 | 0.23 |
40-49 | 0.06 | 0.05 |
30-39 | 0.04 | 0.03 |
20-29 | 0.00 | 0.00 |
10-19 | 0.00 | 0.00 |
0-9 | 0.00 | 0.00 |
合計 | 5.12 | 10.61 |
日本の高齢化率は27.6、韓国の高齢化率は14.4です。最初の近似式で補正した死亡率は9.8となります。正解10.61に十分に近い値であることが分かります。
同様に、年齢構成データが得られた国について試しました。近似式のA国を日本として計算してあります。
国 | 高齢化率 | 日本との比A | 死亡数/百万人B | 年齢調整値 | 近似年齢調整値A*B | データ採録日 |
日本 | 27.6 | 1.00 | 6.81 | - | 6.81 | 5月27日 |
韓国 | 14.4 | 1.92 | 5.12 | 10.61 | 9.80 | 5月16日 |
中国 | 10.9 | 2.53 | 0.71 | 1.71 | 1.80 | 2月11日 |
フィリピン | 5.1 | 5.41 | 7.93 | 31.4 | 42.9 | 5月20日 |
スペイン | 19.4 | 1.42 | 411 | 585 | 584 | 5月15日 |
イタリア | 22.8 | 1.21 | 512 | 624 | 620 | 5月20日 |
ドイツ | 21.5 | 1.28 | 98.4 | 128 | 126 | 5月23日 |
スイス | 18.6 | 1.48 | 181.7 | 300 | 269 | 5月12日 |
カナダ | 17.2 | 1.60 | 60.9 | 112 | 97.7 | 5月21日 |
チリ | 11.5 | 2.40 | 42.6 | 101 | 102 | 5月23日 |
フィリピンを除き、非常に近い値が得られています。フィリピンについては36%ほどの誤差がありますが、それでも補正しないよりは補正したほうが正しい年齢調整値に相当近くなっています。
このように、高齢化率を使って近似的に年齢補正ができること、生の数字よりもより正しいものに近い数値が得られることが分かりました。
なお、中国の数値が古いですが、最新のデータでは死亡率は3.22人/100万人です。これを近似年齢補正すると8.15人/100万人となります。年齢調整後は、韓国、中国、フィリピンの数値よりも日本の数値が低くなっており、本記事の最初で述べた「東+東南アジアの中では二番目に高い」という主張は間違いであることがわかります。
また、上記により死亡率が高齢化の進行に大きな影響を受けることが分かります。同様に致死率も高齢化の影響を強く受けます。年齢調整が必須ですが、同様の手法で致死率も高齢化率を使って近似的に年齢調整できると思います。ただ、致死率の年齢調整には、感染判明者の年齢分布のデータが必要で、死亡率よりもデータが揃わないので、まだ計算していません。
以上です。
いくつか補足します。
人口構成と高齢化率は次のサイトから入手しました。
https://www.populationpyramid.net/
https://www.globalnote.jp/post-3770.html
人口構成は2019年のものを使いました。高齢化率はサイトでは2018年となっていますが、日本の数値は現在は28.4%です。27.6%は2016年ごろのものと思われますので、この2018年は信用できません。ただ、差は小さいので近似計算に問題はありません。
COVID-19による死亡の年齢構成は、主として英語版Wikipediaから入手しました。中国だけは、論文から入手しました。中国のデータの日付が古いのはそのためです。
https://en.wikipedia.org/wiki/COVID-19_pandemic_by_country_and_territory
https://www.nejm.org/doi/full/10.1056/NEJMoa2002032
日本の死亡率はWorldmeterから入手しました。
https://www.worldometers.info/coronavirus/