2022年05月 : 岩本康志のブログ

岩本康志のブログ

経済,財政の話題を折に触れて取り上げます。

2022年05月

Yahoo! ブログから引っ越しました。

ワクチン効果に関する誤情報

 4月21日、首相官邸の公式アカウント(首相官邸(新型コロナワクチン情報)、https://twitter.com/kantei_vaccine)がとんでもない情報を発信してしまった。



 このツイートにある図は、ワクチン接種歴別(「未接種」「2回接種済み」「3回接種済み」に分類)に、それぞれの人口10万人当たり1週間の新規陽性者数(以下では便宜上「発生率」(incidence rate)と呼ぶことにする)を示したものである。ワクチン接種者が陽性者になりにくいことが示されていて、河野太郎元ワクチン担当相が、これを引用して、ワクチン接種を推奨するなど、反響が大きい。
 
 ツイートに「厚生労働省 専門家会合」とあるのは、「新型コロナウイルス感染症対策アドバイザリーボード」のことで、この会議の趣旨は、「新型コロナウイルス感染症対策を円滑に推進するに当たって必要となる、医療・公衆衛生分野の専門的・技術的な事項について、厚生労働省に対し必要な助言等を行うものとする。」とされている。 ツイートの元データは、厚生労働省が作成し、この会議に継続的に提出していた資料の4月20日版である。この後はいったん途切れて、5月11日に新しく3週分がまとめて発表された。この5月11日版では、集計方法が変更されて、未接種者の発生率が大きく減少した。2回接種と3回接種が区分された後の4月13日版・4月20日版(3月28日~4月10日分)と5月11日版の3週分(4月11日~5月1日分)の「ワクチン効果」(vaccine effectiveness)を「未接種」と「2回接種済み」で対比させたのが、下の図である。「ワクチン効果」は、「1−(2回接種済みの発生率/未接種者の発生率)」で計算している。これは、ワクチン未接種の新規陽性者がかりにワクチンを接種していれば陽性者にならなかった割合である。100%であれば誰も陽性にならなくなり、0%であれば発生率は変わらない。やや粗い計算であるが、発生率は発表されている1週間の計数の平均をとっている。

ワクチン効果に関する官邸発誤情報


 90歳以上を除く年齢層では、集計方法変更後でワクチン効果が大きく下がっている。効果がマイナスになる(つまり、ワクチンを接種すると陽性になりやすい)年齢層も数多くある(なお、65~69歳は大きく負になるので、グラフからはみ出すように縦軸が設定されている)。つまり、ワクチンの効果が誇張されたデータが、厚生労働省から首相官邸経由で拡散されていたことになる。

 ここで何が起こったのかを知ることは、データ分析の良い教材になる。
 新規陽性者のワクチン接種歴の元データは、HER-SYSに登録される発生届である。ワクチン接種歴の記入欄は、「有・無・不明」の3種類となっている。そして、この欄に「未記入」の発生届もある。したがって、HER-SYS上のデータは、「有・無・不明・未記入」の4つのどれかになる。
 アドバイザリーボードには、鈴木基・国立感染症研究所感染症疫学センター長が、HER-SYSによるワクチン接種歴のデータを継続的に提出している。その2021年12月16日版で集計方法が変更され、2020年第47週までは「未記入」を「無」(未接種)に含めていたが、第48週から「未記入」を「不明」に含めるようになった。下の図はこの資料での47~49週の新規陽性者の「未接種」と「不明」の数であるが、集計方法の変更は未接種者数に無視できない影響があることがわかる。

 

65歳未満

65歳以上

 

接種なし

接種歴不明

接種なし

接種歴不明

47

332

38

16

9

48

327

147

8

16

49

289

161

8

36


 一方、厚生労働省資料は鈴木先生資料のような変更をずっとおこなわず「未記入」を「無」に含めていたが、やっと5月11日からは「不明」に含めるように変更した。発生率の分母となる人口は、別データから推計されている(じつはここにも大きな問題があって、この記事の末尾と関係する)。したがって、集計方法の変更によって、未接種者の発生率の分子が大きく減少して、発生率が大きく減少した。逆に言うと、集計方法の変更以前は未接種者の新規陽性者が多かったため、ワクチン効果が大きく出てしまっていた。
 本来は、ワクチン接種歴は「有」「無」のどちらかしかない。「不明」「未記入」は、本来の情報が得られていない「欠測値」(missing value)である。欠測値は、統計調査ではよく発生するものである。それが発生したときにどのように扱うか、そして欠測値をできるだけ発生しないようにするにはどのような調査方法をとればいいのか、は統計データの質を高め、分析の質を高めるための重要な作業である。しかし、統計学の学習は必要な情報がそろったデータの扱いから始まるので、欠測値をどう扱うのか、の議論は軽視されやすい。
 統計学の学習者も機械学習や因果推論のような「高度な」手法を勉強したくて、データの未記入の取り扱いのような泥臭いことは軽視するかもしれないが、実務的に取り扱いを誤ると、首相官邸が誤情報を拡散するような事態を引き起こす。また、機械学習や因果推論を伝統的な統計的手法と対比するときは、欠測値の補完という概念を使うと見通しが良くなるという効能もある。
 さて、厚生労働省資料の取り扱いの問題点を理解するために、以下のような例題を考えよう。

あるアンケートの回答者100名の性別欄が男60人、女20人、未記入20人であった。このデータをどう処理するか。
(A)未記入20人を全員、「男」として扱う。
(B)未記入20人を「男」10人、「女」10人に按分する。
(C)未記入を、「不明」として「男」、「女」と別に扱う。
(D)未記入を回答者の比率で、「男」15人、「女」5人に按分する。

 常識的に(A)や(B)はおかしい、と思う人がほとんどだろうが、厚生労働省はそうは思わずに(A)を選んだ、と言える。厚生労働省にデータ分析のリテラシー(欠測値の扱い方)が無さすぎることが原因であろう。昨年12月に発覚した、国土交通省の「建設工事受注動態統計」で過大集計がされたのも、欠測値に対してとんでもない処理をしてしまったことが原因であり、厚生労働省だけの問題ではない。役所内の人材を育成することが急務であるが、それができるまでは、たとえば専門家が専門的・技術的な事項について必要な助言等をおこなう会議に資料を提出してチェックを仰ぐような対策が考えられる。...ん?


 一瞬、筆が止まってしまったが、気を取り直して、つぎの例題に移ろう。

前立腺がん患者へのアンケートの回答者100名の性別欄が男60人、女20人、未記入20人であった。このデータをどう処理するか。

 数値は前の例題と同じなので前の例題と同じように考える、というのは間違いである。まず、前立腺は男性のみがもつ臓器なので、「未記入20人を全員、「男」として扱う」は常識的に「正しい」。問題にしなければならないのは、どうして20人も「女」と回答しているのか、である。かりに1人であれば、間違って記入したか、ふざけて記入したか、の可能性がある。この場合、アンケートの他の項目の回答状況を見て、ふざけて回答しているのか、真面目に回答しているのか、を検討する。前者であればこの観測値は分析には使用しないし、後者であれば、誤記入を訂正して使用する場合と使用しない場合があり得る。しかし、100人中20人も「女」と回答しているとなると、まずはデータに何かとんでもないことが起こっているのではないか、を疑わないといけない。
 ワクチン効果の事例に戻ると、①90歳以上で高くて集計の変更の影響を受けていないこと、②64-69歳で著しく低いことは、データで何かとんでもないことが起こっている可能性を検討すべきである。実際、とんでもないことが起こっているのだが、ここで解答をすべて明らかにせず、一部を謎のままにしておく方が関心を持っていただける人が多くなることを期待して、このままにしておく。ヒント:首相官邸サイトの「新型コロナワクチンについて」ページにある資料では、90歳代の1回以上接種率が100%を超えている(当記事執筆時点。この資料は随時、更新されるので、アクセスしたときには違った数値となっている可能性がある)。
 それでは、ご検討(ご健闘)を祈る。

[2022年5月25日追記]Twitterで解答と修正案が寄せられたので、ご紹介したい。データに制約がある状況では、どのような修正案にも誤差が含まれるのは避けられないが、この修正案は誤差を小さく抑え込んでいると思われる。

「外部性と公衆衛生的介入」

 報告が遅れましたが、4月18日、「感染症対策の厚生経済学:外部性と公衆衛生的介入」を公開しました。「感染症対策の厚生経済学:解説」(英語版はWelfare Economics of Managing an Epidemic: An Exposition)では、経済学の外部性の概念を用いて感染症対策での公衆衛生的介入(NPI、non-pharmaceutical intervention)の根拠を議論しましたが、それを補完する補遺になります。
「解説」では、SIRモデルでの社会的な観点から望ましい感染症対策を、ポントリャーギンの最大値原理を用いて特徴づけましたが、この方法では、民間の自発的な予防行動と政府による公衆衛生的介入が区別されません。「補遺」では、個人の視点から望ましい対策と社会的な観点から望ましい対策のそれぞれを、動的計画法を用いて特徴づけています。両者の差異が、公衆衛生的介入で是正すべき部分であり、民間の予防行動へのピグー補助金(経済活動へのピグー税)として表現できます。
 また、動学モデルを用いていることから、外部性が静学的外部性と動学的外部性の2つに分類されます。感染症の予防では、個人が利己的であると他人に感染させる社会的費用を考慮しなくなるという外部性は以前から認識されていましたが、SIRモデルで動的計画法を用いて分析されたのは新型コロナウイル感染症の発生以降になり、そこで示される動学的外部性は新しい概念になります。動学的外部性では、感染の収束が近いことが予見されると「逆ロックダウン」(inverse lockdown)が望ましくなるという、興味深い(常識に反する)結果が得られています。ただし、将来を完全に予見できないと動学的外部性は正確に把握できないので、政府が動学的外部性を正しく補正できるとは限りません。
「解説」と「補遺」は同じ問題(社会的に最適な対策)を違った手法で解いていることになり、得られる解は同じですが、その解の表現にはそれぞれの利点があります。「補遺」の方法では、外部性と公衆衛生的介入が明示的に示されることが利点です。難点としては数式が長くなって追いかけづらいことがあるので、「補遺」を読む際には、数式は適当に飛ばし読みしてください。一方、「解説」の方法では、動学的外部性の意味を理解しやすいことが利点です。
 経済学での伝統的な外部性には当てはまりませんが、政府と個人が違う目的関数をもつときの問題も、外部性と同じ構造として理解できます。モデル化は簡単すぎるので「補遺」では省略して、政策的含意のみ議論していますが、感染症に関する情報の差異、感染症の影響の異質性、利益集団の存在等で目的関数が異なることの問題は、新型コロナウイルス感染症対策を考える上で非常に重要です。政府の目的関数が歪んでいるときに政府が私権を制限できると、社会的に大きな悲劇を生みます。

参考文献
「感染症対策の厚生経済学:解説」

「Welfare Economics of Managing an Epidemic: An Exposition」

「感染症対策の厚生経済学:外部性と公衆衛生的介入」

プロフィール画像のサイズ

 勤務先がカメラマンを呼んで教員のプロフィール写真を撮影することになり、私も撮ってもらった。原稿や講演で顔写真の提供を求められることがあるので、データをもらって自分で使用するプロフィール画像のデータを作成した。これまでは画像をいじっていると、画素数が少なくて粗くなったり、よくわからないまま変なことになったりするので、今回は少し調べて、考えてみた。
 もらったデータの画素数は、縦5,584ピクセル、横8,368ピクセル。縦横比は2:3。今回の作業には関係ないが、EXIF情報には350dpiとある。縦にあと16ピクセル、横にあと32ピクセルあると縦5,600ピクセル、横8,400ピクセルになり、実寸は縦16in(406mm)、横24in(610mm)で、ワイド六切(8in×12in、203mm×305mm)の4倍の大きさになる。
 証明写真で使われるサイズの履歴書、パスポート、免許証と、35mmフィルムを加えて、サイズ、縦横比をまとめると、表のようになる。

 

サイズ

縦横比

 

縦(mm

横(mm

35mmフィルム

36

24

3:2

履歴書

40

30

4:3

パスポート

45

35

9:7

免許証

30

24

5:4


 SNSのプロフィール画像の用途がある正方形から出発して、横をトリミングして各サイズに対応させることにした。まず、縦横比の縦の最小公倍数は180であるが、トリミングしやすいように横を偶数にするには、その倍の360とする必要がある。このとき、横は240から360の間の偶数になる。
レイアウト(顔の大きさ)は、パスポートの指定(顔の上4±2mm、顔の長さ34±2mm、顔の下7±2mm)を参考にする。元のデータをトリミングするには、縦2400ピクセルか、2520(360の7倍)ピクセルが適当なようであるが、顔が小さくなる後者を選ぶことにする。
 Windowsの標準ツールを使う手順は、少しややこしい。「ペイント」は、ピクセル数を指定してトリミングできない。「ペイント3D」は、元データのサイズを編集できない。そのため、「ペイント」で必要なトリミングより少し大きくて「ペイント3D」で編集できるサイズにトリミングする。その後、「ペイント3D」で2520×2520ピクセルにトリミングして、プロフィール用画像のデータを作成する。
 以下は、縦を360ピクセルか、2520ピクセルにそろえたときの各サイズのピクセル数である。今後、写真を提供した先でトリミングする場合には、こちらを参考にしてもらうことになる。

縦横比

 

縦(ピクセル)

横(ピクセル)

縦(ピクセル)

横(ピクセル)

3:2

35mmフィルム

360

240

2520

1680

4:3

履歴書

360

270

2520

1890

9:7

パスポート

360

280

2520

1960

5:4

免許証

360

288

2520

2016

1:1

SNS

360

360

2520

2520


 プロフィール写真は普通、縦長なのだが、横長サイズの依頼もあり得る。横長のサイズには縦2520ピクセルを基本として横の空白を増やすことで対応できるだろう。35mmフィルム(縦横比2:3)、SDTV(3:4)、HDTV(9:16)に映画のサイズが考えられるが、映画のサイズがフィルムとスクリーンで少し違っていてややこしいので、横長サイズは考えないことにした。
 いろいろ計算したが、そもそもの写真の問題(眼鏡に部屋の照明が反射している)はどうしようもない。
月別アーカイブ
アクセスカウンター
  • 今日:
  • 累計:

  • ライブドアブログ