市民のためのがん治療の会
市民のためのがん治療の会
良いとこ取りで、患者のために

『すでに医師の平均を上回っている人工知能の診断精度
~人工知能は医師の仕事をどのように奪うのか?~』


ただともひろ胃腸肛門科院長
多田 智裕
最近、囲碁で「AlphaGo(アルファ碁)」がプロ囲碁棋士を次々に破り、話題になった。 また先般、東大医科学研究所はIBMの人工知能「ワトソン君」が特殊な白血病患者の病名を10分ほどで見抜き、その生命を救ったと発表した。
患者とするとAIだろうがなんだろうが、正確に病名を診断し治療法も提示してもらえるのは結構な話だろうが、 何でもそうだが新しいシステムに移行するときとか、技術革新が進むときには、様々な混乱が生じるが、今回も、色々な混乱が生じているようだ。
そこで今回はいつもながらの鋭い視点で現状を分析しておられる武蔵浦和メディカルセンターただともひろ胃腸科肛門科院長の 多田智裕先生のご許可をいただき先生のご寄稿を転載させていただいた。
このレポートは多田先生がJBpress本年5月3日(http://jbpress.ismedia.jp/articles/-/49873) にご寄稿されたもので、2017年6月5日 MRIC by 医療ガバナンス学会 発行   http://medg.jpに転載されたものをご許可を得て転載させていただいた。 いつもながらのご厚意に感謝いたします。
(會田 昭一郎)

「人工知能が普及していったら医師の仕事がなくなってしまうと思うのですが、今後どのようなことを学んでいけば良いのでしょうか?」

「人工知能が医師の仕事を奪うなんて、ありえない!そんなことを言う奴は医師の風上にも置けない、けしからん!!」

これは数カ月前の某学会での一コマです。

人工知能の性能がどんどん上がっていけば、自分たちの仕事がなくなってしまうのではないか? ?人工知能と共存する時代にどのようなキャリアパスを積めば良いのか──?若手医師が気にするのも当然だと思います。

一方で指導医が、医師の仕事が人工知能に取って代わられるわけないだろ!と若手医師を叱咤激励する気持ちも分かります。

果たして、人工知能は医師の仕事をどう変えていくのでしょうか。

私は、医療現場で使われる人工知能の特性や実力がどのようなものなのかを知れば、おのずと道が見えてくるのではないかと考えています。 ここではその一助として、最新の医学論文による人工知能の評価方法と結果を紹介しましょう。

●診断精度を評価する「感度」と「特異度」

病気の診断能力は「感度」と「特異度」で検証します。 医学における「感度」とは、「陽性と判定されるべきものを正しく陽性と判定する確率」を指します。

病気を診断する感度が95%ということは、100症例の病気のうち95症例を病気と正しく診断したということになります。 でも、この情報だけでは、本当にその精度が高いのか低いのか判断ができません。

もしも、どんなも人にでも95%の確率で“悪性”と診断するとしたらどうでしょうか? この場合、本物の病気を病気と診断する確率は95%なので、感度は95%です。 けれども同時に、病気でない人も95%の確率で「病気である」と診断してしまうわけです。 全然異常がない人のほぼ全てを「病気」と診断するのでは、感度95%が優秀とは言い難いでしょう。

そこで、「特異度」のチェックが必要になってきます。これは「陰性のものを正しく陰性と判定する確率」を指します。 先の例の場合、感度は95%と高いのですが、病気でない人を正しく「病気でない」と診断する特異度は5%ととても低くなってしまいます。

このように、診断能力の精度は、「感度」と「特異度」の両方の数値のチェックが必要なのです。

しかし、人工知能の報道を見ていると「ガンを95%の確率で診断した」というように、 片方の数値(おそらく感度)しか報道していない事例が多く見受けられます。

感度を上げるには特異度を下げれば良いのですから、片方の数値のみ報道するのは意味がありません。 感度と特異度の両方を評価する必要があるのです。

●トップクラスの医師には勝てないが医師平均を上回る


ここまで理解していただいたところで、上の図をご覧ください。 この図はあくまでこのコラム用にイメージとして作成したものですが、 現在発表されている人工知能診断の論文では(私どもが研究中の結果を含めて)人工知能の診断精度は多くがこのような形になります。

グラフでは曲線が人工知能の診断精度になります。 それに対して、人間医師の診断精度は赤い点で示されています(人工知能の感度と特異度はプログラミングで調整できるので、連続的な曲線で示すことができます。 一方、人間医師の診断精度は人により固定されているので非連続的な点で示されるというわけです)。

これを見ると、“感度が高いが、特異度の低い”医師がいたり(やたら多く検査を勧める医師がこれに当たります)、 “特異度が高いが、感度が低い”医師(検査をいっぱい勧めてはこないが、病気の発見が遅れることも多い)がいたりすることが分かります。

しかし、トップ10%くらいの医師は、感度も特異度も共に人工知能を上回っており、 人工知能よりも少ない検査で正しく病気を検出できるということになります。

なお、緑の点は人間医師の平均です。人間医師の平均よりも、人工知能の方が上回っているという結論になります。

これまで発表されている人工知能の性能評価は、メラノーマ(皮膚ガン)の診断、糖尿病性網膜症の診断、 そして私たちが研究しているピロリ菌胃炎診断などに関するものです。 これらの診断において、人工知能は現状ではトップクラスの医師には勝てないが、 医師平均を上回る性能出していると思っていただければ概ね正しい認識と言えるでしょう。

●人工知能がアシストする時代はもうすぐ

冒頭の会話に戻ると、修行を積まなければ人工知能以下の精度しか出せないわけですから、 若手医師が自分の仕事に意味がないように感じ、何をしたら良いか不安に思うのも当然でしょう。

一方、指導医は人工知能以上の精度が出せるわけですから、 若手医師に「人工知能が人間医師に取って代わるわけがない」「まずは人工知能以上の精度が出せるまで修練を積むべきだ」と指導するのも当然でしょう。

いずれにせよ、人工知能診断が医療現場で医師のアシストとして使用される時代はすぐそこまで来ています。 不必要に恐れたり、役に立たないと決めつけるのではなく、それを利用してより良い医療を提供できるように努めるのが、 患者さんに最良の医療を提供する私たち医療従事者の務めだと私は思います。


多田 智裕(ただ ともひろ)

平成8年3月東京大学医学部医学科卒業後、東京大学医学部付属病院外科、国家公務員共済組合虎ノ門病院麻酔科、東京都立多摩老人医療センター外科、 東京都教職員互助会三楽病院外科、東京大学医学部付属病院大腸肛門外科、日立戸塚総合病院外科、東京大学医学部付属病院大腸肛門外科、 東葛辻仲病院外科を経て平成18年武蔵浦和メディカルセンターただともひろ胃腸科肛門科開設、院長。

日本外科学会専門医、日本消化器内視鏡学会専門医、日本消化器病学会専門医、日本大腸肛門病学会専門医、日本消化器外科学会、日本臨床外科学会、 日本救急医学会、日本癌学会、日本消化管学会、浦和医師会胃がん検診読影委員、内痔核治療法研究会会員、 東京大学医学部 大腸肛門外科学講座 非常勤客員講師、医学博士
Copyright © Citizen Oriented Medicine. All rights reserved.