医学よもやま話

医学情報をご提供します。

人工知能と医師との関係

advertisement

人工知能は医師と患者を救う。

****

f:id:tpspi:20170711104143g:plain

Credit:  スーパーコンピュータ京、未来をひらこうポスト「京」 ~日本のスーパーコンピュータ開発プロジェクト~より

 

脳卒中の診断

脳の組織が死んで灰色になれば脳卒中の診断は簡単であるが、多数の神経細胞が死ぬ前に脳卒中を早期に診断することが重要である。放射線医が早急に診断できれば、血栓を溶かすなどの治療が行える。

ERでは一分経過するごとに、脳の一部が死んでいく。時間のロスは脳のロスである。

しかし適切な判断ができるようになるためには長年の経験が必要となるため、熟練した医師は不足している。

 

診断の定石

診断は4つの段階に分けることができる。患者の病歴と身体的検査により患者の症状についての情報を集める。次に、この情報を照合して可能性の高い病気の原因をリストアップする。

問診と予備的な検査を行うとことにより、合わない病気を除外する(鑑別診断)。病気の有病率、患者の病歴、リスクなどに重み付けを行う。

これにより、疑わしい病気を減らしていく。最後に、限定的な検査、X線検査、又はCT検査を行い、仮説を確証して診断を確定する。

このように症状から原因を探る手法が伝統的に行われてきた。

 

実際の診断

しかし、実際の診断は教科書通りにはいかない。

イギリスの哲学者ギルバート・ライルによれば知識には「事実として、それを知ること」と「経験として、それがどのようなものであるかを知ること」の2種類がある。

この2種類の知識は相互に依存しており、事実としての知識により経験としての知識を深めたり、その逆も可能である。

脳卒中は脳の片側に起こる。組織が灰色になる。組織の境界が不明瞭になる。脳に血流が弱くなっている部位が生じる。病変を特定するには、これらの兆候見つけなければならない。

画像には多くの非対称な部位が現れる。CTの画像には脳の片方に灰色の曲線が現れることがある、これは検査時患者が動いたために生じためにできたノイズ、脳卒中の前兆としての脳の組織の変化の可能性がある。

放射線医は経験を積むことにより脳梗塞の前兆を見つけ出すことができる。

 

人工知能を使った診断システム

人工知能で脳梗塞の前兆を見つけ出す試みが行われている。

初期の診断システムでは、診断は医学の教科書に基づいて行われた。

心電図は心臓の電気的な活動を紙又は画面上で線として表示する。過去20年間にわたり、診断システムはこれらの特徴を利用したものである。

この作業を行うプログラムは非常に単純である。特徴的な波形は心房細動や血管の閉塞などの様々な病気が関係しており、これらの波形を判断するルールが診断システムに供給される。診断システムがこの波形を検知すると、心房細動の診断することになる。

 

乳ガン診断

マンモグラフィでも、診断システムは普通になっている。

画像認識ソフトは病変部を見つけ出したら、放射線医はこれを詳細に検討する。ここでも、病変部を見つけるためにルールに基づく診断システムが使用されている。

プログラムは学習機能を備えておらず、3000枚のX線画像を取り込んだ診断システムは4枚だけ見た医師に劣ることが、マンモグラフィの精度を比較した結果判明した。

診断システムの導入により診断精度が劇的に改善することが期待されていたが、懸念されていた事態がクローズアップされた。

生検率が急増したが、。微小な浸潤性の乳癌の検出精度は高くなかった。

 

ルールから経験への進化

ルールに基づくアルゴリズムを採用した第1世代の診断システムは学習ベースのアルゴリズムを採用した診断システムに移行した。新しい診断システムではルールからではなく経験に基づく診断が行われた。

 

ニューラルネットワーク

新たな学習アルゴリズムでは脳の働きをモデルにした「ニューラルネットワーク」と呼ばれる手法が採用された。

脳では、ニューロンのシナプスが活性化を繰り返すことにより接続が強まっていく。この診断システムでは望まれる出力が得られるように、接続の重みが調整される。

 

皮膚ガンの診断

皮膚ガンにおいては、特に有棘細胞ガン(日本人に最も多い皮膚ガン)及び黒色腫(最も危険な皮膚ガン)が最初にコンピュータ診断の対象にされた。

最初の作業は教え込む材料を準備することである。診断システムがガンを判別できるようするためには大量の画像が必要でる。

 

診断システムに子供と同じように学ばせる

診断システムに疾患を学習させるために、ルールをプログラムする代わりに、疾患の画像と疾患の分類がニューラルネットワークに供給される。

従来のプログラムでは、ある物を特定するためには、1000個以上のif文を記述する必要があり、この作業を限りなく続ける必要があった。

しかし、子供はコンピュータのように物を区別しているわけでなく、物を見て学び、大人から物であることを教えられる。子供は間違いを犯すが、大人から誤りを正され、正しく物事を学んでいく。

そこで、子供は少しずつ理解を修正していく。診断システムのアルゴリズムは子供のように分類された訓練セットから情報を引き出していく。

その後、診断システムは対象の画像を数百から数千に分類された画像と比較することにより、独自の物の区別方法を見つけだす。

 

疾患の分類

診断システムは画像を良性の疾患、悪性疾患、及び良性腫瘍3つの分類に診断することができる。

 

診断システムの性能

診断システムの正答率を調べた結果は約72%で認定皮膚科専門医の66%より高い数値を示している。(アルゴリズムの実際の出力はイエス又はノーではなく入力した病変がカテゴリーに分類される確率である。)

ほとんどすべての検査で診断システムの感度は医師より高くなっている(低偽陰性率)。診断システムはメラノーマをほとんど見つけることができている。更に、特異度も高い(偽陽性率が低い)。この結果、診断システムは皮膚科専門医より正しく診断できることが判明している。

無関係の特徴が認識できるように訓練されたニューラルネットワークを使用することにより、診断システムはより高速で正確に学習できる。

我々の脳も同じように機能しているが、因数分解、動詞の活用、周期律表の暗記などの学校での退屈な練習も、診断システムにとっては得意分野である。

診断システムは医学知識や診断ルールの蓄積情報により教え込まれることはなく、脳のシナプスの接続を強めたり弱くしたりする膨大な内部調整を行って自己学習によりメラノーマとほくろを区別している。

 

診断システムは誰のためにあるのか?

診断システムを使用することにより、日々スキャンした画像を比較することにより初期のガンを見つけること可能になる。

しかし、落とし穴がある。診断エンジンにより莫大な数の不要な生検が行われる可能性がある。

 

熟練医と診断システムの補完関係

自動車を利用することにより、人間は力がなくとも、重いものを遠くまで運搬することができる。同様に、診断システムを使えば、医師は短時間で多くの患者を正確に診察することができる。診断システムは皮膚科医や放射線医の代わりにはなることはないが、医療機関の診療体制を大きく変える可能性がある。病理医が病態解析、治療効果などを検証しするように、放射線医は今後患者を診察するのではなく、診断結果を調べて、診断システムを訓練することが業務になるかもしれない。

診断システムが熟練した放射線医より診断精度が高くとも、医師の訓練は重要である。熟練した放射線医は単にイエス・ノーの判断をするだけではく、脳卒中を引き起こす塞栓や、血栓溶解薬を使用すると危険な微小な出血、更に無症状の腫瘍も見つけ出している。放射線医が経験を積み、診断システムに情報をフィードバックすることにより、診断システムの精度を更に高めることができる。放射線医と診断システムは補完の関係が築ければ患者の恩恵は非常に高くなる。

将来、診断システムは病理診断も可能になり、パップ(細胞診)検査、心音検査、精神病患者の再発予測にも活用されることが期待されている。

新しい診断システムは失敗から学び、誤診についての情報が診断システムにフィードバックされ、時間をかけて精度が高められている。

診断システムによる大量の診断データがフィードバックされることにより、診断システムの精度は日々向上することができる。医師がガンを見逃して、5年後にガンが進行した場合、現在の医療現場では医師へのフィードバックはルーチン化されていない。新しい診断システムではこのような徹底的なフィードバックが可能である。

IBMのワトソンとGoogleのディープマインドの両者には統合的なシステムの構築が期待されている。

 

診断システムによる医療変革

早期に正確に診断することが医療が直面している重要なテーマである。今こそ、人間の能力を遥かに凌駕した診断システムのパワーを医療に利用すべきである。

担当医は1日に多くの患者を見なければならず、患者は長い時間待合室でただ待ち続け慣れればならない。その時間を診断システムが患者の病態を調べることができたら、医師は短時間で正確により多くの患者を診察できることになり、患者はただ待ち続けることから開放される。

常勤の皮膚科医は1日30名の患者を診察する。週5日勤務して、30年間働けば生涯で延べ23万人の患者を見ることになる。これに対して、ワトソンでは3ヶ月で約130,000人の患者を診断することができる。1日あたり約1440人である。医師の約50倍の能力である。更に、研修医は最初から訓練を受けなければならない。しかし、診断システムは絶えずデータを受け入れ、成長し、学習し続けることができる。

 

参考資料:

Siddhartha Mukherjee, “A.I. VERSUS M.D.”, New Yorker 2017-4-3