人工知能(Deep learning)を使ったカルテ解析

カルテなどの医療情報の解析にはずっと興味があります。情報技術を使えば多くの非効率や誤診、処置の遅れなどが改善されるのは疑いないからです。

下の論文はGoogleから最近発表された論文で、カルテから患者のさまざまな情報、具体的には死亡リスクや退院時期、診断名を予測する論文です。
[1801.07860] Scalable and accurate deep learning for electronic health records
カルテは病院ごと、あるいは病院内でも、含まれている情報にばらつきが多く、人工知能向けにデータを集計・整理する「前処理」と呼ばれる作業に非常に多くの人的コストが裂かれています。また、カルテ間で共通に含まれていない情報は捨てることも多く、せっかくのデータが無駄になっていました。

この論文は、そうした前処理の多くをスキップし、カルテ情報をRNNという人工知能でまるっとそのまま読み込むことで、手作業での前処理作業をスキップします。全情報を用いることができるので、データも無駄になりません。さらに、「注意機構」と呼ぶ仕組みを用いることで、人工知能にありがちな批判である"何を見てるかわからない"という問題にも応えようとしています。

今後は、カルテだけではなく、ウェアラブルバイスなどから取得されたより日常的なデータや、自己診断結果を使った予測が見てみたいです。あと、人間のプロの予測精度とどの程度違うかも比べて欲しい。こういう技術が病院の評価とかに使われれば、本来生きられるはずだった患者さんを多く逃している病院がわかりそうで期待が高まります。