AUGRIM

AUGRIM~医療と機械学習を正しく伝える

NIPS2016の医療ワークショップのまとめ

こんにちわ。先週行われたNIPS2016の医療ワークショップについて書きます。

(初学者の方は機械学習=人工知能とざっくり思ってもらっても大丈夫です。

ただ一つ強調したいのは、人工知能は何でもできるわけではありません。むしろ何もできません。

現在の人工知能は電卓のようなものです。決められたことしかできません。ガンを治すこともできなければ、病気になることは絶対に防げません。

人工知能ができるのは、例えば糖尿病に5年後なる確率をだいたい予測できるなどですが、毎日お酒を飲んで大量に印象句をしている人が糖尿病になりそうなのは、計算しなくても僕らは直感でわかります。2016年現在、医療における人工知能とはその程度でしかありません。笑)

 

そもそも機械学習の国際会議で応用系のワークショップが盛んなのは素晴らしいことですね。常に応用を考えなければ意味がないと、NIPSにいる基礎系の研究者は誰しもが思っています。それゆえに、2012年ICMLでは、機械学習の研究者に対して物を申す論文が大きく注目されたわけです。下記ブログは素晴らしく整理されております。

Machine Learning that Matters(ICML 2012) 読んだ - 糞ネット弁慶

 

さてさっそく本題に入りたいと思います。

まず最も大事なことは、「完成された研究を発表し合う」というより、「発展途上の研究を一緒に現場に応用するには」という点がテーマです。だからワークショップに出す論文も「1論文あたりページ数は上限が5枚」と定まっており、その代わり、可能な限り幅広いテーマを皆んなで議論するというイメージです。

 

まず採択された論文テーマが50以上ありますが、そのうち23本は「何かを予測する」論文です。非常に驚きです。何を予測してるか簡単にあげますと、
(詳しくはこちらを見てください)

とあります。ここで一本一本、論文を読んでいくと、入力データは画像か、カルテの自然言語か、血液データか。更には時系列データか。予想する出力値は生存期間か、発症したかどうかか。などあります。

 

#「予測」=人工知能と思われるかもしれませんが、統計と機械学習の違いは何か?と疑問に思ったあなたへ、簡単に説明します。

統計学はデータを「説明」することにより重きを置く

機械学習はデータから「予測」することにより重きを置く

 

おそらく多くの方が「医療と人工知能」「医療と機械学習」でイメージするのは、何かを予測する上のような研究だと思います。これらの研究はこのワークショップ以外にも大量に行われております。疾患の予測というのは、医療が専門ではない方にとってもわかりやすい。故に大量に研究がされている。試しに「deep learning OCT prediction」とでも調べると一瞬で論文が出てきます。https://arxiv.org/pdf/1612.04891.pdf

 

しかし、予測するだけでは無意味です。医療従事者は、「どのステージの患者で、感度と得意度がどれぐらいなのか。予測に使った検査値は、どのステージで取られたものか」など非常に重要な点が残ります。なので、「ただ予測しました」というのは何も語ってないのに等しい訳です。私が人工知能ブームで恐れているのは、そのような点です。

 

さて前回も述べましたが、医療データの特徴は、

  • 「肺がん」という一つの病気をとっても、病気の進行の多様性は数多い
  • 医師が記録をしたい、測定したいと思わない限り、結果が残らないので、欠損値が多い
  • 人体とは生まれてから死ぬまでなのだが、ある病気が発症する4,5年前からしか最大でもデータが取れない(50歳で肺がんが発症しても40歳の時のデータは測定されてない)
  • 患者が来たい時に来るので不定期な時系列データになる
  • ラベルが付いてないデータが当たり前かつ、ラベルがついていても、病院ごとで違うことが多いし、信頼はできない (つまり、他院で肺がんと診断されるかもしれないが、他の病院では肺炎と診断されるかもしれない)

 

「じゃあ50本中、疾患の予測以外の論文25本は何をしているの?」というと、医療データの特徴をうまく処理できるようなアルゴリズムの開発。その他には、

  • 乳がんを意味がある形でサブ - クラスタリングする*4
  • アキレス腱断裂におけるリハビリテーションでは、患者の幾つものデータが欠損している。どのようにデータを補完し最適なリハビリを提供するか *5
  •  アメリカの医療コードを正準相関分析をして意味のある特徴量を見つけ出し、大腸憩室炎の発症を予測する *6

 

疾患対象は多岐に渡ります。というよりも、「手頃なデータがあるからやってみよう」という雰囲気を何年間か見ていますが感じます。すべての医療データに対して、予測かデータ補完かサブクラスタリングができるわけです。つまりデータがあれば論文の書き用はあるという印象を受けます。

 

他にも「ある部分を予測して切り出してくる」という論文もあります。今回ですと、CTで肝臓とリンパ節の部分を切り出してくるアルゴリズムの開発などがありました。

その他画像では、「様々な部位のX線画像を学習する。そして手のX線画像は、どの辺りの特徴で手と認識されるか」というようなわかりにくい問題設定の研究 *7もありました。この手の研究は、「X線画像を見て医師は肺がんを診断しているが、同じように深層学習も肺がんを診断するとき、人間と違う特徴量をつかってるかどうか知りたい」というような時に有用ではありますが、有用になった例の研究は私の知る限り知りません。

今年は画像系の研究がworkshopで少なかったように感じます。

 

 

今回はそのうち一つについて僕が好きだった論文を紹介します。これは「データがあるからやった」というよりも医療を最適化するうえで、現場のデータをどうすればよいかという問題を解こうとしています。

[1611.07663] Learning Cost-Effective and Interpretable Regimes for Treatment Recommendation

 

問題設定

医師は日々決断をせまられる。薬の投与量の変更や使用している薬の中止など。彼らはその決断を、目の前の患者を見ながらサジ加減調節することが多い。大量にデータがあるのにも関わらずそのようなことを行ってしまう。このように医師が行動をとってしまう理由は3つある。まず同じ患者はこの世にいないので、結局目の前の患者の情報が第一であるから。次にインターネットで情報を集めるのが面倒。さらに治療方針を再度変えるとお金がかかる。

 

これに対して現在の医療では、手作業による治療ガイドラインアルゴリズムが偉い方々の学会から毎年改定されて公開されている。これは作成コストが高すぎるのではないか。彼らが行った研究では、簡単に言えば「目の前の患者に最適化された選択肢を提示し、そのコストも計算し医師に見せる」ことを機械学習でやろう。というものです。

 

手法とデータセット

Figure 1を見てもらいたいのですが、このような画面を出力したいわけです。そのために彼らはルールの最適化を行います。あるルールの集合をレジメと呼び(呼吸機能が悪くなったら、酸素を入れるというのがルールのひとつの例です)、このレジメがコストが一番かからず患者の病気が一番早く良くなれば、一番良いレジメということです。それをマルコフ過程 + 木構造に乗せて最適化していきます。(有名なAlphaGoと同じ仕組みです)

データセットは、彼らは喘息の患者を対象に行いました。入力データは、年齢、性別、身長体重、呼吸機能などです。介入は2種類で速攻型吸引薬、コントロールのための薬物です。出力は、どの程度の期間発作が治まっていたか。というものです。これらの中から「最もコストが掛からず、発作が治まってる期間が長いレジュメ」というのを推定します。

 

結果

彼らのフレームワークで研究したレジュメは、人間の考えたものより良い治療ができるという結果が出ました。治療にかかったコストもわずかながら彼らのフレームワークの方が優れていました。

 

私が思うこと

米国ならではの研究で素晴らしいと思います。日本は、国民全員保険に入っているので、医療費のコストなどを一般市民が認識する機会がありません。しかし米国ではそれが普通です。このように医療費の最適化を真剣に考えている点は素晴らしいと思いました。人工知能で病気を診断する以外にも、医療に人工知能が役立つアプローチは無限にあると思います。

 

 

 

 

 

Who we are

こんにちわ。このブログを作成するにあたり、間違った情報を伝えない、誇張したことを書かないなど人間として当たり前のことをしっかりやっていきたいとおもいます。

 

www.yomiuri.co.jp

 

 

DeNAこちらの事件が発端で、私はこの記事を書こうと思いました。

「医療と人工知能」というだけで多くの企業が「儲かる」という理由で投資をしビジネスを始めています。しかし果たして患者さんを救うことにつながっているのでしょうか。DeNAだけを責めるわけではありません。ただ僕らがやりたいことは、このような事件が二度と起きないように努めることです。そのために「人工知能とは結局医療とって何か」というのを紹介していきます。

  

医療と人工知能の熱の上がり方は激しく、どの企業や研究者も熱心に取り組もうと頑張っています。しかし残念ながら、一部では利益のためだけに公明正大に嘘をついたり、誇張した表現で活動をしていることがあります。それらは必ず患者さんに悪い結果をもたらします。

僕らはそのようなことは容認できません。そのため患者さんが、正しい情報を手に入れるお手伝いをこのブログで行いたいです。また研究者の皆様も、僕らがまとめた情報で、皆様の力に少しでも慣れたらなと思います。 

 

ご意見、ご連絡がありましたら、こちらまでお願いします。

keiohigh2nd[~at~]gmail.com

[at]を@に変更してください

 

 

 

 

 

医療と機械学習の研究について ~ 人工知能で病気は診断できるか

ブログの目的

こんにちわ。医学を勉強しているものです。今回は新しくブログを作成しました。その発端となったのは、悲しくもDeNAWELQの一件です。根拠が不明な記事、そもそも間違った情報が満載な記事をインターネット上に公開するのは、更なる不幸を呼びます。このブログでは、根拠を正確に示し間違いのない情報を公開していきたいと思います。

 

いま最も医療で騒がれているの一つのテーマは、医療と人工知能です。多くの記事が人工知能で医療が良くなることを述べ、多くの会社が人工知能を使って医療を良くしようとしています。更に、国も現在、人工知能を使った診療や介護に報酬をつけることを考えています*1 しかし結局「何ができるのか」というのが、一般の方にはわかりにくいと思います。おそらく「医師と同じように、人工知能が患者さんの病気を診断をできる」というのが最初に来るイメージだと思います。また他にも「患者それぞれにあった治療法を提案する人工知能」というのが、実際にニュースにもなったWatsonの例です*2このように話を聞くと、がんを患ったことがある患者、現在患っている患者は「人工知能によりガンが治るようになった」のかと期待を持ちます。期待自体は悪いことではありませんが、このように「人工知能によりがんが治るにようになった」という間違った情報が伝播していってしまう可能性があります。他にも「医師国家試験に合格しそうな人工知能がいるなら、医者なんていらないじゃないか」と、こちらのようなニュースを見て思う方は多いのではないでしょうか*3

 

そのような間違いを防ぐために、このブログでは人工知能と医療をテーマに、それらの基礎的な研究を根拠を基にして紹介していきます。DeNAの件を考えますと、多くの企業が利益のために「人工知能なら治らなかった病気が治る」という言っているような行き過ぎた熱を感じます。そうでなくても、「医療と最先端の機械学習で社会を良くする」等を宣言している会社が幾つもありますが、結局何をやってるのか不明であります。私が避けたいのは「結局、機械学習で医療は変えられないじゃん」みたいな熱が冷めることです。そうならないためにも、「具体的にどんな研究をしていて、どのように医療現場を変えられるのか」を正しく細かに発信する必要があります。

 

まず今回最初のブログでは、最先端の医学と機械学習の研究について、どこで情報を得ることができるかを紹介します。その上で、Xは私の知る限り、知らない。と述べますが、「私の知る限り」とは下記の国際学会や国際雑誌を論拠にしてます。(なのであまり自分の意見を述べるというよりは、事実を平坦に包み隠さず紹介していきたい次第です)

 

人工知能は病気の診断を行うことは可能か?

 

最初にこの話題を一般の方のために説明します。結論から言えば、画像から疾患の一部の特徴を診断することは既に可能です。例えば乳がんの悪性度を病理画像から診断するというのは、医師と同じような精度を持って診断が可能です*4。一方で、医療は「あなた乳がんです」という場所から始まりません。まず乳がんとは、患者が乳房に違和感を持ったり、健康診断で触診、視診、患者さんの家族歴等により疑われたりすることが、がんの発見につながります。今の人工知能が行なっているのは、医療の診断における特殊な部分を行なっているだけです。

 

GoogleのDeepmindが眼底画像から眼疾患を機械学習で診断するニュースは新しいです*5 。13日には論文が出ましたね。*6病理画像の乳がんの悪性度判定も機械学習で行われております*7 これらの眼底画像、乳がんの病理画像以外にも、多くの医療画像が深層学習で診断をされており、ニュースになっていないだけです。例えば「気になる病気 image CNN Deeplearning」と調べれば殆ど出てくるのではないかと思います。これらは画像だけから診断するということです。

 

しかし実際の医療現場では、画像からのみ疾患を推定することは少ない。画像だけではなく、患者の家族歴、血液データ、更に遺伝子データも診断のために使う時代であります。そのような試みをしている論文もありますが、データの種類が増えるたびに、論文は少なくなります。それはデータが集まりにくいという単純な理由です*8。当院でも、医療画像、血液データ、患者カルテというのは別々のデータベースに入っており、そう簡単に一括にデータを収集できない状況です。

 

GoogleのDeepmindも医療に力を入れていることを宣言しており、眼底画像以外にも放射線治療のプランニングに機械学習を利用した研究をしています*9放射線治療とは、がんに対して適切な量と場所で放射線を当てるという治療ですが、これは自分も実際に臨床実習で設計したことがありますが、機械学習を利用すると良いと思う分野です。

 

このように機械学習を利用した方が良い分野というのは、入力と出力が綺麗に見えているものです。病理の画像を入れてがんのグレードが出る。がんのCT画像を入れて適切な放射線量が出る。なので、もし機械学習で医療を良くしていくときは、上記のようなアプローチの方が導入されやすいと思います。逆に言えば「がんの個別治療の最適化」というのは、難しいタスクです。入力に、患者の情報、がんの遺伝子データなど複数のタイプのデータを入れるとすると、出力は適切な量とタイプの抗がん剤です。。最適化するために多くの学習データが必要ですが、日本のカルテシステムだとデータが集まるのはここ2、3年では難しいこともあります。また一つの病院のデータだけで、モデルが作れるかというと、そういうわけでもありません。病院ごとにがんの治療方針は違うこともあり、一つの病院で最適化してしますと、施設バイアスが出ることもあります。

 

また少し話題になった「医師国家試験を合格できる人工知能」ということですが、記事でモデルまで非常に詳細に説明されています。こちらの先生の発表も生で拝聴させて頂きました。非常に堅実に医師と協力してモデルを作っている研究です。しかしこれは、記事でも著者が言ってるように、医師が診断を下すのとはまた別の違うアプローチで正解にたどり着いています。例えば「熱が出た、昨日は熱が少し下がって、今日はまた熱が出た」という文章を読んで、こちらのモデルでは単語の出現頻度のみしか扱っていません。しかし本来であれば、熱が下がったり上がったりしているという非常に重要な症状です。このように患者の症状の特徴を違った特徴に変えても60%以上の問題が解けるモデルができるというのはある意味驚愕です。しかしこれは実際の医療では使えないということを肝に命じてください。国家試験の文章問題に出てくる単語頻度のみを扱っているわけですから。

医療と機械学習では、研究面ではどういうアプローチが取られていることが多いか

そもそも機械学習とは予測をすることですので、疾患の予測の一言に尽きます。しかし「がんか、イボか」というレベルの予測ではなく、「この薬は、この患者に効くのか」という予測*10 や「糖尿病の中で、何種類のサブタイプがあり、その分類に従うと、どのように予後が変わるか」という研究*11 もあります。細かな具体例は次回の記事に回すとしまして、ここで申し上げたいのは、「ただ病気かそうでないかを予測する」だけではないです。ある種、医療の知識が必要なのはその点なのかもしれません。またICU(救急治療室)などの現場で例えば敗血症を予測をするモデルなどは研究が盛んです。その一つの理由は、ICUでは定点観測できる時系列データが豊富だからだと考えます。それ以外にも機械学習というよりかは因子分析*12 や欠損値を上手く処理するモデルの考案 *13などがあります。

 

また医療と生物学は切って離すことができません。すなわち生物学と機械学習も非常に熱心に研究されている分野であります。昨今、PFNがバイオマーカーの探索などで新事業を立ち上げました*14。生物学でも機械学習、深層学習のアプローチが有効な例は無限にあることは皆様もイメージつきやすいと思います。しかし「具体的に何をやってるのか」と言われると、「予測精度が上がった」ということしかメディアには取り上げられません。僕が先月読んで非常に感銘を覚えた論文がBengioチームから出ました。Diet Networks: Thin Parameters for Fat Genomic *15というものです。こちらは、生物学独特のデータ環境について深層学習で解決をしています。簡単に言えば、パラメーターの数に対してサンプル数が圧倒的に生物学では少なく、意味不明な余剰なパラメーターを深層学習を使って減らしていくことで、モデルをコンパクトにし、パラメーター>> サンプル数のケースでも上手に予測しようとした論文です。

機械学習の国際学会に付随するWorkshop

こちらの学会で垣間見ることができる研究というのは、「機械学習の研究者が医療データを使って何ができるか」という物が多いです。

 

医療データは、他のデータと顕著に違うところが多いです。例えばラベルのないデータが多いこと、患者が来院するタイミングは気まぐれであり、決まった時間に観測できないデータであること、全ての患者が全て同じような検査を受けていないので虫食いのようなデータが多いこと。これらのような特徴は医療に限りませんが、医療データでは必ず見られる特徴と言ってよいでしょう。

 

NIPS 2016 Workshop on Machine Learning for Health

こちらは現在まさに開催中というナウなワークショップですね。非常に投稿数も多く更に言えば採択数も多いWorkshopです。もちろん最低限の査読項目はあります。新規性があることはもちろん、機械学習の論文として客観的に精度の評価がなされていること、間違った手法を使ってないこと、実際の医療現場で役に立つことなどです。私の論文もReviewをされた時に、上記の点を指摘されました。採択された論文の中で優れたものはSpotlightトークとして特別に発表することができます。

 

ちなみにNIPSの本会議でも医療情報を使ったものが少ないですが稀にあります。

 

RETAIN: Interpretable Predictive Model in Healthcare using Reverse Time Attention Mechanism  

こちらの論文は深層学習に高次元データを入れて出力が低次元の場合、どの次元のデータがどれほど予測の精度と関係するか、一見すると分かりにくいという問題を解決しようとする問題です。医療において、「何が患者の予後を改善、悪化させたか」というのは興味の対象であり、予測だけすれば良いという分野ではありません。

 

今年のICMLという会議でも何件か医療データ関連の論文がありました。

Learning Representations for Counterfactual Inference. 33rd International Conference on Machine Learning (ICML), June 2016

こちらは、統計学的因果推論の中でも、反事実推定というものを行なっています。医療において非常に重要で、「この患者にはAの薬を投与したけど、実際Bの薬を投与してたら、患者の血圧はどう変わってたんだろう」というのに利用されます。もともと統計学でRubinなどがプロペンシティスコアなどで研究していた分野ですが、サンプルの群の間で特徴量を整えるならば、機械学習も非常に有用だということが最近見いだされました。

 

今年のKDDの論文でもこちらなどが医療と関連がありました。

Text Mining in Clinical Domain: Dealing with Noise.

 

もちろん、NIPS, ICML, KDDだから「凄い素晴らしい論文」というわけではないとみなさんも、私も考えていますが、上記のような機械学習のレベルの高い学会でも、医療関連の論文が本会議で採択される時代なのだと私は喜んでおります。

sites.google.com

 

昨年行われたworkshopに私もポスター発表に参加しました。2013年から毎年Helthcare Workshopは開催されてるようですが、Websiteを見つけることができませんでした。

 

KMD - KDD 2015 - Medical Mining Tutorial

その他にもKDDでは、Workshop形式ではなく、Tutorialという形で医療データの解析が開催されました。とこのように毎年何かの形で機械学習の国際会議で並列に開催されているwokrshopがありますので、みなさんも見てみてください。

 

BigCHat: KDD 2014 Workshop on Connected Health at Big Data Era

DMH Workshop at KDD 2013

ACM SIGKDD Workshop on Health Informatics (HI-KDD 2012) - August 12, 2012  

Call for Papers - Role of Machine Learning in Transforming Healthcare

 

MUCMD - Machine Learning in Health Care

こちらは昨年度から始まった学会です。機械学習と医療をテーマに一つ学会を作ろうとのこと。実際に行くことはできなかったので、雰囲気がありませんが、来年度もあるようなので、興味がある方は投稿してみはいかがでしょうか。

 

注目すべき研究者

医療と機械学習で優れた論文を大量に描いている研究者を紹介します。ぜひ定期的にチェックしてください。まず MIT David Sontag Team 。そのほかには、Sun Lab  といろいろあります。

 

 

医療と機械学習を研究したいがデータがない!

そんな方には、Public Databaseをご紹介します。MIMIC と呼ばれるMITが管理している医療データベースがあり、そちらはオンラインで講習などを受けると使えるようになります。SQLを叩いてデータが帰ってきますので、そちらをダウンロードして解析する形です。私自身、こちらでデータを借りて論文を昨年度は書きました。

 

またその他にも、DrivenData , Kaggleなどが、たまに医療系のデータで大会を開くこともありますが、こちらは研究というより精度を競う感じですよね。

 

終わりに

最後の方は若干力尽きてしまいましたが、定期的にこのように皆様と「医療と機械学習」について議論を交わしたり情報をシェアできたら嬉しいなと思います。何卒よろしくお願いします。

弊社AUGRIMではこの論文の他にも、機械学習を用いて医療に関する様々な研究を行っております。共同研究や製品開発のご依頼などは随時承っておりますので、お気軽にご連絡ください。