AUGRIM

AUGRIM~医療と機械学習を正しく伝える

機械学習で因果関係を予測する~どの薬がこの疾患に効果があるか

医師が最も関心があるのは「この疾患を治すにはどの治療法がベストか」という問です。患者にとっては、「この薬を飲めば、病気が治るのか」は最大の関心事です。

 いわゆる「医療と人工知能」の研究で、「この眼の画像はなんの病気か?」という問題は殆ど研究分野としては落ち着いてきています。一方で今日考える「この患者にこの薬を投与するとどうなるか?」という因果推論が最もホットトピックです。

 

今回は機械学習でこの問にどのようにアプローチするのかを考えてみます。

 

物事をもう少し一般的に考えてみると、この課題は「機械学習を用いてデータ間の因果関係を把握できるか」という問に言い換えられます。先程の場合だと、疾患というデータに対して、ある治療を行った結果、疾患が治るのか治らないのかを機械学習を使って予測したいということです。

因果関係と相関関係

機械学習で因果関係を予測するとはどのようなことなのかをもう少し説明します。

 

「アメリカ人一人あたりのマーガリンの消費量とメイン州の夫婦の離婚率には正の相関がある」という報告があります。相関率は99%ですから、データとして見れば密接に関係していそうな雰囲気があります。

 

f:id:Longman:20170616144111p:plain

http://www.bbc.com/news/magazine-27537142 

(図は http://www.tylervigen.com/spurious-correlations より引用)

 

では、メイン州にいる夫婦の離婚率を減らすには、家庭に置くマーガリンを減らせばいいのでしょうか? 残念ながら、上のデータはこの問には全く答えてはくれません。離婚率とマーガリンの消費量の間の異なる因果関係が同一の相関間関係を与えるパターンがあるからです。

 

f:id:Longman:20170616152624p:plain

 

この図ではマーガリン消費量や離婚率とは別の原因A(例えば就労率、平均給与所得など)があって、両者に働いている場合を表しています。左側の図では、マーガリンの消費量の増減が離婚率の増減に影響を与えている場合を表しています。中央の図では、実はマーガリンの消費量と離婚率には直接の関係はないけれども、Aという共通の原因が両者に同じように影響を与えている場合を表しています。右の図は左の図でマーガリンと離婚率を入れ替えたものを表現しています。

 

このように、極めて高い相関関係があるデータであっても、そこから因果関係を予測するのは非常に難易度の高いタスクであることがわかります。

統計的因果探索

上で考えたような、相関関係と因果関係の間のギャップを擬似相関と呼び、このギャップを明らかにする試みが統計的因果探索です。

 

現在の機械学習では、どのような方法で因果関係が調べられているのかについて、幾つかの論文を紹介します。近年、機械学習ではこの分野の発展が目覚ましいので他にも非常にたくさんの論文があります。

 

C. Louizos et al., "Causal Effect Inference with Deep Latent-Variable Models"

[1705.08821] Causal Effect Inference with Deep Latent-Variable Models

 

F. Johansson et al., "Learning Representation for Counterfactual Inference"

[1605.03661] Learning Representations for Counterfactual Inference

 

S. Shimizu et al., "A Linear Non Gaussian Acyclic Model for Causal Discovery"

https://www.cs.helsinki.fi/u/ahyvarin/papers/JMLR06.pdf

 

せっかくなので、今回はこの中で最も新しい論文(一番上)について詳しく見てみます。

 

目的と手法

統計的因果探索のためのCausal Effect Variational Autoencoder (CEVA) という新しいニューラルネットワークのモデルを作成した。

 

データ

 

1つ目:既存のモデルとの比較のためのデータセット

 

2つ目:1989年から1991年の間にアメリカで生まれた双子。生まれたときの体重とその後の死亡率の因果関係を調べた。

 

結果

1つ目のデータに対しては、Johansson達のBNNモデル(上記の2番めの論文)と比較して遜色のない成果が見られました。εの値が小さいほど、精度が良いことを表しています。

f:id:Longman:20170616175841p:plain

 

2つ目のデータに対しては、ロジスティック回帰などに比べて、ニューラルネットの層を重ねるごとに、ノイズに対して安定であることがわかりました。

f:id:Longman:20170616180032p:plain

LR1がロジスティック回帰の場合で、nhがニューラルネットワークの隠れ層の数を意味しています。上に行くほど、良い成果であることを表しています。

 

我々は因果推論の技術は10年後の医療に確実に必要で導入されるべきだと思います。人工知能熱が間も無く冷めるでしょう。しかし機械学習の技術者がブームに関わらず、世の中を良くしたいと思い続ければ、医療業界にも「え、これ人工知能なの、知らなかった、便利だねー」というようなことが起こり得るでしょう。

 

弊社AUGRIMでは、統計的因果探索を用いた製品開発・研究も行っております。製品の受注や共同研究のご依頼も随時承っておりますので、ご連絡ください。