現代的な脳解析をどう勉強するか

ここ数年、脳画像業界ではデータ公開やコード共有が大きく進みました。これにはインフラの整備や数々の巨大予算がついたプロジェクト、など様々な要因が寄与していますが、データ共有が重要であるという意識の共有やデータサイエンスの大流行も大きな要因かと思います。

文字通り年々使えるデータの桁が増えている状況であるため、これまでが言語や画像・音声といったデータ収集が容易な分野に比べると非常に参入障壁が高い分野だったことを考えると、様々な人が参入してきて分野の発展が加速することが期待されます。実際、医療・工学系の人たちがオープンデータを用いて参入してきた感じの論文が増えてきているように思います。

脳活動デコーディングとエンコーディング

話は少し変わって、以下のPodcast日本に日本を代表する認知神経科学者である京大の神谷先生が出演されています。海外にはネットでバンバン自分の意見を発信している人もいますが、日本人だと非常にレアです。メイントピックは「再現可能性」で、個人的に馴染みも深い分野で話題のトピックなのでその通りといった感じに聞きました。

TODA RADIO #005 ゲスト神谷先生


個人的に一番面白かったのは3つ目の音声ファイルの最初の部分で語られている脳情報と刺激の関係性のモデリングの話。ちょうど一つ前の記事で脳→刺激がデコーディング、その逆(刺激→脳)がエンコーディングという話を書きました*1ポッドキャストで話しているのは「明らかに脳→刺激という因果関係のものを刺激→脳という形でモデリングしていいのか」という話であり、デコーディングとエンコーディングの話とは厳密には異なるのですが、改めて両者の違いを考えるきっかけになりました。

前の記事にも書いた通りエンコーディングとデコーディングは数学的には等価で本質的な違いはありません。しかし、研究の場での道具としての使われ方はそれぞれ若干異なります。この前の記事で紹介したJack Gallantのグループはエンコーディング研究の大家ですが、この人達は当然エンコーディング推しです。以下のスライドは4年前に本人が講演で使ったスライドですが、改めて見てみると色々な学びがあります。

http://www.brainmapping.org/NITP/images/Summer2014Slides/20140728_EncodingAndDecoding_Gallant.pdf

これを全認知神経科学者がしっかりと理解・実践していたら今の再現性危機の原因の多くが潰せている気がします。エンコーディングとデコーディングの比較、そしてデコーディング批判(しエンコーディングを推す)の理由が簡潔に述べられているため必読だと思うのですが、問題は、簡潔すぎて背景知識がないと理解できないことです笑

いくつか刺激的な文言を抜粋します。刺激的すぎて背景がないと誤解しそうですが…。

  • Encoding and decoding are scientifically equivalent EXCEPT that you cannot estimate the noise ceiling for a decoder.
  • Decoding is a good way to do engineering, but it is generally a bad way to do science.
  • The localizer/MVPA approach produce misleading estimates of both functional and spatial specificity.
  • MVPA decoding has nothing whatsoever to do with decoding.

現代的な脳解析テクニック

脳解析の世界では、fMRI、MEG、EEGといった大域的な情報が取れるものは勿論、シングルニューロンの研究でも何かしらの多変量解析を行うのは(特にハイインパクトな論文誌においては)もはや特殊なことではありません。そこでは、Encoding、Decoding、Representational Similarity Analysis、MVPA、SVM、HMM、LDS、、、などなど色々な研究者が様々な手法を扱っていて、それぞれどう使い分ければいいのかが一見わかりにくいです。これらの例はわざと粒度が異なるものを併記していますが、被っている概念もありますし、械学習や統計の分野と違う用語で語られているものもあるので、それぞれの関係や利点もわかりにくい。

もちろん研究において重要なのは「何を解くか」であり「どう解くか」ではないため、その疑問を解くのに枯れた技術が十分であれば当然そちらを採用すべきです。必要な時に勉強すればいい。ただし、技術革新が神経科学の新たな発見を生んできたことも事実であり、また、知っていて使わないのと知らないで使わないのとでは全くことなります。つまり、どんな時に必要な時なのかを見極める程度にはキャッチアップしている必要があります。

そもそも今使われている道具に多くの問題があります。この辺は神谷先生のポッドキャストや上のJack Gallantのスライドにも多く述べられているのでここでは立ち入りませんが、個人的には認知神経科学、あるいは心理学も含めて、間違いなく未来の方向性は彼らが示している方向にあると思います。なのでこれから学習する学部生・大学院生は旧来の手法とともに現代的な手法とその意義を学んでおくべきだと思います。

そもそもどう勉強するか

自分で”現代的”とか書いておいていきなりひっくり返しますが、これらの技術は深層学習のようにここ1・2年で出てきたものではなく、ほとんどがもう10年以上の歴史があるものばかりです。よくよく聞けば難しいことはない、そんなことかと必ず納得できます。また別の視点では、ある程度情報がまとまっていることは異なる専門性を持った医師や工学者など様々な分野の人が参入するハードルを大きく下げるとも思いますので、この辺を勉強できる環境があればいいなと思います。

「どんな研究課題にとっても万能な手法はないので全部理解して研究課題に合わせて柔軟に使い分けるべし」というのは一つの回答ですが、そもそも何を理解すればいいかの全体像を掴むのが辛い現状がある気がします。脳解析でもっとも重要で難しい問題の一つにサンプル数に対して特徴量が多すぎる問題(いわゆるnがpより大きい問題)がありますが、その問題に対して各手法を用いることでどのように対応できるのか。fMRIだとSPMという古典的なツールがあるのですが、そこで用いられている手法には(上記のラジオ内で神谷先生も痛烈に批判をしていますが)多くの問題があり、それに対してどう対応すべきか。

英語の情報でもこの辺を包括的にカバーした文献を適切にあたっていくのは難しい上、ましてや日本語で情報を入手するのは厳しい状況です。現在市販されている本や日本語の情報で学んだ後に、現代的な解析に飛ぶのは個人的にはかなりのジャンプだと思います。今はきっと過渡期なのでそのうち時間が解決するのだと思いますが、なんとかなればいいのになと思いました。