脳の感受性が高い人ほど見慣れない出来事に柔軟に対応できる?

オックスフォードの研究室で毎週やっている論文紹介が丁度自分のターンだったので、この論文を紹介しました。英語で発表するのはいつまで経っても緊張します…。
www.nature.com

要約はいつもわかりやすい解説を日本語で掲載してくださっている理研の公式プレスリリースにお任せします。これ以上の要約を自分で書くのは難しい…。
意思決定の脳内機構と個体差 | 理化学研究所

摂動に対する感受性と行動の個体差との関連を探った点や、そこからラットでも計測可能な試行間分散との関連まで繋げて、最終的に個体差との相関関係を見出したのは凄いと思います。指標自体は異なるのですが、学習がその個体固有の神経集団の活動可能範囲(Intrinsic Manifoldと呼んでいます)によって制約されるというByron YuのNeural constraints(Nature, 2015)やNeural reassociation(Nat. Neuro. 2018)の話とも関連していそうな気がしました。

ただ、個体差を検証するにはラットのサンプル数が少ない(8匹)のが気になりました。リサンプリングによってその点に対応しようとはしていますが、選択関連活動との関係が薄いという主張の根拠となるFigure 4の散布図はもうすこし数が欲しい感じを受けました。それと、モデル上で個体差と関係をしていた神経集団の感受性をラットで計測するのが難しいため、代理指標として試行間分散を提案していますが、理屈上モデルのサンプル数はいくらでも増やせるため、もう少し増やした時の散布図を見てみたい気がします。

Latent Factor Analysis via Dynamical Systems (LFADS)をchainerで実装した。

やったこと

Google BrainのDavid Sussilloらが先日Nature Methodsに出版したLFADSをchainerで実装しました。
GitHub - yu-takagi/chainer_lfads: Implementation of LFADS with chainer
公式の実装が既にこちらにあるのでそれを参考にしました。二つのpythonファイルだけと大変わかりやすい公式実装です。が、それぞれ800行と2100行と超重量級、加えてtensorflowにより書かれているため自分でいじるのが難しく、tensorflowとアルゴリズムの勉強も兼ねて再実装しました。

LFADSの概要

LFADSは時系列データ、特に神経科学の実験から取得できる脳信号解析のために開発されたRecurrent Neural Network (RNN)のモデルです。多数のセンサーから取られた大量の神経データを用いることで、単一試行レベルでの神経時系列データ解析をこれまでよりも高い精度で実現します。

ここで、「時系列データ」には気温のような1次元のデータから、市場全体の株価の動きのように多次元かつ複雑にものまで様々あります。我々の脳も時事刻々と異なるデータを生み出している時系列データ生成器であることから、神経科学の実験からも様々な時系列データが得られます。一方で、時系列データには周期性や過去の時点への依存性などモデリングに際して難しい点が多々あります。そのため、活発に研究が行われている領域です。時系列データモデリングの難しさについて詳しくは、たとえば以下の記事によくまとまっています。
tjo.hatenablog.com

LFADSはそのような時系列データ処理のためのディープラーニングモデルですが、大きく見るとVariational Autoencoder (VAE)の亜種です。論文でまず焦点を当てているのは、獲得された潜在表現が生信号やGaussian Process Factor Analysisなどの線形・非動的なモデルに比べ、行動をよく予測するという点です。加えて、LFADSはその構造上、観測データの背後に隠れている低次元の時系列をうまく推定している可能性があります(線形ICAなどのように必ず復元できる保証があるわけではないのに注意)。実際に、論文では意思決定に関わってそうな各種の時系列がモデルの潜在変数として捉えられていることを示唆しています。最適化や使用しているユニット等、手法面ではこれといった新規性はないので、理論家からすると退屈な論文かもしれませんが、個人的には安心して読めます。

LFADSはVAEの亜種であることから、深層生成モデルでもあります。そのため、論文では生成に関して一切触れていないものの、理屈の上ではそれらしい脳活動を生成する機械にもなっているはずです。今回の論文ではおそらく科学的な面白さが特にないため触れていないですが、このような生成モデルはデータ拡張や脳活動シミュレーションに使えるため、それ自体面白いテーマです。

まだやってないこと

論文では様々な設定で実験をしており、それらの中には一部実装できていない機能があります。特に複数のセッションを一つのネットワークで学習し、それにより用いるデータ量を大幅に増やす"Stitching"は色々と役に立つシチュエーションがありそうです。名前は大層ですが要は複数のセッションに合わせてそれぞれネットワークを用意するだけなので、実装は難しくありません。また、自分が今持っているデータが神経スパイクデータではないため、連続値を推定するガウス分布バージョンのみ実装していて、発火率を予測するポアソン分布バージョンは未実装です。今後実装次第更新したいと思っています。

平野啓一郎と朝井リョウとラジオ

最近読んだ本をネタバレしない程度に紹介。

ある男

ある男

前作の「マチネの終わりに」が良すぎたので今回はどうかと思いながら読み始めましたが、よかったです。基本的にはこれまで平野啓一郎がずっと主題にしてきた「分人」の延長で、"自分"の微妙さとその過去・未来を通じた拡張・変化可能性がテーマですが、ストーリー展開や文章が上手で読ませます。これまでの作品よりも社会派というか、現実に生じている問題への筆者の意見が表面に出てきている印象を持ちました。中村文則の最新刊(「R帝国」)を読んだ時も、これまでのような一般的な哲学よりもっと直接的に社会的な主張を出してきたなという感想を持ちましたが、年齢や立場的にも似ていることから、そういう時期なのかも。

何様

何様

相変わらず、若者の自意識とその不安定さから生まれる微妙な人間関係を書かせたらとても上手だと思いました。珍しく中年が主人公の章がいくつかあって、これは作者的には挑戦なんだと思いましたが少し人物像や考えがありきたり過ぎる印象。いずれにせよ、前作の「何者」の内容を忘れていても普通に単独で読める内容だったのでよかったです。

読了後に朝井リョウの近況を調べてみたら最近結婚をされて、ラジオ番組も持ってるようだったので、試しに最近の回(11月11日)の回を聞いてみました。小説やエッセイから予想できるキャラクターのまんまで安心しました。表面的なものが嫌な性格で、何かをつくろったり道化を演じる"偽物"警察をどうしてもやってしまう一方、その不毛さに嫌気がさしてきている、しかしそこが自分の職業上の強みでもあるため中々変えられない、と悩んでいる様子が彼の小説の登場人物のまんまだなと。昔、「哲学者はいかにメタに考えられるかで競うところがある」みたいなことを東浩紀が言っていましたが、純文学小説家は「いかに繊細に考えられるか」、「いかに人の行動の裏にある機微を想像できるか」が勝負みたいなところもあると思うので、ぴったりの職業な気がします。

ラジオの中で出てきたエピソードで面白かったのが、近所のスポーツサークルに参加している話。作者の性格は上記のような感じなのですが、近所の若者が集うスポーツサークルに参加している間はそんな繊細さ、ネガティブさは百害あって一利なし。最年長ということもありチームを明るく盛り上げる役割が求められ、自分にとっていい訓練になると言っていて面白かったです。ほかにも、周囲も家庭ができたり年齢を重ねてきてそんな偽物警察活動を続けている人は減ってきており、自分自身もそうなるのかもしれないと言っていたのが興味深かったです。

偽物警察に関して、最近読んだ「ホモ・デウス」や、上に書いた平野啓一郎の分人や、あるいは最近の認知神経科学の意識周りの知見でも何でもいいですが、最近は思想的にも科学的にも偽物-本物という切り分けはそもそも難しいということで見解が固まってきている気がします。ネットやVRバイスの進化によってその流れは更に加速するはず。それを前提とした時に人とどう付き合っていくかとか(例えばある人に「自分と友達/夫/妻/上司である時」と「自分の友達/夫/妻/上司ではない時」の両方の状態があることを自分は許容できるか?)、どう物事の責任を問うていくか(少なくとも実世界では身体は一つしかないのだから量刑の分散は困難)、とかが今の中心課題なのかなと思います。

なんだか途中から本と全然関係ない話になってしまった…。

ホモ・デウス | ユヴァル・ノア・ハラリ

ホモ・デウス 上: テクノロジーとサピエンスの未来

ホモ・デウス 上: テクノロジーとサピエンスの未来

前作の「サピエンス全史」も長かったですがこちらも長い。ただどちらもよく売れているようです。

「サピエンス全史」との違い

「サピエンス全史」は"これまで"を書いて、「ホモ・デウス」は"これから"を書いているという触れ込みをどこかで見ましたが、自分の印象は少し違いました。

「サピエンス全史」は、長い歴史ストーリーを語りつつ、貨幣や宗教、国家などの"大きな概念"の役割やその本質をあばいていく、みたいな印象を自分は持ちました。ジャレド・ダイアモンドの「銃・病原菌・鉄」とベネディクト・アンダーソンの「想像の共同体」を足して2で割って、更に貨幣などに対する考察も加えたような。

一方で、「ホモ・デウス」は"自己"という概念の役割やその本質をあばいていく、という位置付けになっている印象です。そこを脳科学ナノテクノロジー人工知能などの最近の流行りの風味でをトッピングした感じです。

つまり、「サピエンス全史」では貨幣や宗教、国などの大きな概念を、「ホモ・デウス」では"自己"というより近い概念を扱っています。どちらもそれらの概念を切れ味鋭く解体しているという点では変わりません。今作ではより最新の技術動向についても触れていることから、そういう意味で前作よりも「未来」感(というよりSF感)の溢れる本とは言えるかも。

ヒューマニズム」の危機

個人的に一番面白かったのはヒューマニズムについて述べられている下巻の節です。テクノロジーが進歩した先に、現在多くの先進国がその倫理的な基礎としている"ヒューマニズム"が危機に陥るのではないか、という点です。宗教や国家に代わって現在最も受け入れられている思想であるヒューマニズムは、我々に対し「どんな経験も人間も平等であり、様々な経験をして心動かされる経験を多く積むことが価値ある人生である。」と説きます。著者によると、それも結局、結局労働力としての人間に重要性があるからでしかなく、テクノロジーによって、労働における人間の能力や重要性に圧倒的な差が生まれた先にはもはやその状況は続かないのではないか、という予測をしています。ヒューマニズム的には、テクノロジーと平均的な人間の労働生産性が逆転し、かつ人間同士内での格差が大きく開いた状況においては、いまの社会福祉をより拡張したベーシックインカムの導入によって「人類皆平等」を達成するというのが模範解答だと思います。しかし、その基盤となっている倫理観自体が変容した場合に上記の考え方が持続するのかどうか、という警鐘だと自分は受け取りました。

めちゃくちゃ長いにも関わらず読み物として面白いため、思ったよりもスラスラ読めました。一方で、人工知能や脳、医療技術に関しては結構研究的に怪しい技術を取り上げていて気になりました。歴史学が専門だと思うので仕方がないと思いますが、「サピエンス全史」の方が面白かったかも。

ピケティとバラモン左翼・商人右翼・Multiple-elite

政治は一部の物好きな学業エリートと既得権益者が利権拡大と保護に使うもの、というマジョリティの疎外感が投票率低下を招いているのは間違いありません。

…といきなりわけ知り顔な出だしで始めましたが、自分は政治も経済も全くわかりませんし、日本の修士・博士時代にもそういう話は周囲とほとんどしませんでした。一方で、こちらで雑談をしているとしばしばそっち方面の話題になります。議論が好きなのか政治・経済が好きなのか、あるいはその両方なのかわかりませんが、日本での飲み会トークとは大分違うなと思いながらいつも聞いています。自分も参加したい気持ちはあるのですが、知識も語学力も着いていかずもっぱら聞き専。というわけで、そういう話題も少しは喋れるようにならんと、という気持ちになっています。

フランスの経済学者ピケティ

そんな自分でも知っているのが、「21世紀の資本」が日本でもベストセラーになったトマ・ピケティというフランスの経済学者です。この方は格差問題を専門としていますが、22歳にしてLSEで博士を取得、MITに招聘された数学的な経済学の大秀才(この辺の詳細はhttps://cruel.org/books/capital21c/APPikettylecture.pdf)。実際若い頃の論文をみてみると数学を駆使したモデリングの論文が見あたります。一方で、そうしたモデリングが現実を全くとらえておらず数式を駆使したお遊びにしか見えない、ということでパリに戻り、膨大なデータを駆使した歴史的研究に着手しています。この流れ、神経科学でも脳の数理モデルとかデータへの機械学習の適用とかをやっていると、"現実を全くとらえていないお遊び"になることが頻繁にあるので、非常に共感するところがあります。

Multiple-elite

で、ここから本題の論文の話です。今年の頭に公開された論文(http://piketty.pse.ens.fr/files/Piketty2018.pdf)ですが、この論文での問いは、「政治が不平等解消のための再分配政策から関心を失ってきたのは何故か」です。この論文でピケティは米・仏・英の選挙後の投票先の自己申告データを用いて、収入・資本・学歴・年齢などの各要素が年代を通じてどのように投票行動に関連してきたか、その変化を分析しています。重要なデータはfigure1.1から1.2にまとまっており、収入・資本・学歴に関連して、ここ50年の投票行動がかなりはっきりと変化してきた様子を発見したのがこの論文の一番の新規性です。要約すると、昔は労働者の代表として機能していた左派政党が、高学歴エリートの代表として機能しており、一方で右派政党は高資本エリートの代表として機能している。つまり、Class-based(社会的な低階層v.s.高階層)ではなくMultiple-elite(高学歴エリートv.s.高資本エリート)の対決になっていることをデータから示しています。学歴と資本は当然に相関するのでこういう分析は難しそうに直感的に思いますが、多くのデータがあればある程度切り分けができそうです。この状況が、格差是正のための再分配に対する政治意欲の低下へとつながっているとピケティは指摘しています。

こうして政治の話からピケティの関心事である格差政策の話につながってくるわけですが、このMultiple-elite状態が様々な現状を説明できるとしているのも興味深い点です。例えば、再分配政策が論点とならないため、ポピュリズムによって低所得層を右派が獲得しやすくなっている状況や、低所得層における投票率の低下などが説明できるとのこと。

個人的には、機械学習の政治応用に興味があるので、個人情報と政治趣向の関係や、どんな政策・候補者に個人が動かされるのかとか、そういうのは面白そうだなと思ってます。

21世紀の資本

以下余談ですが、「21世紀の資本」の主張とどう絡んでくるのがを整理するためにど素人なりにめちゃくちゃざっくりまとめます。

  • 労働から得られる所得の増分(g)よりも、資本(株や不動産)から得られる利益の増分(r)の方が所得の伸び率よりも大きい(r>g)。
  • 20世紀は戦争や政府の介入によってr=gに近づいていただけで、21世紀は再びr>gになる。(ここを指摘したのがピケティのこの本の新規性)
  • お金持ちが今のお金を素早く増やしてもそれを全部使うならいいけど、実際の消費・投資バランスをみるとそうなってはいない。
  • 相続によってその格差は更に引き継がれる。少子化によってスタート地点の一極集中はますます加速する。
  • したがって、個人が持つ(広い意味での)資本への累進課税を強化すべき。その際、税率が低い国に逃げることができないように各国協調すべき。

以上、データの扱い方や指標の定義には批判もあるそうなので、事実というよりはピケティの主張として捉えるべきものだと思っています。また、主にEUを念頭においておりアメリカや日本などその他の国に当てはめていいかどうかも注意が必要とのこと。

オックスフォードの情報系人材(学生・ポスドク)の就職事情

オックスフォードは大学街なので、知り合う人の多くは学生か研究者。そのため、特に自分が話すような若い年代の人だとオックスフォードにずっといるつもりの人は少数派です。なので必然的に進路について話す機会も多くなります。

僕は今のところ目の前のことにいっぱいいっぱいであまり考えられていないのですが、周囲の人と話していると皆自分よりもよほどしっかり考えていて勉強になります。そこで、(オックスフォードや日本時代の)周囲の人の話を聞いた上で、情報系の人間として自分が進路についてどんな風に考えているか、少しまとめてみます。考えるべき観点は色々あると思いますが、少なくとも以下の点は多くの人にとって重要だと思います(順不同)。

1.内容 - 何ができるか
2.働き方 - どんな風に働けるか
3.給料 - いくら貰えるか
4.場所 - どこで働くか
5.同僚 - どんな人と働けるか

1.内容

理論家の場合は、雇ってさえもらえれば基本的にどこでも仕事が出来るのであまり考える必要はなさそうです。一方で自分のように中途半端な立ち位置の場合は、興味深いデータと十分な計算資源があることが大事になってきます。このとき、企業か研究所か大学か…というような分け方をしても、それぞれの中で差が大きすぎるためあまり意味がありません。基本的に情報系は産学の垣根が低いですし、また、やりたいことがやれて充実したデータ・設備を使える企業もあれば、縛りが極めて強くデータも設備も不足している大学はあります。なので結局、個別に検討していくことになります。
具体的な点としては、自分の名前で成果物を発表出来るかどうかも非常に重要です。その後の進路選択における自由度にも繋がってきますし、単純にそれ自体がやり甲斐になるからです。一般的な傾向としては大学や研究所の方が論文を重視されるので若いうちはそういう場所にいて論文数を稼ぐ戦略はメジャーなものと言えますが、情報系では一部企業の一部研究所が大学並みに論文を出したりもしているので、ここも結局個別に見ていくことになります…。

2.働き方

他の分野同様、研究寄りの職種の方が働き方(時間や勤務体系)は自由だと思います。自分の知り合いでも、(企業・大学問わず)週の大半は家やカフェで作業しているという人が複数人います。ここでも、企業か研究所か大学か…というような分け方にはあまり意味がありません。劣悪な環境はどこにでもあるからです。なので、結局個別に検討していくことになります。幸いなことに今は情報系の人材が不足しているため、名の知れた企業であればどこも働きやすさには気を使っているところが多く、差がつきにくいと思います。一方で研究所や大学は環境差がかなり大きいので、個別に情報を検討する必要があります。

3.給料

大学・研究所は大体どこも似たような水準で、日本国内と国外の差も大してありません。企業の場合は少し差がでてきます。イギリスやアメリカだと、情報系の学部または修士を卒業して、Amazon, Facebook, Google, Netflix, Uberなどにエンジニアとして就職すると大学勤務の1.5倍ぐらい(1000万円~)からが相場のようです。これは日本でも大体同じぐらいでした。PhD取得後にそれら企業での開発・研究職についた場合は上記の2倍(2000万円~)からが相場のようです。物価なども関係しているので日本との単純比較は難しいのに注意が必要です。ベンチャー企業に進む場合は、給与が劣りリスクも大きいものの、大きなアップサイドが狙えることがメリットです。

4.場所

文化、治安、食事、物価、、、など色々な問題がそれぞれの都市で異なってくるので極めて重要な問題です。ただ、転勤や海外赴任などを考える必要が無いため、同一地域内で考える分には差はつかないと思います。

5.同僚

大学や研究所だと、研究室外の人と関わる機会は自分でコントロールできる印象です。色んな研究をしている人が周りにいる場所の方が刺激が多いので、多様な研究室がある場所の方が自分は好みです。企業だと、総合大学などに比べると研究面での周囲の専門分野が限られてくる一方、研究職以外の人と関わる機会が多くなります。そうした場合にどんな人と働くことになるかは、運要素も大きいと言えます。特に上司や同僚の不確実性は企業の方が幅が広い気がします。研究所や大学だと元々名前を知ってる人が周りに多いこともザラなので。

複雑な行動系列の学習は誤差逆伝播的に行われない

来週締め切りの国際会議に提出する論文の準備が忙しすぎて完全にBlogを放置していました。

目論見としてはこちらに来てからの仕事のうち2つ(それぞれ人間と動物の実験データ解析)を出す予定でした。が、動物の方の結果がまだ微妙、かつそもそも規定上二重投稿が不可能なことが判明し人間の方だけ準備することに。とりあえず金曜日には共著者に投げたので、この土日は積んでいた他の仕事に取りかかれそうです(休めるわけではない…)。

そんな気晴らしに読んだ論文がこれです。
Optogenetic Editing Reveals the Hierarchical Organization of Learned Action Sequences.

脳の中心には線条体という部位があり、様々な学習や行動の実行重要な役割を果たしていることが知られています。線条体は複数の回路を通じて脳表面の皮質と複雑に情報をやり取りをしており、それら回路には"直接路"だとか"間接路"だとか色々な名前がついています。この論文は、複雑な行動系列を動物が学習する際にそれらの回路がどのような役割を果たしているかを検証したもの。具体的には、マウスに"左-左-右-右"という(マウス的には十分に複雑な)行動セットにより報酬が貰える課題をさせ、その学習に各回路がどう関わっているかを調べています。

神経生理的な発見の部分は以下の記事でわかりやすく説明されているのでゆずります(ちなみにこの方はいつも質の高い論文紹介をタイムリーに書いていて尊敬します)。
7月6日 行動の順序決める脳回路(6月28日号Cell掲載論文) | AASJホームページ
個人的には一通り説明しきったあとの以下の結びの言葉に激しく同意しました。

これでも頭が混乱するだけだと言われそうだが、線条体の二つの回路の奥の深さはよくわかると思う。

上の記事で触れていない部分でこの論文で強調されている点としては、行動系列の学習が報酬獲得から単純に後ろ向きに(back-propagation)学習されているわけではないということです。Back-propagation的、つまり報酬に対して近い行動系列から順に重要性を高めていく学習をした場合は"左-左-右-右"という行動セットの最後の"右"から順に学習していき、スタートの"左"は最後に学習されるはずです。しかし、学習結果を見るとスタートの"左"とゴールの"右"が途中の行動よりも先に、セットとして学習されていました。ここから、学習が階層的に行われているのではという流れに展開していき、各回路がスタート・ゴール、または左右のスイッチ等をコントロールしていくメカニズムを実験的に検証しています。(細かいですが、このケースはBack-propagationの信用割り当て(Eligibility trace)の時に最初と最後の重みが大きいと考えることもできます。なので厳密に言うなら、特定の重みで信用を割り当てながらBack-propagationしているケースが否定された、ということでしょう)

よく結果を見ると、"左x2→右x2"という系列を学習したというよりは"左複数回→右複数回"という系列を学習したといった方が正しい印象で、そこはこの論文の弱いところだと思います。レビュアーから指摘されたのか、そこをコントロールした実験もSupplementaryに載せており、一応一貫した結果は出ているようですが。