Kaggleでデータ処理の最先端を学ぶ

データを効率的に処理する手法の最先端がどうなっているのか知りたい時があります。
Kaggle: Your Home for Data Science
このKaggleというサイトは様々な企業がデータと問題を公開して、世界中のプログラマが、データを使った問題を解く精度を競うサイトです。優勝者には数百万円の賞金が入るため近年非常に盛り上がっており、昨年Googleが運営会社を買収しました。

Kaggleの各問題には、各参加者が他の参加者向けに役立ちプログラムを公開する"Kernel"というコーナーがあります。可視化から簡単なデータ解析まで色んなやり方が公開されており、しかも良いKernelは他の参加者の投票によって上位に上がってくる仕組みになっています。そのため、上位のKernelを見ることは、最新のデータ処理方法を知る上で非常に勉強になります。

自分がどういうデータ解析を現在やっているかにもよりますが、日本企業でもリクルートとメルカリが現在出題していて題材も馴染み深いため、その辺のKernelを見てみると、どういう風にデータを処理するのがトレンドなのか理解しやすいです。以下はそれぞれの良さげなやつ。
Mercari Interactive EDA + Topic Modelling | Kaggle
A Japanese Journey | Kaggle