「R言語による Random Forest 徹底入門−集団学習による分類・予測−」− #TokyoR #11 で講師をしてきました

2011/01/29 第11回R勉強会@東京(Tokyo.R #11) で講師をしてきました。
R言語による Random Forest 徹底入門 −集団学習による分類・予測−」。


Random Forest は"機械学習"の方法論で、集団学習により精度高い判別・予測を実現します。
双方向の進行で、質疑応答・議論含め 合計60分で話しました。

隠れ Random Forest 祭り

今回のTokyo.R、実は「隠れ Random Forest 祭り」。直前の3トーク、「3. caretパッケージの紹介」(id:dichika [Twitter:@dichika])、「4. RにおけるHPC 並列計算編」([Twitter:@sfchaos])、「5.Rで始めるテキストマイニング)」([Twitter:@AntiBayesian])の中で、「Random Forest良い、詳細は [Twitter:@hamadakoichi] さんから!」という嬉しい振りを受けてのトークとなりました。

Random Forest 徹底入門

内容構成に関しては、初めての人でも分かるようにと、"Random Forest" の前提知識となる "決定木"や"集団学習"に関しても内容構成に入れ、それぞれ"アルゴリズム"、"R言語での実行方法(実行可能なSource Code含む)"を記載しています。また各自がすぐに実行し試せるように、資料中で用いているデータも、R言語環境にデフォルトで用意されているデータを用いています。

統計解析・データマイニング機械学習R言語人材の活躍の場

データマイニング+WEBの創設の思いにも書いていますが、「蓄積されたデータを活用し、継続的に活動進化できる世界を作りたい」と私は考えています。

その中で、統計解析・データマイニング機械学習は重要な要素です。それらのスキルセットを持った R言語の人材に関し、"R言語人材が そのスキルを十分に活かし活躍できる場が提供されているか?"を調べてみました(※資料前半に結果を記載しています)。

2011/01/28 にそれまでになかった、新たなよい変化がありました。今後、ソーシャル業界全体や、他業界の人材採用の追従を歓迎します。今後、各領域での統計解析・データマイニング機械学習R言語の活用、人材の活躍の場を広げていきたい。そう考えています。一緒に、蓄積データの統計解析・データマイニング機械学習活用による 継続的な活動・サービス進化を実現していきたい。

全体AGENDA/講師資料

今回の全体AGENDAと公開されている資料を以下に共有します。

ツイート(Togetter)

※"誰でも編集可能"に設定してあります

第11回 R勉強会@東京 #TokyoR #11 - Togetter

推薦文献

Rによるデータサイエンス データ解析の基礎から最新手法まで

Rによるデータサイエンス データ解析の基礎から最新手法まで

Rによる統計解析

Rによる統計解析