第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました
2011/01/16 "第9回 データマイニング+WEB 勉強会@東京−1st Week− 大規模解析・機械学習・クオンツ 祭り−"を開催しました。
※会場参加者ID写真(id:bob3 さんに感謝)
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
今回、第9回では初めて開催期間を2週に渡り開催します(1/16, 23)。2週開催の目的は1."多くのテーマを対象とし"、かつ 、2."各テーマにしっかりと時間を充て、深い議論を行えるようにすること" です。また1st Week 1/16 は「しっかり時間を充て深い議論を行う」進行方針をいつにも増して重視し、発表時間の2倍を議論時間に設定しています。今後も「データマイニング+WEB 勉強会@東京」を、講師、参加者、双方にとってよりよい会としていきたいと思いますので、今後ともよろしくお願い致します。
※2nd Week も 1/23に開催しますのでみなさんぜひ。ATND: http://atnd.org/events/11998
以下、講師資料一覧、ツイートまとめ、参加者の声、および、第10回の現時点でのAGENDAです。
AGENDA:
■Opening:
O1.“Openinig Talk” (10分)
講師 : id:hamadakoichi [Twitter:@hamadakoichi]
蓄積データを活用し継続的に活動進化できる世界を作りたい。蓄積データを有効活用したい人が、それを実現できるようにしたい。そう考え「データマイニング+WEB勉強会@東京」を始めました。発表者・参加者にとってより有意義な場にするために、3つの進行方針を設定しています。会の最初にその進行方針を皆で共有し進めています。
O2."参加者全員自己紹介" (50分)
■大規模解析:
1. 「Mahout Canopy Clustering」(発表30分 + 議論60分)
講師 : id:hamadakoichi [Twitter:@hamadakoichi]
Canopy Clusteringは通常の多くの手法と異なり、クラスタ数指定を必要とせず、指定距離 離れたクラスタ算出を実現する。Hadoop上で動作する大規模データマイニング・機械学習ライブラリ Mahoutでの実行法も含め話しました。
関連エントリ・文献:
- Mahout: Data Converter for Clustering - hamadakoichi blog
- Introduction to Mahout Clustering - #TokyoWebmining #6
- Mahout Programming : K-Means Clustering - hamadakoichi blog
- 元論文PDF Efficient clustering of high-dimensional data sets with application to reference matching, A. McCallum, K. Nigam, L. H. Ungar (2010)(PDF)
- Mahout Wiki: Canopy Clustering
- Apache Mahout - Random Forests - #TokyoWebmining #8
2. 「機械学習=機械の代わりに人間が学習入門 −エンジニアが機械学習を学ぶには」(発表20分 + 議論40分)
講師 : id:n_shuyo [Twitter:@shuyo]
Gihyo.jp でも機械学習の連載し裾野を広げる活動をされているサイボウズラボの @shuyo さん。今回、機械学習の歴史や専門外エンジニアがどのように学んでいけばいいかに関し、お話し頂きました。
関連エントリ
3. 「安全にスケールするログ解析システム構築の勘所」(発表20分 + 議論40分)
講師 : id:yamaz [Twitter:@yamaz]
大規模ログ解析のシステム構築には実は隠された 技術・勘所がある。今回、大規模広告配信エンジンを開発されているスケールアウト代表 @yamaz さんにその技術・勘所に関しお話し頂けました。
関連エントリ
- 2010-09-10(第6回に配信側のトークをしていただきました)
■クオンツ:
4. 「コピュラと金融工学の新展」(発表20分 + 議論40分)
講師 : id:teramonagi [Twitter:@teramonagi]
コピュラ関数は、多変数の分布関数と周辺分布関数の多様な依存関係の記述を新たに可能にする。今回、クオンツ @teramonagi さんにコピュラ活用、金融工学の新展開に関しお話し頂けました。
関連エントリ:
5. 「賃料相場のデータマイニング」(発表20分 + 議論40分)
講師 : rinzo_rinrin [Twitter:@rinzo_rinrin]
大規模賃貸データの解析をされている @rinzo_rinrin さん。賃貸データ解析の勘所に関し、お話し頂けました。
D. 「参加者の声・ディスカッション」 (60分)
進行 : Twitter:@hamadakoichi
参加者全員での振返り結果(継続したい良かった点、改善点)、次回AGENDAです。
推薦文献
- 作者: Tom White,玉川竜司,兼田聖士
- 出版社/メーカー: オライリージャパン
- 発売日: 2010/01/25
- メディア: 大型本
- 購入: 9人 クリック: 449回
- この商品を含むブログ (73件) を見る
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (64件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
関連ツイート(Togetter)
「第9回 データマイニング+WEB 勉強会@東京−−1st Week− 大規模解析・機械学習・クオンツ 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 9)-1st Week- 大規模解析・機械学習・クオンツ 祭り- - Togetter
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog