第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました
2010/09/26 "第7回 データマイニング+WEB 勉強会@東京"を開催しました。
第7回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#7) −機械学習・解析・セマンティックウェブ祭り−: ATND
Google グループ
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた [Twitter:@karubi] さん、[Twitter:@rinzo_rinrin]さん、 [Twitter:@nakamuu_m]さん、[Twitter:@yanaoki]さん、[Twitter:@ajiyoshi]さん、[Twitter:@yokkuns]さん、[Twitter:@buhii]さん、[Twitter:@doryokujin]さん、一緒に運営をしてくれた[Twitter:@yanaoki]さん、ありがとうございました。今後も「データマイニング+WEB 勉強会@東京」を、講師、参加者、双方にとってよりよい会としていきたいと思いますので、今後ともよろしくお願い致します。
次回は 11/14(日)開催予定です。みなさんぜひご参加下さい。
以下、講師資料一覧、ツイートまとめ、参加者の声、次回開催AGENDAです。
AGENDA:
O1.“Openinig Talk” (10分)
講師 : id:hamadakoichi [Twitter:@hamadakoichi]
O2."参加者全員自己紹介" (30分)
「はじめてでもわかる Random Forest入門 −集団学習による分類・予測 −」(発表20分 + 議論20分)
講師 : hamadakoichi [Twitter:@hamadakoichi]
関連:
「バスケット分析入門 −相関分析マイニング−技術編」(発表15分 + 議論15分)
講師 : karubi [Twitter:@karubi]
・全商品が前提または、結論に入っている場合はルールにならないので排除する
・価値あるルールはわずかな数
・FP Growth 全組合せを作る必要がないので効率的 (2000年ぐらい)
・Support の順にTreeを構成
・FP Growth : Mahout Parallel FP Growth が実装
「ニューラルネットで画像分類」(発表10分 + 議論 10分)
講師 : rinzo_rinrin (Twitter:@rinzo_rinrin)
・bag-of-visual-wordsを特徴量としてニューラルネットワークに入力、画像分類。
・Open CV
「GAを用いた最適化の応用例:シミュレータ上のロボットの運動学習と体構造の進化」 (発表10分 + 議論10分)
講師 : nakamuu_m [Twitter:@nakamuu_m]
「はじめてでもわかるベイズ分類器 −基礎からMahout実装まで−」 (発表 10分 + 議論 10分)
講師 : yanaoki (Twitter:@yanaoki)
[メモ]
・集合知プログラミング 6章: ベイズ分類器。Rubyで実装。
・Mahout : ベイズ分類
-Naive Bayes
-Cpmplementary Naive Bayes
・入力準備・学習・評価フェーズに Hadoop 利用。
・Classifier (Mahout 用意)
「自炊漫画の濃度研究」(発表10分 + 議論10分)
講師 : ajiyoshi [Twitter:@ajiyoshi]
・漫画濃度の線形増加。
・だいたいあっている。
「初めてでも分かるヘッジファンド入門」(発表 20分 + 議論 20分)
講師 : yokkuns [Twitter:@yokkuns]
・CAPM モデル
・βはどう決めるか
・統計的ペアトレード
・価格が同じように動く
・真の価値はおよそ同じ
・係数が同じ
・同じ動きの算出。
⇒相関を見る。
「ソーシャルアプリでの Amazon Elastic MapReduce 活用事例」(発表15分+議論15分)
講師: buhii [Twitter:@buhii )
・Amazon Elastic Mapreduce。 20インスタンスまで。各インスタンスで small, big等選択。
最大 20 インスタンスで 160 CPU。
・ゲームユーザーが何日後アプリに来なくなったか。
「明日から始めるログ解析 – Hadoop とMongoDBを活用したソーシャルアプリ解析-」(発表20分 + 議論20分)
講師: doryokujin (Twitter:@doryokujin)
・15億PV。
・おみせやさんログ解析
・Game のセーブデータ。Cassandra 18 ノード。
・Hadoop の利用。
・ユーザーのグループ分け。どのくらい継続しているか、課金帯はどうか。
−継続期間(やめた、1週間未満、1週間以上、3ヶ月以上)と、
−課金額の(0円、1000円、1万円、1万円以上)
のマトリクス
・ソーシャルアプリの課金は山あり、谷あり。
・イベントを打ち出した期間が山。
D. 「参加者の声・ディスカッション」 (30分)
進行 : Twitter:@hamadakoichi
参加者全員での振返り結果(継続したい良かった点、改善点)、次回AGENDAです。
http://www.xmind.net/share/_embed/hamadakoichi/data-mining-web-7th-improvement-next-event-information-t-1/
次回へ延期
・「セマンテックウェブとRDFDB」(発表15分+議論15分) 講師:[Twitter:@hirosuke_asano]
・「アクセスデータ収集と解析」(発表15分+議論15分) 講師:[Twitter:@tomiyoichi]
・「WEB解析と意思決定 −統計的有意差の観点から−」(発表15分+議論15分) 講師:
[Twitter:@otanet]
推薦文献
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (64件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
関連ツイート(Togetter)
「第7回 データマイニング+WEB 勉強会@東京−機械学習・解析・セマンティックウェブ祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)