第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました

2010/09/26 "第7回 データマイニング+WEB 勉強会@東京"を開催しました。
第7回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#7) −機械学習・解析・セマンティックウェブ祭り−: ATND
Google グループ

会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた [Twitter:@karubi] さん、[Twitter:@rinzo_rinrin]さん、 [Twitter:@nakamuu_m]さん、[Twitter:@yanaoki]さん、[Twitter:@ajiyoshi]さん、[Twitter:@yokkuns]さん、[Twitter:@buhii]さん、[Twitter:@doryokujin]さん、一緒に運営をしてくれた[Twitter:@yanaoki]さん、ありがとうございました。今後も「データマイニング+WEB 勉強会@東京」を、講師、参加者、双方にとってよりよい会としていきたいと思いますので、今後ともよろしくお願い致します。

次回は 11/14(日)開催予定です。みなさんぜひご参加下さい。


以下、講師資料一覧、ツイートまとめ、参加者の声、次回開催AGENDAです。

AGENDA:

O2."参加者全員自己紹介" (30分)

「バスケット分析入門 −相関分析マイニング−技術編」(発表15分 + 議論15分)

講師 : karubi [Twitter:@karubi]


・全商品が前提または、結論に入っている場合はルールにならないので排除する
・価値あるルールはわずかな数
・FP Growth 全組合せを作る必要がないので効率的 (2000年ぐらい)
・Support の順にTreeを構成
・FP Growth : Mahout Parallel FP Growth が実装

ニューラルネットで画像分類」(発表10分 + 議論 10分)

講師 : rinzo_rinrin (Twitter:@rinzo_rinrin)

・bag-of-visual-wordsを特徴量としてニューラルネットワークに入力、画像分類。
Open CV

「GAを用いた最適化の応用例:シミュレータ上のロボットの運動学習と体構造の進化」 (発表10分 + 議論10分)

講師 : nakamuu_m [Twitter:@nakamuu_m]

[メモ]
・合コンの席配置の最適化アルゴリズム
データマイニングコンテスト
・株自動売買システム

「はじめてでもわかるベイズ分類器 −基礎からMahout実装まで−」 (発表 10分 + 議論 10分)

講師 : yanaoki (Twitter:@yanaoki)

[メモ]
集合知プログラミング 6章: ベイズ分類器。Rubyで実装。
・Mahout : ベイズ分類
 -Naive Bayes
 -Cpmplementary Naive Bayes
・入力準備・学習・評価フェーズに Hadoop 利用。
・Classifier (Mahout 用意)

「自炊漫画の濃度研究」(発表10分 + 議論10分)

講師 : ajiyoshi [Twitter:@ajiyoshi]


・漫画濃度の線形増加。
・だいたいあっている。

「初めてでも分かるヘッジファンド入門」(発表 20分 + 議論 20分)

講師 : yokkuns [Twitter:@yokkuns]

CAPM モデル
・βはどう決めるか
・統計的ペアトレード
・価格が同じように動く
 ・真の価値はおよそ同じ
 ・係数が同じ
・同じ動きの算出。
 ⇒相関を見る。

「ソーシャルアプリでの Amazon Elastic MapReduce 活用事例」(発表15分+議論15分)

講師: buhii [Twitter:@buhii )

Amazon Elastic Mapreduce。 20インスタンスまで。各インスタンスで small, big等選択。
 最大 20 インスタンスで 160 CPU。
・ゲームユーザーが何日後アプリに来なくなったか。

「明日から始めるログ解析 – Hadoop とMongoDBを活用したソーシャルアプリ解析-」(発表20分 + 議論20分)

講師: doryokujin (Twitter:@doryokujin)

・15億PV。
・おみせやさんログ解析
・Game のセーブデータ。Cassandra 18 ノード。
Hadoop の利用。
・ユーザーのグループ分け。どのくらい継続しているか、課金帯はどうか。
 −継続期間(やめた、1週間未満、1週間以上、3ヶ月以上)と、
 −課金額の(0円、1000円、1万円、1万円以上)
 のマトリクス
・ソーシャルアプリの課金は山あり、谷あり。
・イベントを打ち出した期間が山。

D. 「参加者の声・ディスカッション」 (30分)

進行 : Twitter:@hamadakoichi

参加者全員での振返り結果(継続したい良かった点、改善点)、次回AGENDAです。
http://www.xmind.net/share/_embed/hamadakoichi/data-mining-web-7th-improvement-next-event-information-t-1/

次回へ延期

・「セマンテックウェブとRDFDB」(発表15分+議論15分) 講師:[Twitter:@hirosuke_asano]
・「アクセスデータ収集と解析」(発表15分+議論15分) 講師:[Twitter:@tomiyoichi]
・「WEB解析と意思決定 −統計的有意差の観点から−」(発表15分+議論15分) 講師:
[Twitter:@otanet]


推薦文献

集合知イン・アクション

集合知イン・アクション

集合知プログラミング

集合知プログラミング

関連ツイート(Togetter)

「第7回 データマイニング+WEB 勉強会@東京−機械学習・解析・セマンティックウェブ祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

http://togetter.com/li/54026

発表者募集

連絡