第23回 データマイニング+WEB@東京( #TokyoWebmining 23rd)−大規模ソーシャルデータ・アクセス解析 祭り− を開催しました
2012/10/27 "第23回 データマイニング+WEB@東京−大規模ソーシャルデータ・アクセス解析 祭り− "を開催しました。
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
参加者Twitter List: Twitter List TokyoWebmining #23
参加者セキココ:第23回 データマイニング+WEB @東京 セキココ
(作成してくれた @komiya_atsushi さんに感謝)
以下、全講師資料、関連資料、ツイートまとめです。
AGENDA:
■Opening Talk:
O1.「データマイニング+WEB勉強会@東京 について」(15分)
講師 : id:hamadakoichi [Twitter:@hamadakoichi]
O2.「参加者全員自己紹介」(75分)
進行 :[Twitter:@hamadakoichi]
「TwitterでのUser Recommendation」(講師: @americiumian ) (発表25分 + 議論30分)
Twitterユーザ推薦に関して、どのような研究が行われているかについて紹介します。
参考文献:
- TwitterRank:Finding Topic-Sensitive Influential Twitterers.
- Finding your friends and following them to where you are.
- 属性伝播モデルを用いたマイクロブログのフォロー先推薦法
- Google PageRankの数理 ―最強検索エンジンのランキング手法を求めて―
- よいユーザとは?
- 総合的に影響力高いユーザを推薦
- 同じトピックを共有するユーザ
- 各トピックの影響力高い:
- リンク解析
- ランダムにツイートを抽出、LDA:どのトピックの発言が多いか
- ユーザ間の類似度を測る、関係グラフを構成、トピック頻度で重み付け
- 効果:次の方法よりいい:Follower, Follower Graphによる Pageranki、Topic 頻度によらない Twitter Rank
- 属性伝搬に着目した推薦
- 同じ興味、所属のユーザを推薦
- 前提:ユーザは同じ属性をもつユーザを友達にしやすい
- ある属性をもつユーザN人以上にフォローされているユーザを抽出
- そのユーザ群がフォローされているユーザを抽出していく
- コミュニティの発見
- TURKEYS (Twitter User Ranking using KEY word Search )
- Retweet, Replay
- クエリを含むツイート、リプライ。
- クエリx ユーザ行列から、ユーザxユーザの隣接行列算出。HITSに似ている
- 同じ語彙を使うユーザ、同じ場所にいたユーザ、共通フォロー先
- ユーザ推薦の評価
- 主観評価:ツイートを実際に見る。
- 客観評価:推薦ユーザを見せ、質問にn 段階で答えてもらい、評価
- フォローしたいか、目的にあったユーザか
- ランキング全体の評価
- DCG
- ユーザ推薦
- ユーザは興味にあった情報を得られる。企業にとってはプロモーション。
2. 「SIerもビッグデータ解析ビジネスへ踏み出そう」(講師: @emmie_pp ) (発表25分 + 議論30分)
SIerのビッグデータビジネスへの取組みと、その中で行ったmahoutを使ったソーシャルデータ分析トライアルについてご紹介します。
参考文献:
- 作者: Sean Owen,Robin Anil,Ted Dunning,Ellen Friedman
- 出版社/メーカー: Manning Publications
- 発売日: 2011/10/17
- メディア: ペーパーバック
- 購入: 4人 クリック: 81回
- この商品を含むブログ (11件) を見る
- 作者: Tom White,玉川竜司,兼田聖士
- 出版社/メーカー: オライリージャパン
- 発売日: 2011/07/23
- メディア: 大型本
- 購入: 9人 クリック: 182回
- この商品を含むブログ (24件) を見る
- ビックデータ解析への取り組み
- 見える、関係性、予測
- 各種事例
- Volume, Velocity, Variety (組合せの課題)
- 10TB以上のデータを扱う28%
- こんな効果が出せるんじゃないか、というイメージがまだ持てない
- ベンダー:Volume、Velocity で勝負。Varietyはまだ。
- SIer : AsIs、ToBe の整理。
- 活用の議論
- ソーシャルデータを用いた加盟店分析
3. 「Androidアプリ内蔵広告 徹底解析」(講師: @lumin ) (発表25分 + 議論30分)
- セキュリティといえば lumin さん。何かあれば取材依頼が来て、テレビ出演 100回以上。
- secroid の中の人 http://secroid.jp/
- The Movie 系
- 全国電話帳の解析
- 彼ログ、ミログ(廃業)、The Movie
- 通信すると取れる情報
- Android 広告
- 利用者情報の利用目的と取得
- Google プライバシーポリシー
- secroid の中の人 http://secroid.jp/
- AndroidId, UUIDを作成して識別情報を作る
- 仕様する IDはSHA1 or MD5
4. 「ネットで個人はどこまで追われているか」(講師: @tomiyoichi ) (発表25分 + 議論30分)
ウェブマーケの業界動向と絡めて、どんな分析がされていてデータ取得はどこまでがOKなの?といったテーマで話しします。#数式は一切出さずに説明する予定です。
参考資料:
- 消費者庁HP:個人情報の保護
- 経済産業省HP:個人情報保護
■声・議論:
D. 「参加者の声・ディスカッション」 (60分)
進行 : id:hamadakoichi [Twitter:@hamadakoichi]
参加者全員での振返り結果MindMap
- 継続したい良かった点
- 改善点アクション
- 次回AGENDA
推薦文献
- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (64件) を見る
- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
関連ツイート(Togetter)
「第23回 データマイニング+WEB 勉強会@東京−大規模ソーシャルデータ・アクセス解析 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第23回 データマイニング+WEB@東京 ( #TokyoWebmining #23) -大規模ソーシャルデータ・アクセス解析 祭り- - Togetter
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第22回 データマイニング+WEB@東京( #TokyoWebmining 22nd)−広告最適化・アクセス解析・可視化 祭り− を開催しました - hamadakoichi blog
- 第21回 データマイニング+WEB@東京( #TokyoWebmining 21th)−ソーシャルグラフ解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第20回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 20th)−ソーシャル・大規模解析 祭り− を開催しました - hamadakoichi blog
- 第19回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 19th)−データ徹底活用・機械学習 祭り− を開催しました - hamadakoichi blog
- 第18回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 18th)−大規模分散処理 最前線 祭り− を開催しました - hamadakoichi blog
- 第17回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 17th)−分散機械学習・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第16回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 16th)−リアルタイム分散 Web解析・自然言語処理 祭り− を開催しました - hamadakoichi blog
- 第15回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 15th)−統計・ビジネス活用 祭り− を開催しました - hamadakoichi blog
- 第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました - hamadakoichi blog
- 第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました - hamadakoichi blog
- 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り− - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り− - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog