第15回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 15th)−統計・ビジネス活用 祭り− を開催しました
2011/11/06 "第15回 データマイニング+WEB 勉強会@東京−統計・ビジネス活用 祭り−"を開催しました。
会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。
以下、全講師資料、関連資料、ツイートまとめです。
AGENDA:
■Opening Talk:
O1.「データマイニング+WEB勉強会@東京 について」(15分)
講師 : id:hamadakoichi [Twitter:@hamadakoichi]
オープニングトーク − 創設の思い・目的・進行方針 −データマイニング+WEB勉強会@東京
O2.「参加者全員自己紹介」(75分)
進行 :[Twitter:@hamadakoichi]
1.「統計カリキュラム 第1回−一般化線形モデル−」 (講師: [Twitter:@isseing333さん]) (発表30分 + 議論30分)
参考資料:
ぼくのかんがえたとうけいがくぶかりきゅらむ

- 作者: Annette J.Dobson,田中豊,森川敏彦,山中竹春,冨田誠
- 出版社/メーカー: 共立出版
- 発売日: 2008/09/08
- メディア: 単行本
- 購入: 15人 クリック: 152回
- この商品を含むブログ (13件) を見る
- 予測精度が高くなるように、正則化項をいくつか試す
- 一般線形モデル(GLM)
- 線形重回帰
- 分散分析(ANOVA): Xはカテゴリもしくはダミー変数
- カテゴリと連続変数
- 一般化線形モデル (GLIM)
- 2値変数例
- サービス加入者が1か月以内に辞めるか(1)否か(0)
- ロジスティック回帰: 期待値にロジット変換。Logit(E[y])=βX
- はずれ値判定
- ?てこ比、?分散が均一か、?残差プロット
- うまくまとまらない場合は層を分ける
2.「医療分野におけるデータマイニングを始める前に知っておきたいこと (講師: [Twitter:@dichika])(発表20分 + 議論20分)
資料:「一般非公開で、希望者のみに配布」という形となります。配布希望の方は 講師 [Twitter:@dichika] さんへご連絡下さい。
データマイニングは強力な武器ですが、「解くべき問題」をうまく設定して初めてその威力を発揮します。本発表では問題の設定につながるようなヒントを提示できればと思います。
関連資料:Big data: The next frontier for innovation, competition, and productivity (PDF)
3.「複雑ネットワークとデータマイニング 徹底入門」 (講師: [Twitter:@milionsmile]) (発表30分 + 議論30分) (※USTREAM非公開)
参考文献:

- 作者: 増田直紀,今野紀雄
- 出版社/メーカー: 近代科学社
- 発売日: 2010/04/26
- メディア: 単行本
- 購入: 4人 クリック: 34回
- この商品を含むブログ (12件) を見る

「複雑ネットワーク」とは何か―複雑な関係を読み解く新しいアプローチ (ブルーバックス)
- 作者: 増田直紀,今野紀雄
- 出版社/メーカー: 講談社
- 発売日: 2006/02/21
- メディア: 新書
- 購入: 8人 クリック: 59回
- この商品を含むブログ (72件) を見る
- 複雑ネットワークを用いると CTRが上がった事例がある
- 最近、グラフ構造と情報を合わせて解析される
- 本日は無向グラフ中心
- スモールワールド実験 -平均距離 (ミリグラム 1960年代)
- 平均距離 L ∝ LogN 的
- 6次の隔たりで、世界中の人々へ到達。
- クラスター係数: ノードi の友人どうしが友達である確率。
- 次数相関: エッジ
- 中心性
- コミュニティ構造
- モチーフ: グラフに含まれやすい三角形のパターン。
- ランダムネットワーク
- スケールフリーネットワーク
- 複雑ネットワーク
- 定義:現実の何かに対応するグラフ。人、タンパク質、等。
- べき乗則に従う
- 適用例
- ウィルス感染
- ネットワーク故障問題
- 商品同時購入のグラフ。推薦。
- ゲームのシミュレーション
4. 「エンジニア向けマーケティングリサーチ入門」 (講師: [Twitter:@tetsuroitoさん]) (発表20分 + 議論20分)
資料:11/6 Tokyo Wemining Marketing Research for Engeenier by Tetsuro Ito on Prezi]
ビジネスで必要なマーケティング活動において、ソーシャルメディアの普及などでマーケティングリサーチの必要性が高まっています。基本的な概念や分析手法をエンジニアの方にもわかりやすくご紹介したいと思います。
参考文献:

- 作者: 萩原雅之
- 出版社/メーカー: SBクリエイティブ
- 発売日: 2011/03/01
- メディア: 単行本
- 購入: 3人 クリック: 25回
- この商品を含むブログ (11件) を見る

- 作者: リサーチ・ナレッジ研究会,田中洋
- 出版社/メーカー: ダイヤモンド社
- 発売日: 2010/08/06
- メディア: 単行本
- 購入: 2人 クリック: 33回
- この商品を含むブログ (4件) を見る
- Money Look
- 顧客にあった商品提供
- マーケティングリサーチの業界売上規模は横ばい
- Marketing 1.0/2.0/3.0
- 1.0: 商品中心
- 2.0: 顧客維持
- 3.0: Value Driven。製品価値を正しい人に届ける。
- インフルーエンサーの特定。適切なサービス・メッセージ配信。
- マーケティングの肝
- プロダクトアウト→マーケットインへ。
- 心がまえ
- 誰が何をするためのことを知りたいか
- 何がわかると自分たちはうれしいか
- 消費者や顧客を理解する方法も拡張が必要
- 次世代マーケティングリサーチ
- Marketing Research Online Community (MROC)
- 共感覚
- 行動心理学
5. 「2chのイカ娘スレッドを時系列分析してみた」 (講師: [Twitter:@gepuro]) (発表20分+ 議論20分)
2ちゃんねるには、長い年月に渡って、同じテーマのスレッドが作られています。これらに対して、テキストマイニングのアプローチとして、時系列に分析してみました。
参考資料: JIN'S PAGE
- 月ごとの語の発生頻度推移・各種統計解析
■声・議論:
D. 「参加者の声・ディスカッション」 (60分)
進行 : id:hamadakoichi [Twitter:@hamadakoichi]
参加者全員での振返り結果(継続したい良かった点、改善点、次回AGENDA)。
http://www.xmind.net/share/_embed/hamadakoichi/no-15-views-data-mining-web-tokyo-continues-and-you-wan/
推薦文献

- 作者: 太田一樹,下垣徹,山下真一,猿田浩輔,藤井達朗,濱野賢一朗
- 出版社/メーカー: 翔泳社
- 発売日: 2011/01/28
- メディア: 大型本
- 購入: 14人 クリック: 668回
- この商品を含むブログ (43件) を見る

- 作者: Satnam Alag,堀内孝彦,真鍋加奈子,真鍋和久
- 出版社/メーカー: ソフトバンククリエイティブ
- 発売日: 2009/03/27
- メディア: 大型本
- 購入: 13人 クリック: 295回
- この商品を含むブログ (64件) を見る

- 作者: Toby Segaran,當山仁健,鴨澤眞夫
- 出版社/メーカー: オライリージャパン
- 発売日: 2008/07/25
- メディア: 大型本
- 購入: 91人 クリック: 2,220回
- この商品を含むブログ (277件) を見る
関連ツイート(Togetter)
「第15回 データマイニング+WEB 勉強会@東京−統計・ビジネス活用祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)
第15回 データマイニング+WEB@東京 ( #TokyoWebmining #15)-統計・ビジネス活用 祭り- - Togetter
講師募集
データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の Twitter か Google Group へのメールへぜひご連絡下さい。
連絡先:
過去開催内容:
- 第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました - hamadakoichi blog
- 第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました - hamadakoichi blog
- 第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました - hamadakoichi blog
- 第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り− - hamadakoichi blog
- 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り− - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました - hamadakoichi blog
- 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog
- 第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました - hamadakoichi blog
- 第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました - hamadakoichi blog
- 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました - hamadakoichi blog
- 第5回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#5) −WEB解析・最適化祭り−を開催しました - hamadakoichi blog
- 第4回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#4) −WEB祭り−を開催しました−「ソーシャルウェブ と レコメンデーション」 - hamadakoichi blog
- 第3回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#3) を開催しました−「R言語による クラスター分析 -活用編-」 - hamadakoichi blog
- 第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#2) を開催しました - 「はじめてでもわかる R言語によるクラスター分析」- - hamadakoichi blog
- 第1回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#1) を開催しました - 「はじめてでもわかる 統計解析・データマイニング R言語入門」 - hamadakoichi blog