第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り− を開催しました

2014/5/24 "第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List: Twitter List TokyoWebmining 36th
参加者セキココ:第36回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)

以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1. アンカンファレンス (司会進行: [Twitter:@haegwankim])

進行説明 (5分) ( 進行: [Twitter:@haegwankim])

Topic LT(計20分)/チーム分散・チーム内議論 (45分) /各チーム発表(計20分)
Topic 1.「インターネット広告代理店の現場におけるデータ分析探訪」( 講師:[Twitter:@hokagawa] )

スピーカーはインターネット広告代理店で約3年間データアナリストとして働いています。最近のデータ分析ブームの煽りを受けて、営業が主役のインターネット広告代理店の現場でも、統計学データマイニングを活用したデータ分析が注目され、活用されるようになっています。
ショートトークでは、スピーカーが約3年間で経験した中で、現場で活用されるデータ分析手法の一覧を紹介します。具体的には、回帰分析、時系列分析、因子分析、クラスター分析、実験計画法、数学的な予測モデルなどの、インターネット広告の現場への応用を紹介します。
※6月のトークでは、これらのデータ分析の中でもより数学的な色彩が強い方法を紹介します。具体的には、広告間の相関を考慮した複数広告への予算ポートフォリオのための「マルコフ連鎖によるアトリビューション分析」を紹介します。

議論ホワイトボード:

Topic 2.「確率過程と戯れる」( 講師:[Twitter:@Masa_S3] )

金融工学、経済学、マーケティングなど幅広い領域で確率現象が登場します。確率現象を理解し、最適化するために確率と仲良くするにはどうしたらよいでしょうか。ショートトークでは確率過程と"戯れる"方法の一つとして『経路積分』と呼ばれる手法を、ダイジェスト版&イメージ重視でやさしく紹介します。経路積分は確率過程を解析する便利なツールとして使え、金融工学の解析に応用されたりしています。様々な分野への応用可能性にも少し言及したいです。
※より詳しい紹介(金融工学やネット広告への応用の可能性)は6月のトークで行う予定です。

議論ホワイトボード:

Topic 3. 「データから導きだすABテストの手法」( 講師:[Twitter:@haegwankim] )

ウェブサービス開発・マーケティングにおいて「イテレーション」や「カイゼン」のコンセプトが出てきて久しくなりました。リリースするのがゴールではなく、そこからどのようにしてパフォーマンス・KPIを高めていくかが重要視されています。そうした環境にいる方を集め、どのようなデータを集めるのか、そしてそのデータをどのように活用していくかを議論します。多くあるテストの中で最もポピュラーなABテストに照準をしぼり、実践されているテクニックについて共有出来る場を設けることが出来れば幸いです。

議論ホワイトボード:

2.「国立病院機構における診療情報分析について」(講師: [Twitter:@imoan1983])(発表20分 + 議論25分)

国立病院機構本部診療情報分析部は2010年度、診療情報データバンクを整備し、機構144病院から診療データを集め分析を行っています。収集データの特性と問題点、分析のためのデータセット構築に至るまでの各種問題の解決、およびそれらを元に行っている分析をご紹介します。
参考文献:

3.「On Kaggle Re-ranking contest」 (講師: [Twitter:@fulmicoton] )(発表25分 + 議論30分)


資料リンク:http://fulmicoton.com/slides/tokyo_webmining
(フランスから Kaggle機械学習コンテスト1位の[Twitter:@fulmicoton] さんが来日し話してくれました)

End of 2013, Russian search engine "Yandex" organized a personalized re-ranking contest hosted on Kaggle. The goal of the competition was to re-rank top-10 URLs returned by the search engine using historical information about the user. Dataiku sponsored a team which eventually won first prize. This presentation will talk about the general problem of reranking, its pitfalls, and will go through a simple approach called point-wise. It will also be the tale of our journey through the contest.

参考文献:

各TRY 状況報告 ([Twitter:@komiya_atsushi])

※資料公開され次第、追記します。

■講師立候補・振返り:

「講師立候補」進行:[Twitter:@hamadakoichi] (20分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード


※発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )−確率モデリング・サービス活用 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

推薦文献

アドテクノロジー関連:

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

経路積分関連:経路積分の導出方法が明解

ゲージ場の量子論〈1〉 (新物理学シリーズ)

ゲージ場の量子論〈1〉 (新物理学シリーズ)

機械学習関連:

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

パターン認識と機械学習 上

パターン認識と機械学習 上

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容: