第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) − 捗る機械学習・自然言語処理 祭り − を開催しました

2014/10/11 "第39回 データマイニング+WEB@東京( #TokyoWebmining 39th ) −捗る機械学習自然言語処理 祭り−"を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-39
参加者セキココ:第39回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1. 「広告領域における機械学習活用: CVR予測最前線」 ([Twitter:@tsubosaka])(発表30分+議論40分)

近年オンライン広告においてはRTBの普及により1impressionあたりの価値を正確に予測する必要性があり、また広告領域においては大量のログデータが存在する。
このため広告領域においては大量のログデータから広告を表示した際のCTR, CVRの予測に機械学習を利用する研究がいくつもなされている。
本発表では今年の8月に行われたKDD 2014の広告関連のワークショップのADKDD2014で発表されたFacebookでの広告のCTR予測手法を中心に機械学習と広告領域の応用について発表する。

参考文献:

2. 「捗るリコメンドシステムの裏事情」 (講師: [Twitter:@mosa_siru])(発表25分+議論35分)

2014年夏コミに合わせてリリースされた、君にシンクロするニュースアプリ「ハッカドール」。
ハッカドールちゃんがオタク用の記事を拾ってくれるサービスで、開発陣の並々ならぬ情熱によって作られたアプリ。
今回はその裏側のリコメンドシステムを紹介します。
オタクにドメインを絞ると何が起こるのか?ニッチな話がてんこもりです。

参考文献:

3.「マーケティングサイエンス徹底入門と実践 Part2 : 購買行動徹底分析」 (講師: @sanoche16 )(発表30分+議論40分)

市場分析・価格分析・顧客分析など、企業を支えるマーケティングサイエンスに関する発表Part2です。今回は顧客の購買行動に焦点をあて、顧客に刺さるものづくりのPDCAをまわす上で強烈なインプリケーションを出す様々な分析について、入門的トピックから徹底的に語ります。

参考文献:

マーケティング・モデル (Rで学ぶデータサイエンス 13)

マーケティング・モデル (Rで学ぶデータサイエンス 13)

Discrete Choice Methods with Simulation

Discrete Choice Methods with Simulation

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感



発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第39回 データマイニング+WEB@東京( #TokyoWebmining 39th )−マーケティング分析活用最前線 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り− を開催しました

2014/7/26 "第38回 データマイニング+WEB@東京( #TokyoWebmining 38th ) −マーケティング分析活用最前線 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-38
参加者セキココ:第38回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1.「ここでしか聞けない! マーケティング分析実践編」(講師: [Twitter:@sato_mitsunori] )(発表30分 + 議論40分) (UST: 公開、資料: 非公開)

日用消費財メーカーのマーケティング部門で行っている分析事例をお話しします。
日用消費財は生活に欠かせない比較的安価な製品が多く、衝動買いといった非計画購買される割合が高いことが特徴です。またインターネット販売が当たり前になった現在でも流通額の多くは実店舗が占めています。
今回の発表では10年前に社内SEからマーケティング部門の分析担当者になったスピーカーが実践・経験したマーケティングPDCAについて赤裸々にお話しします。

2.「マスマーケティングにおける広告・販促施策の効果検証について」 (講師: [Twitter:@saynoway66])(発表20分 + 議論30分) (UST:公開、資料: 部分公開)

マスマーケティングにおける広告・販促施策の効果測定方法について、一般的に良く用いられる手法の一つである「マーケティングミックスモデリング」を中心に、(勉強中の内容も含め)お話しさせて頂きます。WEBマーケティングダイレクトマーケティングと異なり、個人の購買や広告接触のトラッキングが困難な、マスマーケティングの世界で、どのような取り組みが行われているかを少しでもお伝えできたら幸いです。
参考文献:
ROI入門 
MarketingMixModeling(Wikipedia)


3. アンカンファレンス

進行説明 (5分) ( 進行: [Twitter:@iakiyama])

Topic LT(計15分:)/チーム分散(5分)/チーム内議論 (30分) /各チーム発表(計15分)
Topic 1.「Webスクレイピングのセーフ or Not」(講師: [Twitter:@nezuq])

Webスクレイピングの法律問題を話し合いませんか?Webスクレイピングする時、その解析結果を公表する時、訴えられる心配をしてしまいます。その心配をなくす為に、合法/違法の境界線を話し合いましょう。

参考資料

議論ホワイトボード:

Topic 2.「お金の儲かる機械学習」(講師: [Twitter:@tetsuyas] )

資料:お金の儲かる機械学習

「お金の儲かる機械学習」では、金融現象の予測に機械学習が利用できるかどうか?ということについて検討したいと思います。利用する情報や投資対象の性質を元に、皆さんで現実的かどうかを考えましょう。
参考資料

議論ホワイトボード:

Topic 3.「ビジネスにおけるデータビジュアリゼーション」(講師: [Twitter:@kokoichiro])

高度な分析をどう伝えていくのか、浸透させていくのかは分析を行う上でも大きな課題です。D3.js、Tableau等、データを可視化する環境が整っている中、ビジュアリゼーション領域、ダッシュボード作成が極めて活発になっています。皆さんが誰に対して、どのような目的で、どのような体制でデータの可視化を行っているのか議論したいと思っています。
参考資料
Information Dashboard Design: Displaying data for at-a-glance monitoring

Information Dashboard Design: Displaying data for at-a-glance monitoring

議論ホワイトボード:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感


発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第38回 データマイニング+WEB@東京( #TokyoWebmining 38th )−マーケティング分析活用最前線 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第37回 データマイニング+WEB@東京( #TokyoWebmining 37th ) −広告配信最適化・実運用 祭り− を開催しました

2014/6/21 "第37回 データマイニング+WEB@東京( #TokyoWebmining 37th ) −広告配信最適化・実運用 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者セキココ:第37回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

T1. 各TRY 状況報告 (※Kimさん 急遽予定入り前半しか参加できなくなったため、前半に移動しました)

ハッカソンに関して(@haegwankim ): 5分

1.「マルコフ連鎖モデルによるアトリビューション分析(インターネット広告への応用)(講師: [Twitter:@hokagawa] )(発表20分 + 議論40分)

インターネット広告は運用が柔軟にできるため、速やかな投資判断が可能です。投資判断をするためには、広告に対して評価指標が必要です。従来の評価方法では、売り上げに対してラスト接触の広告に対してのみ、成果ポイントがつくような評価指標でした。その中で「ラスト接触の広告以外にも適切な評価をして、適切な投資判断などをしようという試み」が生まれ、アトリビューション分析と呼ばれています。
現在、この分析に定型はなく、各企業でバリエーションがあります。このトークでは、比較的一般的な手法を紹介した後、マルコフ連鎖モデルによる手法を紹介します。数学的な構造や、他分野での展開を含めて議論できればと思います。

参考文献:

2.「経路積分から眺める確率過程」(講師: [Twitter:@Masa_S3] ) (発表25分 + 議論40分)

確率過程を扱う手法の一つとして、素粒子物理学で開発された経路積分と呼ばれる手法が存在します。経路積分はもともと素粒子の相互作用を計算するのに活用されていましたが、次第に金融などの諸分野へ応用されるようになってきています。本発表では経路積分の概念の簡単な説明とその応用について紹介します。

推薦文献:

ゲージ場の量子論〈1〉 (新物理学シリーズ)

ゲージ場の量子論〈1〉 (新物理学シリーズ)

Quantitative Finance and Risk Management: A Physicist's Approach

Quantitative Finance and Risk Management: A Physicist's Approach

3. アンカンファレンス

進行説明 (5分) ( 進行: [Twitter:@haegwankim] -> [Twitter:@dicethekamikaze])

Topic LT(計15分:)/チーム分散(5分)/チーム内議論 (30分) /各チーム発表(計15分)
Topic 1.「ビジネスレベルでの自然言語処理〜葛藤と現実〜」 (講師: [Twitter:@dicethekamikaze])

テキストマイニングサーチエンジン、感情分析、評判分析、オントロジー)が注目されるなか、 実際のビジネスレベルではどのように自然言語処理が活用されているのをメイントピックとさせていただきます。
アカデミックレベルではなく、ビジネスレベルでいかに自然言語処理と向き合っているのか、バックグラウンドを持った方々は、どのように業務で自然言語処理に携わっているのかなど、自社サービス意外の言語処理活用事例などの情報交換などもふまえたビジネスレベルでの自然言語処理について議論したいと思います。

議論ホワイトボード:

Topic 2.「ユーザー分析における特徴量(変数)の作り方について」(講師: [Twitter:@obnym])

分析を行う際には、対象を表現する量を『つくる』→『捨てる/まとめる』→『分析に投げる』の作業がついて回るかと思います。この『つくる』と『捨てる/まとめる』についてどんな工夫があるかについて議論したいと思います。

議論ホワイトボード:

Topic 3. 「B2Bデータ運用の悩み〜葛藤と現実〜」(講師: [Twitter:@iakiyama])

※資料効果され次第、追記します。
法人のデータの汚い原因・事象・何故汚くなるかを共有します。皆さんがどのようにB2B法人顧客データを扱っているか、どのように扱えば、よりよい分析・運用が出来るのかを議論したいと思います。

議論ホワイトボード:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード


※発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第37回 データマイニング+WEB@東京( #TokyoWebmining 37th )−広告配信最適化・実運用 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

懇親会(ピザパーティ)

懇親会で前回からホワイトボードも用意し、ピザを食べ・お酒を飲みながら、ホワイトボードを用い議論できるようにしています。
懇親会ホワイトボード写真も共有します。


推薦文献

広告関連:

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

自然言語処理関連:

入門 自然言語処理

入門 自然言語処理

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)


講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り− を開催しました

2014/5/24 "第36回 データマイニング+WEB@東京( #TokyoWebmining 36th ) −確率モデリング・サービス活用 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List: Twitter List TokyoWebmining 36th
参加者セキココ:第36回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)

以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1. アンカンファレンス (司会進行: [Twitter:@haegwankim])

進行説明 (5分) ( 進行: [Twitter:@haegwankim])

Topic LT(計20分)/チーム分散・チーム内議論 (45分) /各チーム発表(計20分)
Topic 1.「インターネット広告代理店の現場におけるデータ分析探訪」( 講師:[Twitter:@hokagawa] )

スピーカーはインターネット広告代理店で約3年間データアナリストとして働いています。最近のデータ分析ブームの煽りを受けて、営業が主役のインターネット広告代理店の現場でも、統計学データマイニングを活用したデータ分析が注目され、活用されるようになっています。
ショートトークでは、スピーカーが約3年間で経験した中で、現場で活用されるデータ分析手法の一覧を紹介します。具体的には、回帰分析、時系列分析、因子分析、クラスター分析、実験計画法、数学的な予測モデルなどの、インターネット広告の現場への応用を紹介します。
※6月のトークでは、これらのデータ分析の中でもより数学的な色彩が強い方法を紹介します。具体的には、広告間の相関を考慮した複数広告への予算ポートフォリオのための「マルコフ連鎖によるアトリビューション分析」を紹介します。

議論ホワイトボード:

Topic 2.「確率過程と戯れる」( 講師:[Twitter:@Masa_S3] )

金融工学、経済学、マーケティングなど幅広い領域で確率現象が登場します。確率現象を理解し、最適化するために確率と仲良くするにはどうしたらよいでしょうか。ショートトークでは確率過程と"戯れる"方法の一つとして『経路積分』と呼ばれる手法を、ダイジェスト版&イメージ重視でやさしく紹介します。経路積分は確率過程を解析する便利なツールとして使え、金融工学の解析に応用されたりしています。様々な分野への応用可能性にも少し言及したいです。
※より詳しい紹介(金融工学やネット広告への応用の可能性)は6月のトークで行う予定です。

議論ホワイトボード:

Topic 3. 「データから導きだすABテストの手法」( 講師:[Twitter:@haegwankim] )

ウェブサービス開発・マーケティングにおいて「イテレーション」や「カイゼン」のコンセプトが出てきて久しくなりました。リリースするのがゴールではなく、そこからどのようにしてパフォーマンス・KPIを高めていくかが重要視されています。そうした環境にいる方を集め、どのようなデータを集めるのか、そしてそのデータをどのように活用していくかを議論します。多くあるテストの中で最もポピュラーなABテストに照準をしぼり、実践されているテクニックについて共有出来る場を設けることが出来れば幸いです。

議論ホワイトボード:

2.「国立病院機構における診療情報分析について」(講師: [Twitter:@imoan1983])(発表20分 + 議論25分)

国立病院機構本部診療情報分析部は2010年度、診療情報データバンクを整備し、機構144病院から診療データを集め分析を行っています。収集データの特性と問題点、分析のためのデータセット構築に至るまでの各種問題の解決、およびそれらを元に行っている分析をご紹介します。
参考文献:

3.「On Kaggle Re-ranking contest」 (講師: [Twitter:@fulmicoton] )(発表25分 + 議論30分)


資料リンク:http://fulmicoton.com/slides/tokyo_webmining
(フランスから Kaggle機械学習コンテスト1位の[Twitter:@fulmicoton] さんが来日し話してくれました)

End of 2013, Russian search engine "Yandex" organized a personalized re-ranking contest hosted on Kaggle. The goal of the competition was to re-rank top-10 URLs returned by the search engine using historical information about the user. Dataiku sponsored a team which eventually won first prize. This presentation will talk about the general problem of reranking, its pitfalls, and will go through a simple approach called point-wise. It will also be the tale of our journey through the contest.

参考文献:

各TRY 状況報告 ([Twitter:@komiya_atsushi])

※資料公開され次第、追記します。

■講師立候補・振返り:

「講師立候補」進行:[Twitter:@hamadakoichi] (20分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード


※発表立候補、Keep・Try項目詳細に関しては、下記ツイートまとめをご覧下さい。

ツイートまとめ (Togetter)

「第36回 データマイニング+WEB@東京( #TokyoWebmining 36th )−確率モデリング・サービス活用 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

推薦文献

アドテクノロジー関連:

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

DSP/RTBオーディエンスターゲティング入門 (Next Publishing)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

アドテクノロジー プロフェッショナル養成読本 ~デジタルマーケティング時代の広告効果を最適化! (Software Design plus)

経路積分関連:経路積分の導出方法が明解

ゲージ場の量子論〈1〉 (新物理学シリーズ)

ゲージ場の量子論〈1〉 (新物理学シリーズ)

機械学習関連:

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

パターン認識と機械学習 上

パターン認識と機械学習 上

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

パターン認識と機械学習 下 (ベイズ理論による統計的予測)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第35回 データマイニング+WEB@東京( #TokyoWebmining 35th ) −サーベイ・オープンデータ活用祭り−を開催しました

2014/4/26 "第35回 データマイニング+WEB @東京 ( #TokyoWebmining 35th) −サーベイ・オープンデータ活用祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List: Twitter List TokyoWebmining 35th
参加者セキココ:第35回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)

以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1.「ネット選挙分析振り返り 」(講師: [Twitter:@wakafuji] / [Twitter:@saicologic] )(発表15分 + 議論20分)

ネット選挙運動解禁後 初の国政選挙であった、第23回参議院議員通常選挙の分析を実施しました。定量・定性の分析結果と、分析の過程をお伝えします。

開発ツールURL:

参考文献:

2.「A survey of "2013 Data Science Salary Survey"  ~2013年度版 データ扱う人のカネ調査~」(講師: [Twitter:@showyou] )(発表20分 + 議論25分)

"2013 Data Science Salary Survey" という、O'reillyの資料が公開されてるので、その紹介をします。途中でツール別の年収の差とか出るので、ざっとツールの紹介もします。比較的エンジニア寄りな話になります。
参考文献

3. 「Linked Open Dataと日本語Wikipediaオントロジー」 (講師: [Twitter:@s_tamagawa] ) (発表 30分 + 議論35分)

オープンデータ化により,簡単に様々な領域の情報をマッシュアップすることができ,革新的なサービスを提供できるようになってきている.セマンティックWebの分野では,Linked Open Data (LOD)と呼ばれる,RDFのような大規模なグラフ型データを公開・共有する動きが注目を受けており,国内でも少しずつであるが普及しはじめている.
本講演では,アカデミックな視点から,LODやオントロジーなどに関する最近の動向と自身の研究である日本語Wikipediaオントロジーを紹介し,LOD・オントロジーの有用性,今後の展望,希望など広く議論したい.

参考文献

アンカンファレンス・LT (司会進行: [Twitter:@dicethekamikaze])

Topic: LT・チーム議論・発表
はじめに ( [Twitter:@dicethekamikaze] )

Topic1: データ分析における最適な判断材料とは何か ([Twitter:@dicethekamikaze])

Topic2: データサイエンティストのリクルーティング([Twitter:@rinzo_rinrin])

Topic3: データのビジュアライズについて『実践編』([Twitter:@takamatsu_tomo])

各TRY 状況報告 ([Twitter:@komiya_atsushi])

■講師立候補・振返り:

「講師立候補」進行:@hamadakoichi (20分)

「振返り」進行:@hamadakoichi (40分)

風景:ホワイトボード

※発表立候補、Keep・Try項目に関しては、下記ツイートまとめをご覧下さい。

推薦文献

TokyoWebminingを紹介して頂きました。
入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック

言語処理のための機械学習入門 (自然言語処理シリーズ)

言語処理のための機械学習入門 (自然言語処理シリーズ)

関連ツイート(Togetter)

「第35回 データマイニング+WEB@東京( #TokyoWebmining 35th ) −サーベイ・オープンデータ活用祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第34回 データマイニング+WEB@東京( #TokyoWebmining 34th ) −パーソナライズ・マーケティング 祭り−を開催しました

2014/3/22 "第34回 データマイニング+WEB @東京 ( #TokyoWebmining 34th) − パーソナライズ・マーケティング 祭り−"を開催しました。

会場提供し運営を手伝って下さったニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List: Twitter List TokyoWebmining 34th
参加者セキココ:第34回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1.「Yahoo! Japanにおけるレコメンデーションでの機械学習活用事例」(講師: [Twitter:@rai_ty] ) (発表30分 + 議論40分)

【資料】公開され次第、追記します。

Yahoo! Japanで行なっているデータ・機械学習の活用事例として、レコメンデーションプロジェクトでの取り組みについて紹介します。事例としてEコマースサービス・キュレーションサービスについて失敗談も交えながら紹介します。

2.「はじめての Privacy Preserving Data Mining (PPDM) 入門」 (講師: [Twitter:@obnym] )(発表20分 + 議論30分)

昨年あたりから省庁が本格的に動き始めたパーソナルデータ活用について、プライバシーに配慮しながらマイニングを行う手法について紹介します。

参考文献:
A Probabilistic Extension of k-Anonymity Data-Dependent Pk-Anonymization Method for Publishing Useful Anonymized Table

3.「モバイルアプリのデータマーケティング超入門」(講師: [Twitter:@haegwankim] ) (発表 30分 + 議論40分)

開発者でも分かるデータを使ったモバイルアプリのマーケティングを話します。
アクセス解析、プロダクトのABテスト、拡散ロジック、メール・通知などを理解することで、ビジネス要件をどのように製品開発に落とし込んでいくかを議論。
*特に非ゲームアプリのマーケティングについて話す予定です。

参考文献:

進化と人間行動

進化と人間行動

Mobile traction is getting harder, not easier. Here’s why.
How to Model Viral Growth: The Hybrid Model
Startup Metrics for Pirates (Slide Share)

■講師立候補・振返り:

「講師立候補」進行:@hamadakoichi (20分)

「振返り」進行:@hamadakoichi (40分)

※資料アップし次第追記します。

推薦文献

集合知イン・アクション

集合知イン・アクション

集合知プログラミング

集合知プログラミング

関連ツイート(Togetter)

「第34回 データマイニング+WEB@東京−パーソナライズ・マーケティング 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第33回 データマイニング+WEB@東京( #TokyoWebmining 33rd ) − 大規模データ活用・サービス開発 祭り−を開催しました

2014/2/22 "第33回 データマイニング+WEB @東京 ( #TokyoWebmining 33rd) − 大規模データ活用・サービス開発 祭り−"を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

会場:FreakOut Hills Garage

参加者Twitter List: Twitter List TokyoWebmining 33rd
参加者セキココ:第33回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

1.「株式会社サイバーエージェントにおけるソーシャルゲームに対する協調行動研究の知見の適用」 (講師: [Twitter:@mtknnktm] ) (発表30分 + 議論40分)

ソーシャルゲームではユーザ同士の協力や競争がゲームの中心に位置付けられています。そのためユーザの社会的な相互作用について分析することは良いサービ スにしていくために重要です。一方でソーシャルゲームにおけるユーザは互いに協力関係でもあり、また、競合関係でもあるため、複雑な社会関係が存在します。

私たちはそういった複雑な社会関係について分析するために、代表的な社会的な行動の一つである「協調行動」に着目しました。協調行動は進化や心理を扱 う分野(理論生物学・進化心理学など)において重要なトピックの一つです。

本発表では、そのような分野の知見をソーシャルゲームに適用することによって協調行動を説明・理解することを試みます。

参考資料:
長谷川寿一, 長谷川真理子: 進化と人間行動, 東京大学出版会 (2000).
・David G Rand and Martin A Nowak. Human cooperation.
 Trends in cognitive sciences, Vol. 17, No. 8, pp. 413-25, August 2013.
・Genki Ichinose and Takaya Arita. The role of migration and founder effect
 for the evolution of cooperation in a multilevel selection context.
Ecological Modelling,
 Vol. 210, No. 3, pp. 221-230, 2008.

2.「楽天行動ターゲティング広告 」(講師: [Twitter:@takamatsu_tomo])(発表25分 + 議論35分)

【資料】本トークは資料非公開となります。

楽天が持つユーザデータを活用したビジネスの事例として、
行動ターゲティング広告について、ビジネス・システム・アルゴリズムの3点からご紹介します。

参考資料:
DSP・レコメンド全般:
DSP/RTBの基本的な仕組み | DSP/RTB入門書特別公開 #1
推薦システムのアルゴリズム
推薦システム
Recommender Systems survey - Knowledge-Based Systems (2013)読んだ(1/2)

個別アルゴリズム
R言語によるアソシエーション分析−組合せ・事象の規則を解明する−
アソシエーション分析
ベイジアンネットとレコメンデーション

3. 「ビックデータとクラウドソーシング」 (講師: [Twitter:@nobuyukishimizu] ) (発表 40分 + 議論50分)

これまでのクラウドソーシングの歴史から、インターネットが普及した現代のクラウドソーシングを事例を交えつつ説明します。特に、オープン・イノベーションを生み出すクラウドソーシングの例を説明し、ビックデータを用いた機械学習で成果を出すまでに重要なタスク設定・改良プロセスのポイントを解説します。

Yahoo!でのクラウドソーシングの紹介や、クラウドソーシングの課題、未来のお話をしたいと思います。

参考文献:

クラウドソーシング―みんなのパワーが世界を動かす (ハヤカワ新書juice)

クラウドソーシング―みんなのパワーが世界を動かす (ハヤカワ新書juice)

Yahoo!クラウドソーシング
Yahoo!クラウドソーシング(Facebook Page)

■講師立候補・振返り:

「講師立候補」進行:@hamadakoichi (20分)

「振返り」進行:@hamadakoichi (40分)

※資料アップし次第追記します。

推薦文献

集合知イン・アクション

集合知イン・アクション

集合知プログラミング

集合知プログラミング

関連ツイート(Togetter)

「第33回 データマイニング+WEB@東京−大規模データ活用・サービス開発 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容: