第46回 データマイニング+WEB @東京( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りーを開催しました

2015/05/30 "第46回 データマイニング+WEB @東京 ( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りー" を開催しました。

会場提供し運営を手伝って下さった SmartNews のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-46
参加者セキココ:第46回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1.「トピックモデルことはじめ」(講師: [Twitter:@yamano357] ) (発表:45分+議論:50分)

トピックモデルについて、ユニグラムモデル・混合ユニグラムモデルを通じて必要となる知識をまとめ、拡張に関しても説明します(主に参考書籍(1)をベースに)。また、可能であれば適用事例についても、ご紹介させていただきます。

参考文献:
[書籍]

[文献]

[サイト]

2. 「傾向スコアを使ったキャンペーン効果検証」 (講師: [Twitter:@obnym] )(発表:20分+議論:25分)

オンラインの世界では最早標準的になった様に見えるA/Bテスト(無作為化試験)ですが、オンラインの世界ではコストやポリシー的な理由で実施でき無い場合が多くあります。今回は、傾向スコアと言う値を用い、擬似的にA/Bテストをしたかの様な結果を求める方法をご紹介します。
参考文献:

3. 「"移動"にまつわるBIG DATAの応用事例と解析手法 ~ Bayesian Modeling を添えて ~」 (講師: [Twitter:@juju7ts] )(発表:30分+議論:35分)

本発表では位置情報を活用したサービス事例及び解析手法について取り上げます。内容としては、私自身が学生時に研究で扱っていた"Probe-Car data"(車両の軌跡のデータ) の活用及び研究事例や、タクシー配車サービスである"Uber"で用いられているデータ活用事例に触れていきます。具体的に"Uber"では、配車時におけるユーザーの位置やその他の特徴量を用いて、ユーザーの目的地を予測し、配車の最適化を図っています。そこで用いられている"Bayesian Modeling"は、"Data Science"界隈でも非常に重要な手法の一つです。本発表においては、それら手法の基礎的な事項を踏まえながら、共に学習していきたいと思います。

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード:

■ツイートまとめ (Togetter)

「第46回 データマイニング+WEB @東京 ( #TokyoWebmining 46th ) ー統計モデリング 実活用 祭りー」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容:

第45回 データマイニング+WEB @東京 ( #TokyoWebmining 45th ) − オープンデータ 最前線と未来 祭り −を開催しました

2015/04/18 "第45回 データマイニング+WEB @東京 ( #TokyoWebmining 45th ) − オープンデータ 最前線と未来 祭り −" を開催しました。

会場提供し運営を手伝って下さった SmartNews のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-45
参加者セキココ:第45回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@yamano357] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1.「位置情報にまつわるデータ補間技術」 (講師: [Twitter:@xianshiyuming] )(発表35分+議論40分)

地理空間データ(位置情報)は実世界における都市の全体像や人の動きを俯瞰できる魅力的なデータです。しかしその一方、個人情報を内包する問題や、位置精度 等の問題により、粒度が細ければ細かいほどデータの取得・扱いが困難なデータでもあります。このような問題を抱えつつも、実用的にデータを扱えるようにす るための補間技術と展望について話題提供します。

参考文献:

2. 「LHCにおける素粒子ビッグデータの解析とROOTライブラリ」 (講師: [Twitter:@madyagi] )(発表30分+議論35分)

実験素粒子物理学においては、加速器を使った高エネルギー素粒子の衝突実験から生まれる大量のデータを分析するため、かつてよりあらゆる科学分野の中でも最 もデータ量の多い領域でした。スイスのCERN研究所で行われている最新の実験、LHC(Large Hadron Collider)では、最初の2年間で、1PB(ペタバイト)のデータが生成され、その一部は昨年オープン化されました。本講演では、LHCのビッグ データがどのように解析されたのか、インフラ及びアプリケーションレベルの観点ご紹介します。特に、アプリケーションレベルにおいては、独自の統計解析ラ イブラリであるROOTが幅広く使われており、この講演を通じ、ROOTが現在のデータ解析パラダイムのどこに位置しているのかを参加者の皆様と議論した いと思います。
参考文献:


17:00 - 18:05
3. 「日本のオープンデータの現状と未来 -時系列データを例として-」(講師: [Twitter:@yutakashino] ) (発表30分+議論35分)

2013 年にG8の各政府は「G8オープンデータ憲章」[1]として,誰もが自由に利用できるオープンデータを提供する宣言をしました.それにともない日本でも経産 省主導のデータカタログサイト[2]や総務省主導の政府統計の総合窓口"e-Stat"[3]のAPI[4]公開など,「オープンデータ」に関していくつ かの施策がとられるようになってきました.しかし,少し本気をだしてこれらの行政府の「オープンデータ」を活用しようとするとすぐに気づきますが,ほとん どのデータが某メーカの表計算ファイルフォーマットでのデータの公開するというように,到底「オープン」[5]とは言えない状況です.一方,世界の「オー プンデータ」の動向は,世界銀行のデータAPI[6]を始め,「オープンデータ」のお手本になるような先駆的な事例が出てきました.
本発表では,そのよう な世界の事例を紹介すると共に,日本の行政府発表の経済統計などの時系列データを例として,日本における「オープンデータ」の現状と課題を提起したいと思 います.そして,その課題への解決方法の一つとして具体的なプロトタイプサービスを提示することで,「オープンデータ」としての未来の姿へのヒントが得ら れればと思います.

参考文献:
[1] G8オープンデータ憲章
[2] データカタログサイト
[3] e-stat
[4] e-stat API
[5] オープンの定義
[6] 世界銀行データサイト

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード:

■ツイートまとめ (Togetter)

「第45回 データマイニング+WEB @東京 ( #TokyoWebmining 45th ) − オープンデータ 最前線と未来 祭り −」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容:

第44回 データマイニング+WEB @東京 ( #TokyoWebmining 44th ) − 大規模分散・パーソナライズ 実活用 祭り −を開催しました

2015/03/21 "第44回 データマイニング+WEB @東京 ( #TokyoWebmining 44th ) − 大規模分散・パーソナライズ 実活用 祭り −" を開催しました。

会場提供し運営を手伝って下さった SmartNews のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-44
参加者セキココ:第44回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1. 「Agent Based Modelを使ったマーケティング予算配分最適化の米国事例」 (講師: [Twitter:@takabailando] )(発表40分+議論40分)

マーケティングに限らず、最大限の利益を出すために限られた予算をどう配分するかとても熱い領域です。
この領域はMarketing Mix Modelling(MMM)と呼ばれます。この領域では、これまで過去のデータを使って多変量回帰モデルを使った分析が使われてきましたが、最近では状態空間モデルやベイジアンネットワークも注目を浴びるようになり、更なる発展が期待されています。
本日はエージェントベーストモデルというシミュレーション技術を使った予算配分最適化を米国の事例を使ってご紹介します。

参考文献:

2. 「Apache Spark による推薦システム案件例」 (講師: [Twitter:@soonraah] ) (発表30分+議論30分)


昨年あたりから分散処理フレームワーク Apache Spark が大きく注目されています。Spark にはいくつかの高位のライブラリが含まれており、MLlib はその中でも機械学習アルゴリズムを提供するライブラリです。今回は Spark, MLlib を用いて比較的大規模な EC サイト上で推薦システムを開発した案件の例をご紹介します。システムだけでなく、オフライン評価やA/Bテスト等についてもお話する予定です。

参考文献:


3. 「テキストからのSNSユーザ位置推定手法と活用事例紹介」(講師: [Twitter:@arieee0] ) (発表30分+議論30分)

近年エリアマーケティングや観光施策などで位置情報付きのtwitter投稿を活用する事例が増えているが,プロフィールなどを参照しても情報が不足していることが多く,ユーザの属性や位置(居住地・現在地)を投稿内容から推定する必要がある.
今回の発表では,筆者の研究分野である投稿テキストからのユーザ位置推定を中心に,twitter投稿をエリアマーケティングに用いるための基礎技術を紹介する.
また,位置情報付きSNS投稿を活用した実際の事例,サービスなどを紹介し,ビジネスへの応用を議論したい.

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

振返りホワイトボード:

■ツイートまとめ (Togetter)

「第44回 データマイニング+WEB @東京 ( #TokyoWebmining 44th ) − 大規模分散・パーソナライズ 実活用 祭り −」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容:

第43回 データマイニング+WEB @東京( #TokyoWebmining 43rd )−マーケティングモデリング・評価設計 祭り−を開催しました

2015/02/28 "第43回 データマイニング+WEB @東京( #TokyoWebmining 43rd )−マーケティングモデリング・評価設計 祭り−" を開催しました。

会場提供し運営を手伝って下さった ニフティのみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-43
参加者セキココ:第43回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1.「ベイジアンモデリングによるマーケティングサイエンス」 (講師: [Twitter:@sanoche16] )(発表30分+議論30分)

ビッグデータの流行を背景としてマーケティング領域でのAnalyticsの活用は進んでいるものの、従来の単純なモデリングでは現代の多種多様な顧客の特徴を正確に把握することは極めて難しい。
今回は様々な要因が複雑に絡み合っている現象をどうとらえるべきかについて、ベイジアンモデリングの一種である状態空間モデルを利用し、活用方法について解説・ディスカッションを行う。

参考文献:

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS理工学専門書)

ビッグデータ時代のマーケティング―ベイジアンモデリングの活用 (KS理工学専門書)



2.「コンテンツマーケティングにおける データ分析の全体像」 (講師: [Twitter:@greengreenmidor] )(発表40分+議論40分)

コンテンツマーケティングにおいて、データ分析をどのように活用するのか?というトピックについて発表させて頂きます。前半ではコンテンツマーケティング自体の説明を行い、後半では「コンテンツマーケティングにおける指標の作成」、「コンテンツ作成の際のアイディア補助」、「価値あるライター評価とインセンティブ設計」、「ユーザーのセグメンテーションとセグメント別のアプローチ」というった内容をお話できればと考えています。

  1. コンテンツマーケティングについて
    1. コンテンツマーケティングとは?
    2. コンテンツマーケティングの全体像
    3. コンテンツマーケティングを行う際のステップ
  2. サービスについて
  3. 分析について
    1. コンテンツマーケティングにおける指標の作成
    2. コンテンツ作成の際のアイディア補助
    3. 価値あるライター評価とインセンティブ設計
    4. ユーザーのセグメンテーションとセグメント別のアプローチ


参考文献:

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック


3.「化学物質汚染のデータ解析・リスク評価についての私見」(講師: [Twitter:@siero5335] )(発表30分+議論30分)

日本における環境汚染についての報道は一時期に比べて大きく減少し、目に触れる機会が減少しているが、化学物質の問題が解決したわけではない。今回の発表では、発表者がこれまで分析の対象とし、その汚染がいまだ問題になっているポリ塩化ビフェニル(PCBs)の汚染について、データ解析事例を交えて紹介する。

参考文献:

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

■ツイートまとめ (Togetter)

「第43回 データマイニング+WEB @東京 ( #TokyoWebmining 43rd ) − マーケティングモデリング・評価設計 祭り −」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容:

第42回 データマイニング+WEB @東京( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−を開催しました

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-42
参加者セキココ:第42回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1. 「深層学習時代の自然言語処理」(講師: [Twitter:@unnonouno] ) (発表45分+議論45分)

自然言語処理に深層学習の波は来るのか。2014年、自然言語処理界隈で流行した深層学習・表現学習系の主要なトピック、Skip-gramモデル (word2vec)、Paragraph Vector(paragraph2vec)、Recurrent Neural Network、Long Short-Term Memoryといったものを総ざらいし、応用的な観点、言語学的な観点、実装的な観点から広く議論します。

2. 「ディープラーニング徹底活用 −画像認識編−」 (講師: [Twitter:@atelierhide] )(発表30分+議論30分)

 人工知能研究におけるブレイクスルーとしてディープラーニングが注目を集めています。特に画像認識の分野で、たくさんの研究成果が報告されており、実際 にビジネスで活用する動きも出てきています。しかし、その利用はまだ一部の研究者だけに限られるものと思われている方も多いのではないでしょうか。今回は、実際の活用事例を紹介し、画像認識分野におけるディープラーニングがアイデアを実現するためのツールとして、比較的簡単に利用出来るということをお話 しします。活用事例の紹介は、ディープラーニングで作るアイドルグループ、月および火星表面の構造物探索などを予定しています。

参考文献:
Gradient-based learning applied to document recognition Y LeCun, L Bottou, Y Bengio, P Haffner Proceedings of the IEEE 86 (11), 2278-2324
Imagenet classification with deep convolutional neural networks A Krizhevsky, I Sutskever, GE Hinton Advances in neural information processing systems, 1097-1105
Decaf: A deep convolutional activation feature for generic visual recognition. J Donahue, Y Jia, O Vinyals, J Hoffman, N Zhang, E Tzeng, T Darrell.arXiv preprint arXiv:1310.1531
Rich feature hierarchies for accurate object detection and semantic segmentation. R Girshick, J Donahue, T Darrell, J Malik. arXiv preprint arXiv:1311.2524
Deep Learningに基づく画像認識を用いた月および火星表面の擬似不自然構造物探索, 栗原一貴, 笹尾和宏, 山本光穂, 田中秀樹, 奈良部隆行, 國吉雅人, 会田寅次郎, 岡田裕子, 高須正和, 関治之, 飯田哲, 山本博之, 生島高裕. エンターティンメントコンピューティング2014予稿集
ニューラルネットで画像分類(@rinzo_rinrinさん)
画像認識の初歩、SIFT、SURF特徴量(@lawmnさん)
セクシー女優で学ぶ画像分類入門(@tkm2261さん)


3. 「word2vecとは一体なんだったのか?」 (講師: [Twitter:@piroyoung] )(発表30分+議論30分)

Word2vecのインプットとアウトプットを様々な可視化や集計と合わせてご紹介いたします。はたしてword2vecはマーケティングへの応用に耐えうるものなのでしょうか?乞うご期待下さい。

参考文献:
Word2vec配布サイト
Pythonへのword2vecバインディング
Word2vecによる自然言語処理

■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。

■ツイートまとめ (Togetter)

「第42回 データマイニング+WEB @東京 ( #TokyoWebmining 42nd ) −深層学習・表現学習 徹底活用 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容:

第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しました

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者セキココ:第41回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1. 「生命情報のデータマイニング 」(講師: [Twitter:@zgmfx20a] )(発表30分+議論40分)

演者は2000年ごろから生命情報のデータマイニングに着手し、
SVMやRandom Forestsなどの機械学習を用いて課題解決に取り組んできました。
今回はそれらの概略を紹介できればと考えています。

参考文献:
http://web.stanford.edu/~hastie/Papers/ESLII.pdf

2.「状態空間モデルによるモデリング徹底入門」 (講師: [Twitter:@KennyISHIMURA] )(発表25分+議論35分)

時系列で変化する観測値について、観測値だけより、時系列で変化する内部状態を仮定して内部状態から観測値を説明するモデルができたらスッキリする場合が多々ある。
(表に出ない嫁の機嫌はどのように時系列変化して、食事の内容がどのように変わるか等?)
このような数理モデルに状態空間モデルがあるが、制御工学の理論として発展してきたもので文系には難解な部分もある。
この魅力的にも思えるモデリング手法について、まずはその考え方やどのように使えば良いか・その限界等を入門者の立場から発表する。

参考文献:

時系列解析入門

時系列解析入門

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

カルマンフィルタの基礎

カルマンフィルタの基礎

状態空間時系列分析入門

状態空間時系列分析入門

はじめての現代制御理論 (KS理工学専門書)

はじめての現代制御理論 (KS理工学専門書)

3.「フリーソフトウェア「KH Coder」を使った計量テキスト分析―手軽なマウス操作による分析からプラグイン作成まで」 (講師: [Twitter:@khcoder] )(発表30分+議論40分)

KH Coderとはテキストマイニング(内容分析)のためのフリーソフトウェアです。
内部では茶筌・MeCabMySQL+Rを利用しており、これらのツールの機能を統合するためにPerlを使っています。
当日はアンケート自由回答の分析事例を通じて、KH Coderの分析機能をご紹介します。
また、非常に手軽なマウス操作でそうした分析が可能なことを、実際にソフトを動かしてのデモからご覧いただきます。
加えて、ごくわずかなPerlとRのコードを書くことで、新たな分析機能を追加したり、分析を自動化したりできる、プラグイン機構についてお話しいたします。

参考文献:
樋口耕一, 2001-2014, 「KH Coder」 .

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

Rのパッケージおよびツールの作成と応用 (シリーズ Useful R 10)

Rのパッケージおよびツールの作成と応用 (シリーズ Useful R 10)

コーパスとテキストマイニング

コーパスとテキストマイニング


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。


ツイートまとめ (Togetter)

「第41回 データマイニング+WEB @東京 ( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容:

第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) − ソーシャル最適化 祭り −を開催しました

2014/11/29 "第40回 データマイニング+WEB @東京( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−" を開催しました。

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者Twitter List : tokyowebmining-40
参加者セキココ:第40回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1. 「バイラルメディアの可視化 拡大版」 ([Twitter:@saicologic] )(発表30分+議論40分)

近年、急成長しているメディアの形式として「バイラルメディア」があります。
「バイラルメディアとは、インターネット上でウィルスのように伝搬しやすいように作られたコンテンツです。
本発表は国内のバイラルメディアからコンテンツを収集し、バイラルされやすいコンテンツにはどういった特徴があるか自然言語処理等を技術を活用して分析した結果について発表します。
PyConJP2014のライトニングトークの拡大版です。

参考文献:

入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング

入門 ソーシャルデータ 第2版 ―ソーシャルウェブのデータマイニング

バイラルメディアの可視化


2. 「オークションの理論と実証入門」 (講師: [Twitter:@kazukibs])(発表25分+議論35分)

ECのみならず広告や、金融など様々な場所で活用されているオークション。
経済学の世界では「ゲーム理論の実証分析」としては最も成功した例の一つとしても知られています。
今回はインターネットオークションに焦点を当て、経済理論がどのようにデータ分析の役に立つのかをご紹介できればと思います。
理論の概要や分析方法・結果、歴史なども織り交ぜてお話します。

参考文献:

An Introduction to the Structural Econometrics of Auction Data (The MIT Press)

An Introduction to the Structural Econometrics of Auction Data (The MIT Press)

オークションの人間行動学

オークションの人間行動学

Auction Theory, Second Edition

Auction Theory, Second Edition

Bajari, P. and Hortacsu, A. (2004) "Economic Insights from Internet Auctions" Journal of Economic Literature, Vol. XLII, 457-486
ブライアン・リアマウント (1993) オークションの社会史−人身売買から絵画取引まで 高科書店


3.「最適化超入門」 (講師: [Twitter:@tkm2261] )(発表30分+議論40分)

最適化について、全体的な話を語ります。『最適化したい!』と思った時に、最初に参考になるものになれればと思います。Scipyに実装されているものを優先的に紹介し、帰ったらすぐ動かせるよう心がける予定です。
また、組合せ最適化の実務的な話も出来ればと思っています。

トピック
制約なし連続最適化 : ニュートン法最急降下法共役勾配法シンプレックス法 etc.
制約あり連続最適化 : 単体法、内点法
組合せ最適化 : メタ解法(遺伝的アルゴリズム、タブーサーチ等)、混合整数計画ソルバー(Gurobi、CBC等)
ります


追記 : 最適化計算 実装:
https://github.com/anaguma2261/TokyoWebmining_40_tkm2261


参考文献:

あたらしい数理最適化: Python言語とGurobiで解く

あたらしい数理最適化: Python言語とGurobiで解く

応用数理計画ハンドブック (普及版)

応用数理計画ハンドブック (普及版)

メタヒューリスティクスの数理

メタヒューリスティクスの数理

組合せ最適化―メタ戦略を中心として (経営科学のニューフロンティア)

組合せ最適化―メタ戦略を中心として (経営科学のニューフロンティア)

  • 作者: 柳浦睦憲,茨木俊秀,伊理正夫,西田俊夫,森村英典,刀根薫,長谷川利治
  • 出版社/メーカー: 朝倉書店
  • 発売日: 2001/01/01
  • メディア: 単行本
  • 購入: 1人 クリック: 2回
  • この商品を含むブログ (4件) を見る
小島 政和, 笹島 和幸, 天谷 賢治, 福田 光浩. 『計算機支援数理』.
Link: http://www.ocw.titech.ac.jp/index.php?module=General&action=T0300&GakubuCD=226&GakkaCD=226715&KougiCD=75001&Nendo=2011&Gakki=2⟨=JA&vid=05


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感


発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。


ツイートまとめ (Togetter)

「第40回 データマイニング+WEB @東京 ( #TokyoWebmining 40th ) −ソーシャル最適化 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容: