第52回 データマイニング+WEB @東京( #TokyoWebmining 52nd )ー機械学習活用 祭りーを開催しました

2016/3/26 "第52回 データマイニング+WEB @東京( #TokyoWebmining 52nd ) ー機械学習活用 祭りー" を開催しました。

会場提供して下さったFreakOutさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者セキココ:第52回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi])

※内容は上記ホワイトボード写真参照

1.「アドテクのラストリゾート〜テレビ視聴をビッグデータにできるか?」(講師: [Twitter:@shkali], [Twitter:@yoshikick_0518]) (発表:30分+議論:30分)

TVISION INSIGHTSというベンチャーです。テレビについて、けっこう誰も持っていないようなデータを持ってます。どう活用できるか、ぜひみなさんと議論していきたいです。
一言でいうと、3Dモーション・センシング・画像認識技術でのアルゴリズムを開発して、テレビにセンサーをセットして、その前に座る一人ひとりの視聴状況をデータとして取得できる技術を開発しました。そして、いま、この瞬間でも、けっこうな量のデータを取ってます。お話できることを楽しみにしております。

参考文献:

トピック・議論
  • TVの前にいるか、TVのほうを向いているか、TVをみているときの表情、の各種計測・分析。
  • 実際にどのくらい見られているかの計測
  • 関東でのTV計測の世帯数は TV視聴率計測(Video Research)を越えた
    • TV視聴率 : 600世帯
    • Vision Insights : 660世帯
  • 表情・態勢の認識、距離が重要。
  • チャンネル識別は音声認識から。

2. 「行動ベースレコメンデーションの最前線」(講師: [Twitter:@hamukazu]) (発表:35分+議論:35分)

トピック・議論
  • 世界中の人が読めるよう英語資料
  • Rating Prediction
  • Item Prediction
  • 教科書的なアルゴリズム
  • Matrix Factorization
    • 評価を潜在変数の線形結合で表現
    • Shopping(購入有無)ではそのままではうまく使えない
  • 対処
    • 制約をいれる
      • 0の要素も予測する方法
      • Elastic Net
    • 目的関数を変える
      • Ranking Prediction
      • 数値ではなくどちらが大きいかを学ぶ
      • Bayesian Probabilistic Ranking(BPR)
      • 順序集合を与えて、一致するようにする。
      • 探索空間を広くする (u, i, j ) ... U x I x I の空間
      • 探索空間広くなったので、Stocastic Gradient Descent で確率的に解く
      • Sampling する要素数は、要素と同じくらい
  • Open Source 実装
    • MyMediaLite
  • Practical Aspect of Recommendation Problem
  • 実適用でのHyper Paramter
    • 業界ごとに特徴ある
  • 行動ベースのオンライン学習
    • 論文あまりない

3. 「意味表現の素性への構造主義的アプローチ入門」(講師: [Twitter:@su_9qu]) (発表:35分+議論:35分)

日常の事象やテキストを、分析の対象にするとき、事象をどう表現すればいいんだろう?と立ち止まったことはありませんか?このことは、事象の意味とは何か?そして、意味とは何か?というところまで関係しているように思います。その不明瞭さを解く糸口の1つとして、構造主義の考えをご紹介します。素性の作り方には入りませんが、考え方のヒントになればと思います。
目次
(1)序論
(2)ソシュールの説
(3)批判者の説
(4)構造主義に関わるその他の研究
(5)まとめ

トピック・議論
  • 意味の保持の方法、意味の保持のプラットフォーム
  • 意味とはなにか
    • 要約が文の意味をいったことになるか
    • 人は文の意味をわかっている
  • ソシュールの説:意味を切り込む道具
    • ラング
      • 聞き取られ実践された決まり事
    • パロール
      • 思考を表現するために選択に任された組合せ
    • 対象は主体(話者)の外にある。名称は主体の中にある。
    • 「意味」にあたるものは「差異」からしか生まれない
    • ラングの中には差異しかない。記号の差異だけしかない。
    • 知覚されるものも差異のみ
  • 共時:タイムスライス、通時:時間軸
  • 構造論を推進するモチベーション、思想家と、機械にいみを持たせる技術者では異なる。

■ツイートまとめ (Togetter)

「第52回 データマイニング+WEB @東京( #TokyoWebmining 52nd ) ー機械学習活用 祭りー」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

■講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

■過去開催内容: