第41回 データマイニング+WEB @東京( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−を開催しました

会場提供し運営を手伝って下さった FreakOut のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。

参加者ID・バックグラウンド一覧

参加者セキココ:第41回 データマイニング+WEB @東京 セキココ
(作成してくれた [Twitter:@komiya_atsushi] さんに感謝)


以下、全講師資料、関連資料、ツイートまとめです。

AGENDA:

■Opening Talk

O2.「参加者全員 自己紹介 (興味・活動)」(進行:[Twitter:@hamadakoichi]) (75分)

※内容は上記ホワイトボード写真参照

1. 「生命情報のデータマイニング 」(講師: [Twitter:@zgmfx20a] )(発表30分+議論40分)

演者は2000年ごろから生命情報のデータマイニングに着手し、
SVMやRandom Forestsなどの機械学習を用いて課題解決に取り組んできました。
今回はそれらの概略を紹介できればと考えています。

参考文献:
http://web.stanford.edu/~hastie/Papers/ESLII.pdf

2.「状態空間モデルによるモデリング徹底入門」 (講師: [Twitter:@KennyISHIMURA] )(発表25分+議論35分)

時系列で変化する観測値について、観測値だけより、時系列で変化する内部状態を仮定して内部状態から観測値を説明するモデルができたらスッキリする場合が多々ある。
(表に出ない嫁の機嫌はどのように時系列変化して、食事の内容がどのように変わるか等?)
このような数理モデルに状態空間モデルがあるが、制御工学の理論として発展してきたもので文系には難解な部分もある。
この魅力的にも思えるモデリング手法について、まずはその考え方やどのように使えば良いか・その限界等を入門者の立場から発表する。

参考文献:

時系列解析入門

時系列解析入門

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

予測にいかす統計モデリングの基本―ベイズ統計入門から応用まで (KS理工学専門書)

カルマンフィルタの基礎

カルマンフィルタの基礎

状態空間時系列分析入門

状態空間時系列分析入門

はじめての現代制御理論 (KS理工学専門書)

はじめての現代制御理論 (KS理工学専門書)

3.「フリーソフトウェア「KH Coder」を使った計量テキスト分析―手軽なマウス操作による分析からプラグイン作成まで」 (講師: [Twitter:@khcoder] )(発表30分+議論40分)

KH Coderとはテキストマイニング(内容分析)のためのフリーソフトウェアです。
内部では茶筌・MeCabMySQL+Rを利用しており、これらのツールの機能を統合するためにPerlを使っています。
当日はアンケート自由回答の分析事例を通じて、KH Coderの分析機能をご紹介します。
また、非常に手軽なマウス操作でそうした分析が可能なことを、実際にソフトを動かしてのデモからご覧いただきます。
加えて、ごくわずかなPerlとRのコードを書くことで、新たな分析機能を追加したり、分析を自動化したりできる、プラグイン機構についてお話しいたします。

参考文献:
樋口耕一, 2001-2014, 「KH Coder」 .

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

社会調査のための計量テキスト分析―内容分析の継承と発展を目指して

Rのパッケージおよびツールの作成と応用 (シリーズ Useful R 10)

Rのパッケージおよびツールの作成と応用 (シリーズ Useful R 10)

コーパスとテキストマイニング

コーパスとテキストマイニング


■講師立候補・振返り:

「講師立候補・タイトル決め」進行:[Twitter:@hamadakoichi] (30分)

「振返り・アクション決定」進行:[Twitter:@hamadakoichi](40分)

  • KEEP/TRY 内容確認
  • Keep/Try投票
  • 各位所感

発表立候補、Keep・Try項目に関しては、下記ツイートまとめ後半にも文字起こしTweetあるので、あわせてをご覧下さい。


ツイートまとめ (Togetter)

「第41回 データマイニング+WEB @東京 ( #TokyoWebmining 41st ) −モデリング・テキスト分析 祭り−」に関するツイートを Togetter にまとめました。みなさん、たくさんのツイートありがとうございました。("誰でも編集可能"に設定してあります)

Togetter:

講師募集

データマイニング+WEB勉強会@東京 (#TokyoWebmining) を今後も、講師、参加者、双方にとってよりよい会としていきたいと思います。講師を募集していますので私の TwitterGoogle Group へのメールへぜひご連絡下さい。

連絡先:

過去開催内容: