第14回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 14th)−大規模分散データマイニング 祭り− を開催しました

2011/10/16 "第14回 データマイニング+WEB 勉強会@東京"を開催しました。 第14回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 14th)−大規模分散データマイニング 祭り−: Eventbrite Google グループ 会場提供し運営を手伝って下さった ニフティ株…

第13回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り− を開催しました

2011/06/26 "第13回 データマイニング+WEB 勉強会@東京−Mahout・大規模解析・ビジネス展開 祭り−"を開催しました。 第13回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 13th)−Mahout・大規模解析・ビジネス展開 祭り−: Eventbrite Google グルー…

第12回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り− を開催しました

2011/06/19 "第12回 データマイニング+WEB 勉強会@東京−機械学習MapReduce・大規模R解析 祭り−"を開催しました。 第12回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 12th)−機械学習MapReduce・大規模R解析 祭り−: Eventbrite Google グループ 会…

第11回 データマイニング+WEB 勉強会@東京( #TokyoWebmining 11th) −Mahout・Graphical Model・学術 祭り−を開催しました

2011/06/12 "第11回 データマイニング+WEB 勉強会@東京−Mahout・Graphical Model・学術 祭り−"を開催しました。 第11回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 11th)−Mahout・Graphical Model・学術 祭り−: Eventbrite Google グループ 会場…

Perl で MapReduce - Mahout Frequent Pattern Mining Data -

最近、Perl も書き始めてみたので、Hadoop 上で分散実行できる Perl での MapReduce 実装を紹介する。大規模データマイニング・機械学習のライブラリ Apache Mahout の Parallel Frequent Pattern Mining の入力データを生成する Perl MapReduce 実装の紹介…

Mahout RandomForest Driver 実装法 -大規模分散 機械学習・判別 -

Apache Mahout は、Hadoop上で動作する大規模分散データマイニング・機械学習のライブラリ。 Random Forest は大規模データで高精度の分類・判別を実現するアルゴリズム。 Random Forestを、"R言語での実行のように容易"に "大規模分散 学習・判別"できるよ…

Mahout JP を立ち上げました #MahoutJP

Hadoop上で動作する 大規模データマイニング・機械学習ライブラリ Apache Mahout に関し、技術情報まとめ・発信よる活用の裾野を広げることを目的としMahout JPを立ち上げました。私も含め TokyoWebminingでMahoutに関する各種講師をしていたメンバーや、Tok…

R言語による多変量時系列分析−Dynamic Conditional Correlation GARCH Model

R

R言語による多変量時系列分析。 複数グループ・複数項目の時系列データで時系列間の関係性・影響を明らかにする。 以下、実行可能なR言語ソースコードを用い紹介する。 例:複数時系列間の関係性・影響 農家ごとの農地の肥沃度・人の各仕事の労働量・各肥料…

R言語による多変量時系列分析−Panel Linear Model

R

R言語による多変量時系列分析。 複数グループ・複数項目の時系列データで時系列間の関係性・影響を明らかにする。 以下、実行可能なR言語ソースコードも用い紹介する。 例:複数時系列間の関係性・影響 農家ごとの農地の肥沃度・人の各仕事の労働量・各肥料…

第2回 さくさくテキストマイニング勉強会に参加してきた #sakuTextMining

4/16(土)「第2回 さくさくテキストマイニング勉強会」に参加してきました。ATND: 第2回「にこにこ」改め さくさくテキストマイニング勉強会 : ATND 運営、講師のみなさんお疲れさまでした。先週の第10回TokyoWebmining−2nd Week−大規模分散 機械学習 祭り−…

第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −2nd Week−大規模分散 機械学習 祭り−

2011/04/10 "第10回 データマイニング+WEB 勉強会@東京−2nd Week−大規模分散 機械学習 祭り−"を開催しました。 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)−2nd Week−大規模分散 機械学習 祭り−: Eventbrite Google グループ 会場提…

第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)を開催しました −1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り−

2011/02/27 "第10回 データマイニング+WEB 勉強会@東京−1st Week−広告ネットワーク・グラフ解析・並列機械学習 祭り−"を開催しました。 第10回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining 10th)−1st Week−広告ネットワーク・グラフ解析・並列機…

「モバゲーの大規模データマイニング基盤におけるHadoop活用」−Hadoop Conference Japan 2011 #hcj2011 で登壇してきました

2011/02/22 Hadoop Conference Japan 2011に登壇してきました。35分の Main Talk。 『モバゲーの大規模データマイニング基盤におけるHadoop活用』に関して話しています。『モバゲーの大規模データマイニング基盤におけるHadoop活用』−Hadoop Conference Japa…

第1回 にこにこテキストマイニング勉強会 ( #nicoTextMining #1) に参加してきた

「第1回 にこにこテキストマイニング勉強会 (#nicoTextMining)」([Twitter:@toilet_lunch] さん, [Twitter:@AntiBayesian] さん 主催) に参加してきた。実際にどう活用するかを目的した会。最近、毎週トークをしていましたが、今週は聴講者。ATND: 第1回 に…

Mahout: Canopy and K-means Clustering

MahoutのCanopyとK-Meansを用い、Canopy生成しCanopy Centroidを用いたK-Means Clustering実行できる Driverの実装法を解説します。次のようなコマンドライン呼び出しで、質の良い Canopy+K-Meansの一連のClusteringの手続きを実行できます。以下では、org.a…

「R言語による Random Forest 徹底入門−集団学習による分類・予測−」− #TokyoR #11 で講師をしてきました

2011/01/29 第11回R勉強会@東京(Tokyo.R #11) で講師をしてきました。 「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」。 Random Forest は"機械学習"の方法論で、集団学習により精度高い判別・予測を実現します。 双方向の進行で、質…

第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −2nd Week−方法論・ソーシャル祭り− を開催しました

2011/01/23 "第9回 データマイニング+WEB 勉強会@東京−2nd Week−方法論・ソーシャル祭り−"を開催しました。 第9回 データマイニング+WEB 勉強会@東京 ( TokyoWebmining 9)−2ndW−方法論・ソーシャル祭り−: ATND Google グループ ※会場参加者ID写真(id:bo…

第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました

2011/01/16 "第9回 データマイニング+WEB 勉強会@東京−1st Week− 大規模解析・機械学習・クオンツ 祭り−"を開催しました。 第9回 データマイニング+WEB 勉強会@東京 ( TokyoWebmining 9)−1st Week− 大規模解析・機械学習・クオンツ 祭り−: ATND Google …

Mahout: Data Converter for Clustering

Mahout Clustering 実行の入力形式へ変換する DataConverter を実装してみた。以下に Source Code、Command line 実行方法も含め紹介します。Mahout は Hadoop上で動作する大規模 Data Mining/Machine Learning の Library。Mahout Clustering Packageには、…

R言語で MapReduce −Hadoop Streaming−

統計解析・データマイニングに特化した言語である R言語。 Hadoop Streaming を使った R言語でのMapReduce実装を以下に紹介。 Hadoop Streaming で標準入出力を用いデータの受け渡しを行い、files オプションで R の mapper, reducer を配布し実行。 例えば…

第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) −大規模解析・ウェブ・クオンツ 祭り−を開催しました

2010/11/14 "第8回 データマイニング+WEB 勉強会@東京"を開催しました。 第8回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#8) −大規模解析・ウェブ・クオンツ 祭り−: ATND Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 の…

第8回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #8) を開催します

2010/11/14(日) "第8回 データマイニング+WEB 勉強会@東京"を開催します。現時点でタイトルを挙げて頂いているトークを以下に記載します(※タイトル等に修正があり次第、随時更新します)。最終タイトル・発表/議論時間の調整後、最終的なAGENDA確定し次第…

樹木モデルとランダムフォレスト−機械学習による分類・予測−

「樹木モデルとランダムフォレスト−機械学習による分類・予測−」 の講師資料です。 Tree-based Models, Random Forests の入門的な内容です。「樹木モデルとランダムフォレスト−機械学習による分類・予測−」−データマイニングセミナーView more presentation…

第7回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #7) −機械学習・解析・セマンティックウェブ祭り−を開催しました

2010/09/26 "第7回 データマイニング+WEB 勉強会@東京"を開催しました。 第7回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#7) −機械学習・解析・セマンティックウェブ祭り−: ATND Google グループ会場提供し運営を手伝って下さった ニフティ株…

第8回R勉強会@東京 ( #TokyoR #08 ) に参加してきた

8/28(土)、第8回R勉強会@東京 (#TokyoR 08)に参加してきた。ATND: 第8回R勉強会@東京(Tokyo.R#08) : ATND Google Group: Google グループ主催者の[Twitter:@yokkuns]さん、講師の[Twitter:@bob3bob3]さん、[Twitter:@holidayworking]さん、[Twitter:@Ni…

第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−を開催しました

2010/08/22 "第6回 データマイニング+WEB 勉強会@東京"を開催しました。 第6回 データマイニング+WEB 勉強会@東京 (Tokyo.Webmining#6) −ソーシャル・広告・最適化祭り−: ATND Google グループ 会場提供し運営を手伝って下さった ニフティ株式会社 のみ…

第7回R勉強会@東京 に参加してきた

第7回R勉強会@東京 (#TokyoR 07)に参加してきた。ATND: 第7回R勉強会@東京(Tokyo.R#07) : ATND Google Group: Google グループ 主催者の[Twitter:@yokkuns]さん、講師の[Twitter:@bob3bob3]さん、[Twitter:@yanashi]さん、[Twitter:@tyatsuta]さん、[Tw…

Mahout Programming : K-Means Clustering

Mahout でのデータマイニング。mahout.clustering.kmeans を使ったクラスター分析を実装してみた。Mahoutは、Hadoop上で動くデータマイニング・機械学習の各種アルゴリズムが実装されているライブラリ。 クラスター分析 クラスター分析の方法論自体の内容は…

第1回 自然言語処理勉強会@東京 に参加してきた

「第1回 自然言語処理勉強会@東京 (#tokyotextmining)」(id:nokuno さん主催) に参加してきた。 ATND: 第1回 自然言語処理勉強会@東京 : ATND Google Group: Google グループ 素敵な会でした。主催者のid:nokuno さん、講師の id:sleepy_yoshi さん、id:…

第3回 パターン認識と機械学習(PRML) 復習レーン に参加してきた

第3回 パターン認識と機械学習(PRML) 復習レーン に参加してきました。ATND: PRML復習レーン(第3回) : ATND Google Group: Google グループTwitter Time Lineまとめ(Togetter)と、各講師の方々の資料、メモを、覚書きとして以下に記載します。 ※各講師資…