分散処理

Amazon EC2上のHadoopでMeCabを使えるようにしてみた…い

最近すっかり"Webサービスを作ってみた"系の記事ばっかりでしたが、今回は久々にEC2上でのHadoopのお話。以前の記事でEC2上でHadoopを動かした時は、MeCabがデフォルトで入っていなかったので、事前に自宅サーバ上で分かち書きしたデータを使っていました。…

Amazon Elastic MapReduceでHadoop Streamingする時にライブラリをrequireする方法

ちょっと元データの件数が大量にある処理をしたいという要件があって、普通に逐次処理していくと恐ろしく時間が掛かるので、「こんな時こそHadoop!」って事で、久々にHadoopをいじくっていました。ただ、自宅サーバでやろうとすると、いくら分散処理できると…

Hadoop Hack Nightに行ってきました

米国Yahoo!のHadoopチームアーキテクトのOwen O'Malleyさん来日に合わせて、技術評論社・Yahoo! JAPAN主催で行われたHadoop Hack Nightというイベントに行ってきました。定員100名と結構大規模なイベントでしたが、申し込み開始からたった1日で申し込み多数…

自律型クラウド管理ソフト Wakame がスゴそう

以前参加した、Tokyo Cloud Developers Meetupで株式会社あくしゅの方がWakameというソフトについてプレゼンされていて、二次会でもお話を伺って、素直に「スゲー!」と思っておりました。そのWakameがついにリリースされたようですね。→http://www.ventureno…

Tokyo Cloud Developers Meetupに行ってきました

最近、分散処理とかクラウド辺りにアンテナを張っていたところ、偶然、Tokyo Cloud Developers Meetupというのが開催される事を知りまして、運良く参加枠に滑り込めたので行って参りました。*1途中、メモとかは取ってなかったので、全体の印象ぐらいでさらり…

Amazon Elastic MapReduceでPHPも使えるか試してみた

AmazonがEC2上でHadoopによるMapReduceを実行できるサービスを出してきたようですね。→Amazon EMR - Amazon Web Services →http://kzk9.net/blog/2009/04/reviewing_amazon_elastic_map_reduce.html前回の記事では、EC2上でHadoop用のインスタンスを自分で動…

Amazon EC2上でHadoop Streamingによる分散処理をPHPでやってみた

あいかわらずHadoopStreamingが楽しくてやっているんですが、そろそろ自宅サーバ1台だけで処理するのは限界っぽいので、AmazonEC2上でHadoopStreamingにチャレンジしてみました。AmazonEC2の導入に関しては、以下のまとめ記事からのリンクを参照しまくりさせ…

Hadoop StreamingのReducerへの入力の構造化をPHPでやってみた

(今回の記事は、id:naoyaさんの記事をパクってにインスパイアされて、PHPでやってみたものです。話の内容としては概ね同じです。)前回の記事の最後で、「HadoopStreamingはReducerへの入力が構造化されていないという問題点があります。」という事を書きまし…

Hadoop Streamingで分散処理をPHPでやってみた

「何番煎じか分からないけど集合知プログラミングをPHPでやってみたシリーズ」で扱っている集合知プログラミングは、とかく計算量が多くなりがちで、うまくアルゴリズムを作らないとメモリ不足に陥りがちです。現に前回の記事では、その越えられない壁を体験…