2010-04-04から1日間の記事一覧

Amazon Elastic MapReduceでHadoop Streamingする時にライブラリをrequireする方法

ちょっと元データの件数が大量にある処理をしたいという要件があって、普通に逐次処理していくと恐ろしく時間が掛かるので、「こんな時こそHadoop!」って事で、久々にHadoopをいじくっていました。ただ、自宅サーバでやろうとすると、いくら分散処理できると…