Apache Hadoopは、分散コンピューティングの為のオープンソースのソフトウェア(フレームワーク)。
Hadoopというのは、製作者の子供のぬいぐるみの象の名前なんだそうだ。
公式ページの上の方に描かれている黄色い象がそれか?^^; (ぬいぐるみの写真→@ITの記事や工藤さんのブログの下の方)
|
|
情報 | 内容 | 辿り着く方法 |
---|---|---|
Hadoopのトップページ | Hadoopの日本語トップページ | |
ダウンロードページ | ダウンロード | トップページの上部のタブっぽいリンクから「Common」を選択し、 スタートガイドの「ダウンロードする」をクリックする。 |
概要 | 簡単なリンク集 | トップページの上部のタブっぽいリンクから「Common」を選択し、 スタートガイドの「知る」をクリックする。 |
クイックスタート | サポートされるOSや 必要なソフト(バージョン) 環境設定方法など |
概要ページの左側のメニューの「スタートガイド」→「クイックスタート」を選択する。 あるいは概要ページの本文の「Hadoop クイックスタート」をクリックする。 |
Map/Reduce チュートリアル | Map/Reduceのサンプルソース | 概要ページの左側のメニューの「スタートガイド」→「Map/Reduce
チュートリアル」を選択する。 あるいは概要ページの本文の「Hadoop Map/Reduce チュートリアル」をクリックする。 |
コマンドガイド | hadoopのコマンドマニュアル | 概要ページの左側のメニューの「プログラミングガイド」→「コマンド」を選択する。 |
APIドキュメント | Javadoc | 概要ページの左側のメニューの「その他」→「APIドキュメント」を選択する。 なんで“その他”なんだ?!(苦笑) |
Hadoop0.20はUNIXを想定しているようなので、Windowsで試す為にはCygwinが必要。
sshが必要なので、CygwinのOpenSSHもダウンロードして設定しておく。
(単独環境で動作させるだけならsshは不要)
参考: クイックスタート
HadoopはJavaで動くので、JDK1.6もインストールしておく。
Hadoop1.1ではHortonworksがWindows用に起動コマンドを用意したHDPというディストリビューションがあるので、それを使う。[2013-05-26]
Windows上の単独環境(スタンドアローン・非分散環境)で試す方法。
単独環境は通常のマシンのファイルシステムをそのまま使うので、HDFS(Hadoop Distributed File System:Hadoop分散ファイルシステム)は使わない。
設定ファイル(HADOOP_HOME/confの下のxmlファイル)はデフォルトで単独環境用なので、特にいじる必要は無いらしい。