HttpFSのインストール方法。
|
|
CentOSにHttpFSをインストールする方法。(CDH3が入っている前提)
HttpFSは基本的にHadoop2.0(旧Hadoop0.23)(CDH4)を対象としている。
CDH3にもバックポートされているが、現時点の最新版であるCDH3u5には含まれていない(yumでダウンロードできない)。
ソースからビルドする必要がある。
$ git clone git://github.com/cloudera/httpfs.git $ ls httpfs
$ cd httpfs $ mvn package -Pdist -Dmaven.test.skip=true $ ls target/*.tar.gz target/hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT.tar.gz
# cd /usr/lib # tar xf hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT.tar.gz # ls -d had* hadoop hadoop-0.20 hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT # chown -R hdfs:hdfs hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT
proxyuser.hdfs
」
の「hdfs」は、HttpFSを起動するUNIXユーザー。今回はhdfsユーザーにしている。$ vi /etc/hadoop/conf/core-site.xml
<property> <name>hadoop.proxyuser.hdfs.hosts</name> <value>*</value> </property> <property> <name>hadoop.proxyuser.hdfs.groups</name> <value>*</value> </property>
# /etc/init.d/hadoop-0.20-namenode restart
$ vi /usr/lib/hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT/etc/hadoop/httpfs-site.xml
<property> <name>httpfs.hadoop.config.dir</name> <value>/etc/hadoop/conf</value> </property>
# su - hdfs $ cd /usr/lib/hadoop-hdfs-httpfs-0.20.2-cdh3u5-SNAPSHOT $ sbin/httpfs.sh start
http://プロキシーサーバー:14000↓以下のようなメッセージが表示されればひとまず成功。
HttpFs service, service base URL at /webhdfs/v1.
HttpFSにアクセスする為のポート番号は、デフォルトでは14000。[2012-10-02]
変えたい場合は、環境変数HTTPFS_HTTP_PORTで指定する。
# The HTTP port used by HttpFS # export HTTPFS_HTTP_PORT=14000