Sqoopのインストール。
|
|
SqoopはHadoopのMapReduceプログラムとして動作するので、Hadoopクライアントのマシンにインストールする必要がある。
RDBにはJDBCでアクセスするので、そのRDBMS用のJDBCドライバーが別途必要。
CentOSへは、CDH3(Cloudera)のSqoopをインストールするのが簡単。
# yum -y install sqoop
インストールが終わったら、バージョンを確認してみる。
$ sqoop version Sqoop 1.3.0-cdh3u3
/usr/bin/sqoopはシェルスクリプトであり、その中で「HADOOP_HOME=/usr/lib/hadoop」と決め打ちしている。
CDH3のHadoopでは/usr/lib/hadoop/confはalternativesを使った実体へのシンボリックリンクになっているので、現在の設定が参照される。
ただ、--hadoop-homeでHadoopのディレクトリーを個別に指定することも出来る。
SqoopでDBアクセスを実行する為には、別途JDBCドライバーが必要になる。
「/usr/lib/sqoop/lib」の下にJDBCのjarファイルを配置する。
ソースはyumではインストールできないが、Clouderaのサイトからダウンロードできる。[2012-06-19]
(CDH3のアーカイブのダウンロード方法と同じ)