S-JIS[2017-01-14/2017-01-22] 変更履歴
Apache Sparkの開発環境の構築方法のメモ。
|
|
Eclipseを使ってSparkアプリケーションを開発する場合、Scala
IDEを使用する。
Eclipseプロジェクト自体はGradleで作るのが楽そう。
Gradleを使ってEclipseプロジェクトを作成する例。
D:\workspace\spark-example)apply plugin: 'scala'
apply plugin: 'eclipse'
group = 'com.example.spark'
version = '0.1-SNAPSHOT'
repositories{
mavenCentral()
}
dependencies {
compile "org.scala-lang:scala-library:2.11.8"
compile "org.apache.spark:spark-core_2.11:2.1.0"
compile "org.apache.spark:spark-sql_2.11:2.1.0"
}
task wrapper(type: Wrapper) {
gradleVersion '3.1'
jarFile file('.buildtools/gradlew.jar')
}
> cd /d D:\workspace\spark-example > gradle wrapper
> mkdir src\main\scala > gradlew cleanEclipse eclipse
Sparkアプリケーションを実行するには、spark-submitコマンドにアプリケーションのjarファイルを指定する。[2017-01-22]
GradleでSparkのプロジェクトを作っていれば、Gradleのコマンドでjarファイルを作成することが出来る。(初回は色々ダウンロードするので遅い)
> cd /d D:\workspace\spark-example > gradlew jar > dir build\libs 〜 2017/01/22 09:34 108,347 spark-example-0.1-SNAPSHOT.jar
→jarファイルのファイル名を設定する方法
→マニフェストを設定する方法(Main-Classで実行するクラス名を指定すれば、spark-submitに--classを付けなくてもよくなる)