S-JIS[2017-01-14/2017-01-22] 変更履歴
Apache Sparkの開発環境の構築方法のメモ。
|
|
Eclipseを使ってSparkアプリケーションを開発する場合、Scala
IDEを使用する。
Eclipseプロジェクト自体はGradleで作るのが楽そう。
Gradleを使ってEclipseプロジェクトを作成する例。
D:\workspace\spark-example
)apply plugin: 'scala' apply plugin: 'eclipse' group = 'com.example.spark' version = '0.1-SNAPSHOT' repositories{ mavenCentral() } dependencies { compile "org.scala-lang:scala-library:2.11.8" compile "org.apache.spark:spark-core_2.11:2.1.0" compile "org.apache.spark:spark-sql_2.11:2.1.0" } task wrapper(type: Wrapper) { gradleVersion '3.1' jarFile file('.buildtools/gradlew.jar') }
> cd /d D:\workspace\spark-example > gradle wrapper
> mkdir src\main\scala > gradlew cleanEclipse eclipse
Sparkアプリケーションを実行するには、spark-submitコマンドにアプリケーションのjarファイルを指定する。[2017-01-22]
GradleでSparkのプロジェクトを作っていれば、Gradleのコマンドでjarファイルを作成することが出来る。(初回は色々ダウンロードするので遅い)
> cd /d D:\workspace\spark-example > gradlew jar > dir build\libs 〜 2017/01/22 09:34 108,347 spark-example-0.1-SNAPSHOT.jar
→jarファイルのファイル名を設定する方法
→マニフェストを設定する方法(Main-Classで実行するクラス名を指定すれば、spark-submitに--classを付けなくてもよくなる)