ETL sbt project for spark

Build

Note: works with java 7 and 8 (not with jdk 9)

sbt package

Classes

io.elegans.etl.GenerateSentencesFromTransactions

running using sparkSubmit plugin of sbt

sbt "sparkSubmit --class io.elegans.etl.GenerateSentencesFromTransactions -- --help"

create sentences from user iteractions list of sentences with spark
Usage: TokenizeSentences [options]

  --help                  prints this usage text
  --users <value>         the users data file  default: users.csv
  --items <value>         the items data file  default: items.csv
  --transactions <value>  the transactions file  default: transactions.csv
  --output <value>        the destination directory for the output  default: SENTENCES
  --format <value>        the format of the the output  default: format1

running calling spark-submit

./scripts/run.sh io.elegans.etl.GenerateSentencesFromTransactions --help

e.g.

./scripts/run.sh io.elegans.etl.GenerateSentencesFromTransactions --users dataset/users.csv --items dataset/items.csv --output dataset_out --transactions dataset/transactions.csv --format format4"

generation of a fat jar

export JAVA_OPTS="-Xms256m -Xmx4g"
sbt assembly

run the program using the fat jar

spark-submit --class io.elegans.etl.GenerateSentencesFromTransactions ./target/scala-2.11/etl-assembly-0.1.jar  --help

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
project		project
scripts		scripts
src/main/scala/io/elegans/etl		src/main/scala/io/elegans/etl
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
build.sbt		build.sbt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ETL sbt project for spark

Build

Classes

io.elegans.etl.GenerateSentencesFromTransactions

running using sparkSubmit plugin of sbt

running calling spark-submit

generation of a fat jar

run the program using the fat jar

About

Uh oh!

Releases

Packages

Languages

License

elegans-io/recommender-etl

Folders and files

Latest commit

History

Repository files navigation

ETL sbt project for spark

Build

Classes

io.elegans.etl.GenerateSentencesFromTransactions

running using sparkSubmit plugin of sbt

running calling spark-submit

generation of a fat jar

run the program using the fat jar

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages