apache-spark tutorials and guides

Spark Streaming: Application health

Nov 01, 2022

Take part of rdd and keep it rdd

Nov 02, 2022

apache-spark pyspark

How to connect spark-shell to Mesos?

Nov 02, 2022

apache-spark apache-spark-sql mesos mesosphere

PHOENIX SPARK - Load Table as DataFrame

Oct 31, 2022

apache-spark dataframe phoenix

Iterating/looping over Spark parquet files in a script results in memory error/build-up (using Spark SQL queries)

Nov 01, 2022

loops apache-spark pyspark apache-spark-sql pyspark-sql

python send csv data to spark streaming

Nov 02, 2022

python sockets apache-spark streaming

Scala Spark - creating nested json output from simple dataframe

Oct 30, 2022

json apache-spark apache-spark-sql spark-dataframe

Dynamic Set Algebra on Spark

Nov 01, 2022

scala apache-spark set pyspark boolean-expression

Multiprocessing a list of RDDs

Nov 01, 2022

python apache-spark pyspark list-comprehension

How to query on data frame where 1 field of StringType has json value in Spark SQL

Nov 01, 2022

json scala apache-spark apache-spark-sql

SPARK Exception thrown in awaitResult

Nov 01, 2022

sql join apache-spark

Elasticsearch-Hadoop library cannot connect to to docker container

Nov 01, 2022

scala elasticsearch apache-spark docker elasticsearch-hadoop

Apache spark rest API

Nov 01, 2022

curl apache-spark spark-jobserver

How to connect to remote Spark cluster from python in docker

Nov 01, 2022

python apache-spark ssh docker paramiko

Spark ML Pipeline Causes java.lang.Exception: failed to compile ... Code ... grows beyond 64 KB

Nov 01, 2022

python apache-spark pyspark apache-spark-sql pyspark-sql

how to do a nested for-each loop with PySpark

Nov 01, 2022

python apache-spark pyspark

Transforming one column into multiple ones in a Spark Dataframe

Nov 01, 2022

scala apache-spark dataframe hadoop apache-spark-sql

Concurrent transformations on RDD in foreachDD function of Spark DStream

Nov 01, 2022

java apache-spark spark-streaming rdd dstream

How to write avro to multiple output directory using spark

Nov 01, 2022

apache-spark avro spark-avro

How do `map` and `reduce` methods work in Spark RDDs?

Nov 17, 2022

scala apache-spark closures

New posts in apache-spark