apache-spark tutorials and guides

How can I register classes to Kryo Serializer in Apache Spark?

Jan 08, 2023

Why is my Spark DataFrame much slower than RDD?

Jan 07, 2023

python apache-spark dataframe pyspark apache-spark-sql

Apache Spark: Getting a InstanceAlreadyExistsException when running the Kafka producer

Jan 08, 2023

scala exception apache-spark apache-kafka kafka-producer-api

Spark - Sort DStream by Key and limit to 5 values

Jan 06, 2023

apache-spark pyspark spark-streaming rdd

How to do OUTER JOIN in scala

Jan 07, 2023

scala join apache-spark dataframe

Running Jupyter/IPython document on Zepplin

Jan 07, 2023

python apache-spark jupyter apache-zeppelin

how to get right substring using sql in spark 2.0

Jan 08, 2023

apache-spark

Spark: executor memory exceeds physical limit

Jan 07, 2023

apache-spark spark-dataframe

Apache Spark : TaskResultLost (result lost from block manager) Error On cluster

Jan 08, 2023

java hadoop apache-spark mapreduce

Spark convert single column into array

Jan 05, 2023

scala apache-spark apache-spark-sql

How to use SQLContext and SparkContext inside foreachPartition

Jan 07, 2023

scala apache-spark

spark streaming + kafka - spark session API

Jan 07, 2023

scala apache-spark apache-kafka spark-streaming-kafka

Creating a broadcast variable with SparkSession ? Spark 2.0

Jan 07, 2023

scala apache-spark apache-spark-sql

How to add the "--deploy-mode cluster" option to my scala code

Jan 06, 2023

scala apache-spark spark-streaming apache-spark-standalone

How to create a sparse CSCMatrix using Spark?

Jan 05, 2023

python apache-spark matrix pyspark

Condition on rows content of dataframe in Spark scala

Jan 06, 2023

scala apache-spark dataframe apache-spark-sql

Creating a DataFrame from Row results in 'infer schema issue'

Jan 06, 2023

apache-spark pyspark apache-spark-sql

DataFrame to Json Array in Spark

Jan 06, 2023

java arrays json apache-spark

Cross join runtime error: Use the CROSS JOIN syntax to allow cartesian products between these relations

Jan 06, 2023

scala apache-spark apache-spark-sql

How to submit multiple jars to workers through sparkSession?

Jan 05, 2023

java hadoop apache-spark

New posts in apache-spark