apache-spark tutorials and guides

Spark: equivelant of zipwithindex in dataframe

Dec 01, 2019

Unable to create dataframe from RDD of Row using case class

Aug 02, 2022

scala apache-spark apache-spark-sql

How to load Impala table directly to Spark using JDBC?

Sep 12, 2019

jdbc apache-spark pyspark kerberos impala

Spark: PySpark + Cassandra query performance

Oct 25, 2022

apache-spark cassandra pyspark

Spark 2.0 Dataset Encoder with trait

Sep 09, 2021

scala apache-spark dataset

cast schema of a data frame in Spark and Scala

Jan 06, 2020

scala apache-spark apache-spark-sql spark-dataframe

How To Convert List Object to JavaDStream Spark?

Nov 26, 2020

java apache-spark spark-streaming sparkcore

Spark Exception when converting a MySQL table to parquet

Aug 25, 2022

apache-spark apache-spark-sql parquet

Scala & Spark: Dataframe.write._ on Windows

Apr 08, 2018

windows scala csv apache-spark

PySpark, Decision Trees (Spark 2.0.0)

Oct 18, 2021

apache-spark dataframe pyspark apache-spark-sql decision-tree

Skipping fields in a record using spark-avro

Oct 29, 2022

apache-spark avro spark-avro

Spark step on EMR just hangs as "Running" after done writing to S3

Nov 06, 2022

amazon-web-services apache-spark amazon-s3 pyspark apache-spark-2.0

Spark mapPartitions vs transient lazy val

Feb 21, 2022

dictionary apache-spark partition transient

Spark Dataframes: Skewed Partition after Join

Aug 25, 2022

python apache-spark pyspark apache-spark-sql spark-dataframe

Increasing Parallellism in Spark Executor without increasing Cores

Nov 05, 2022

oracle apache-spark spark-streaming

ERROR ContextCleaner: Error in cleaning thread

Mar 18, 2020

scala apache-spark

Adding Spark "Library" to a Scala project

Mar 26, 2022

java scala apache-spark intellij-idea

Understanding LDA in Spark

Aug 16, 2022

python apache-spark pyspark lda

Dimension mismatch error in Spark ML

Mar 18, 2021

python apache-spark machine-learning pyspark apache-spark-ml

sqlContext HiveDriver error on SQLException: Method not supported

Aug 22, 2022

apache-spark jdbc hive pyspark hortonworks-data-platform

New posts in apache-spark