apache-spark tutorials and guides

BigQuery replaced most of my Spark jobs, am I missing something?

Sep 21, 2022

WARN BlockManagerMasterEndpoint: No more replicas available for rdd

Feb 27, 2022

apache-spark pyspark

Manually calling spark's garbage collection from pyspark

Mar 19, 2022

java python apache-spark garbage-collection pyspark

javax.servlet.ServletException: java.util.NoSuchElementException: None.get

Jul 07, 2021

apache-spark amazon-emr

Spark: How to join RDDs by time range

Feb 21, 2022

cassandra apache-spark rdd

Spark executor logs on YARN

Sep 21, 2022

apache-spark cloudera hadoop-yarn cloudera-manager

Spark: Read an inputStream instead of File

Oct 26, 2017

java apache-spark apache-spark-sql spark-dataframe databricks

UnresolvedException: Invalid call to dataType on unresolved object when using DataSet constructed from Seq.empty (since Spark 2.3.0)

Nov 02, 2022

scala apache-spark apache-spark-sql

Co-partitioned joins in spark SQL

Sep 21, 2022

apache-spark apache-spark-sql

Understanding shuffle managers in Spark

Sep 21, 2022

apache-spark rdd partitioning shuffle

Spark - StorageLevel (DISK_ONLY vs MEMORY_AND_DISK) and Out of memory Java heap space

Sep 21, 2022

scala apache-spark caching memory rdd

Loading a pyspark ML model in a non-Spark environment

Feb 21, 2022

python apache-spark machine-learning pyspark

Monitoring Structured Streaming

Nov 10, 2022

scala apache-spark spark-structured-streaming

SparkR filterRDD and flatMap not working

Sep 19, 2022

java r scala amazon-ec2 apache-spark

Can do without spark-submit in java?

Mar 28, 2022

java apache-spark

Connecting to remote master on standalone Spark

May 15, 2019

scala apache-spark

Unable to launch SparkR in RStudio

Jun 14, 2021

r windows apache-spark rstudio sparkr

In Spark, is it possible to share data between two executors?

Sep 21, 2022

java scala apache-spark

Object cache on Spark executors

Sep 21, 2022

scala apache-spark

How to flatten the data of different data types by using Sparklyr package?

Mar 23, 2021

r apache-spark nested flatten sparklyr

New posts in apache-spark