apache-spark-sql tutorials

PySpark withColumn & withField TypeError: 'Column' object is not callable

Dec 08, 2025

apache-spark pyspark apache-spark-sql

How to apply map function in Spark DataFrame using Java?

Dec 08, 2025

java apache-spark apache-spark-sql

PySpark 2.1: Importing module with UDF's breaks Hive connectivity

Dec 07, 2025

python apache-spark pyspark apache-spark-sql user-defined-functions

How to flatten an array in a nested json in aws glue using pyspark?

Dec 08, 2025

arrays json pyspark apache-spark-sql aws-glue

Flatten Group By in Pyspark

Dec 08, 2025

group-by pyspark apache-spark-sql

Why does collecting dataset fail with org.apache.spark.shuffle.FetchFailedException?

Dec 08, 2025

scala apache-spark apache-spark-sql cassandra spark-cassandra-connector

Using windowing functions in Spark

Dec 08, 2025

apache-spark apache-spark-sql window-functions

How to load history data when starting Spark Streaming process, and calculate running aggregations

Dec 06, 2025

apache-spark apache-kafka spark-streaming apache-spark-sql apache-spark-1.4

Calculate time difference between consecutive rows in pairs per group in pyspark

Dec 05, 2025

apache-spark pyspark apache-spark-sql

Spark Scala Dataframe describe non numeric columns

Dec 05, 2025

scala apache-spark apache-spark-sql apache-spark-mllib data-analysis

Loop through RDD elements, read its content for further processing

Dec 06, 2025

apache-spark pyspark apache-spark-sql rdd

use of frequency argument in percentile function in spark sql

Dec 06, 2025

sql statistics apache-spark-sql percentile

When to use rdd in Spark2.0?

Dec 06, 2025

apache-spark apache-spark-sql apache-spark-2.0

loading data file with 3 spaces as delimiter using Sparks csv reader in java

Dec 06, 2025

java csv apache-spark apache-spark-sql

change Unix(Epoch) time to local time in pyspark

Dec 05, 2025

apache-spark timezone pyspark apache-spark-sql epoch

Counting consecutive occurrences of a specific value in PySpark

Dec 05, 2025

python apache-spark pyspark apache-spark-sql databricks

Remove trailing white space from elements in a list

Dec 05, 2025

python-3.x apache-spark pyspark apache-spark-sql

New posts in apache-spark-sql