apache-spark-sql tutorials

How to pass decimal as a value when creating a PySpark dataframe?

Mar 30, 2026

Spark JSON reading fields that are completional in JSON into case classes

Mar 29, 2026

json scala apache-spark apache-spark-sql

spark write: CSV data source does not support null data type

Mar 30, 2026

scala apache-spark apache-spark-sql

how to use lag/lead function in spark streaming application?

Mar 30, 2026

apache-spark cassandra apache-spark-sql

How to convert PythonRDD (of lines in JSONs) to DataFrame?

Mar 30, 2026

apache-spark pyspark apache-spark-sql

How to convert number into percentage

Mar 30, 2026

pyspark apache-spark-sql

Calculate the geographical distance in pyspark dataframe

Mar 29, 2026

apache-spark pyspark apache-spark-sql user-defined-functions geopy

Update columns when iterate over DataFrame

Mar 29, 2026

scala apache-spark apache-spark-sql

Can't connect with Mongo-Spark Connector using Mongo in Authentication mode

Mar 28, 2026

mongodb authentication apache-spark apache-spark-sql spark-submit

Comparing schema of dataframe using Pyspark

Mar 29, 2026

python apache-spark pyspark apache-spark-sql

How is a Spark Dataframe partitioned by default?

Mar 27, 2026

apache-spark apache-spark-sql rdd

How to convert messages from socket streaming source to custom domain object?

Mar 26, 2026

apache-spark apache-spark-sql spark-structured-streaming

Spark Sql is throwing PermGen Space Error

Mar 26, 2026

apache-spark jvm apache-spark-sql permgen

Fastest way to check if DataFrame(Scala) is empty?

Mar 26, 2026

scala apache-spark apache-spark-sql

spark SQL like join performance [duplicate]

Mar 25, 2026

python apache-spark apache-spark-sql pyspark

Json schema showing directory names along with file schema

Mar 26, 2026

scala apache-spark hive apache-spark-sql

Why Spark creates multiple csv files while saving a dataframe in csv format?

Mar 25, 2026

scala csv apache-spark apache-spark-sql

Monthly Aggregation in pyspark

Mar 24, 2026

python apache-spark pyspark apache-spark-sql

Dynamic evaluation of Boolean expressions in a Spark DataFrame

Mar 25, 2026

scala apache-spark apache-spark-sql

New posts in apache-spark-sql