apache-spark-dataset tutorials

Spark using recursive case class

Oct 18, 2022

using DataSet.repartition in Spark 2 - several tasks handle more than one partition

Nov 01, 2022

apache-spark spark-streaming apache-spark-dataset

Spark Java - Collect multiple columns into array column

Aug 27, 2022

java apache-spark apache-spark-dataset

Spark Datasets - strong typing

Oct 24, 2022

apache-spark dataset apache-spark-dataset

Using stat.bloomFilter in Spark 2.0.0 to filter another dataframe

Dec 06, 2021

scala apache-spark apache-spark-sql apache-spark-dataset bloom-filter

spark convert dataframe to dataset using case class with option fields

Jul 07, 2022

scala apache-spark apache-spark-sql apache-spark-dataset

How to create a Dataset of Maps?

Nov 19, 2022

scala apache-spark apache-spark-sql apache-spark-dataset apache-spark-encoders

Spark Dataset equivalent for scala's "collect" taking a partial function

Feb 22, 2022

scala apache-spark apache-spark-dataset

How to convert Dataset into JavaPairRDD?

Jun 13, 2022

java apache-spark apache-spark-dataset java-pair-rdd

How to create a Dataset from custom class Person?

Jan 23, 2017

apache-spark apache-spark-sql apache-spark-dataset

Array Intersection in Spark SQL

Mar 22, 2022

apache-spark apache-spark-sql spark-dataframe hiveql apache-spark-dataset

How to join two spark dataset to one with java objects?

Sep 05, 2022

java apache-spark apache-spark-dataset apache-spark-encoders

How to transform Dataset<Tuple2<String,DeviceData>> to Iterator<DeviceData>

Feb 16, 2021

java apache-spark apache-spark-2.0 apache-spark-dataset

Apache Spark 2.2: broadcast join not working when you already cache the dataframe which you want to broadcast

Aug 26, 2022

apache-spark apache-spark-sql apache-spark-dataset apache-spark-2.0

Add UUID to spark dataset [duplicate]

Feb 03, 2021

apache-spark apache-spark-dataset spark-csv

how to use spark lag and lead over group by and order by

Nov 15, 2022

apache-spark apache-spark-sql apache-spark-dataset

Spark SQL's Scala API - TimestampType - No Encoder found for org.apache.spark.sql.types.TimestampType

Mar 07, 2022

scala apache-spark timestamp apache-spark-sql apache-spark-dataset

How to create a custom Encoder in Spark 2.X Datasets?

Oct 22, 2022

scala apache-spark apache-spark-dataset apache-spark-encoders

How to change case of whole column to lowercase?

Oct 03, 2022

java apache-spark apache-spark-sql apache-spark-dataset

New posts in apache-spark-dataset