apache-spark-dataset tutorials

Pyspark transform method that's equivalent to the Scala Dataset#transform method

Aug 23, 2022

Spark 2.0 DataSets groupByKey and divide operation and type safety

Aug 17, 2019

scala apache-spark apache-spark-sql apache-spark-dataset

Spark Dataframes- Reducing By Key

Oct 09, 2021

scala apache-spark apache-spark-sql apache-spark-dataset

scala generic encoder for spark case class

Jun 02, 2022

scala apache-spark generics apache-spark-dataset apache-spark-encoders

Kryo Serialization for Spark 2.x Dataset

Oct 30, 2022

kryo apache-spark-dataset apache-spark-2.0

Read parquet into spark dataset ignoring missing fields [duplicate]

Dec 14, 2019

apache-spark apache-spark-sql parquet apache-spark-dataset apache-spark-2.0

How to do non-random Dataset splitting on Apache Spark?

Jun 06, 2022

apache-spark apache-spark-sql apache-spark-dataset apache-spark-2.0

How to find first non-null values in groups? (secondary sorting using dataset api)

Feb 06, 2022

apache-spark apache-spark-sql apache-spark-dataset

Spark DataSet filter performance

May 26, 2022

apache-spark apache-spark-sql spark-dataframe apache-spark-dataset

How to use both dataset.select and selectExpr in apache spark

Aug 20, 2022

apache-spark apache-spark-dataset

Printschema() in Apache Spark [duplicate]

Apr 22, 2022

apache-spark spark-dataframe apache-spark-dataset

How to split multi-value column into separate rows using typed Dataset?

Jul 03, 2022

scala apache-spark apache-spark-dataset

Find column index by searching column header of a Dataset in Apache Spark Java

Sep 13, 2022

java apache-spark apache-spark-sql apache-spark-dataset

Spark Dataset unique id performance - row_number vs monotonically_increasing_id

Jun 08, 2022

scala apache-spark apache-spark-sql apache-spark-dataset

How to traverse/iterate a Dataset in Spark Java?

Oct 24, 2022

java apache-spark iterator apache-spark-2.0 apache-spark-dataset

Spark Dataset and java.sql.Date

Nov 03, 2022

scala apache-spark apache-spark-dataset apache-spark-encoders

Reading JSON files into Spark Dataset and adding columns from a separate Map

Feb 12, 2022

json scala apache-spark apache-spark-sql apache-spark-dataset

New posts in apache-spark-dataset