Flattening a Scala Map in an RDD

Question

I have an an RDD that looks like:

uidProcessedKeywords: org.apache.spark.rdd.RDD[(Long, Map[String,Double])]

How do I flatten the map in the RDD to get this:

org.apache.spark.rdd.RDD[(Long, String, Double)]

Nikita · Accepted Answer

val x = sc.parallelize(List((2, Map("a" -> 0.2, "b" -> 0.3))))
x.flatMap { 
    case (id, m) => m.map { case (k, v) => (id, k, v)}
  }
 .collect()
res1: Array[(Int, String, Double)] = Array((2,a,0.2), (2,b,0.3))

Flattening a Scala Map in an RDD

Tags:

scala

apache-spark

Delip

1 Answers

Nikita

Recent Activity

Donate For Us

Flattening a Scala Map in an RDD

Tags:

scala

apache-spark

Delip

1 Answers

Nikita

Related questions

Recent Activity

Donate For Us