如何使用SparkDataFrames查詢JSON數據列?我有一個Cassandra表,為了簡單起見,它看起來如下所示:key: text
jsonData: text
blobData: blob我可以創建一個基本的數據框架,用火花和火花卡桑德拉連接器使用:val df = sqlContext.read .format("org.apache.spark.sql.cassandra")
.options(Map("table" -> "mytable", "keyspace" -> "ks1"))
.load()不過,我很難將JSON數據擴展到它的底層結構中。我最終希望能夠根據json字符串中的屬性進行篩選,并返回BLOB數據。類似于jsonData.foo=“bar”并返回bobData。這是目前的可能嗎?
添加回答
舉報
0/150
提交
取消