亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 Java 將 BigQuery 讀取到 Apache Spark

如何使用 Java 將 BigQuery 讀取到 Apache Spark

FFIVE 2024-01-28 17:03:57
我想使用 Java 將 Google BigQuery 中的表中的數據讀取到 Spark 中。我如何在 Java 中做到這一點,我需要什么依賴項以及生成的數據類型是什么?我能找到的所有東西都在 Scala 中,但我需要 Java 中的。
查看完整描述

1 回答

?
動漫人物

TA貢獻1815條經驗 獲得超10個贊

下面是 Scala Shakespeare 示例的 Java 等效項:


import org.apache.spark.sql.Dataset;

import org.apache.spark.sql.Row;

import org.apache.spark.sql.SparkSession;


public class JavaShakespeare {


  public static void main(String[] args) {

    SparkSession spark = SparkSession.builder()

        .appName("spark-bigquery-demo")

        .getOrCreate();


    // Use the Cloud Storage bucket for temporary BigQuery export data used

    // by the connector. This assumes the Cloud Storage connector for

    // Hadoop is configured.

    String bucket = spark.sparkContext().hadoopConfiguration().get("fs.gs.system.bucket");

    spark.conf().set("temporaryGcsBucket", bucket);


    // Load data in from BigQuery.

    Dataset<Row> wordsDF = spark.read().format("bigquery")

        .option("table", "publicdata.samples.shakespeare").load().cache();

    wordsDF.show();

    wordsDF.printSchema();

    wordsDF.createOrReplaceTempView("words");


    // Perform word count.

    Dataset<Row> wordCountDF = spark.sql(

        "SELECT word, SUM(word_count) AS word_count FROM words GROUP BY word");


    // Saving the data to BigQuery

    wordCountDF.write().format("bigquery").option("table", "wordcount_dataset.wordcount_output")

        .save();

  }

}


查看完整回答
反對 回復 2024-01-28
  • 1 回答
  • 0 關注
  • 158 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號