1 回答

TA貢獻1865條經驗 獲得超7個贊
導入并初始化 findspark,創建一個 spark 會話,然后使用該對象將 pandas 數據幀轉換為 spark 數據幀。然后將新的 spark 數據框添加到目錄中。使用 python 3.6.6 在 Jupiter 5.7.2 和 Spyder 3.3.2 中測試并運行。
import findspark
findspark.init()
import pyspark
from pyspark.sql import SparkSession
import pandas as pd
# Create a spark session
spark = SparkSession.builder.getOrCreate()
# Create pandas data frame and convert it to a spark data frame
pandas_df = pd.DataFrame({"Letters":["X", "Y", "Z"]})
spark_df = spark.createDataFrame(pandas_df)
# Add the spark data frame to the catalog
spark_df.createOrReplaceTempView('spark_df')
spark_df.show()
+-------+
|Letters|
+-------+
| X|
| Y|
| Z|
+-------+
spark.catalog.listTables()
Out[18]: [Table(name='spark_df', database=None, description=None, tableType='TEMPORARY', isTemporary=True)]
添加回答
舉報