3 回答

TA貢獻1875條經驗 獲得超5個贊
您可以添加運行第二行后收到的輸出/錯誤嗎?您可以添加用于創建cdc_new
變量的行嗎?
您已經創建了變量cdc_new
嗎?嘗試運行:
cdc_new.head()
查看您的數據是否與您正在查詢的表匹配。
如果是這樣,您應該能夠運行:
cdc_new[(cdc_new.Industry_type=='Hospitals') & (cdc_new.Employee_Insurance_Premium=='Decreased')]
您的代碼的其余部分看起來不錯。您不需要將其包裝起來,pd.DataFrame()
因為存儲在其中的數據cdc_new
應該已經是DataFrame
.
如果遇到問題,請仔細檢查運行 SQL 查詢時是否獲得輸出以及變量中的數據cdc_new
是否與數據表匹配。

TA貢獻1884條經驗 獲得超4個贊
假設您已經從 sql 中讀取了整個表,如下所示:
cdc_new = pd.read_sql(query, conn)
您可以使用以下語法:
df = (cdc_new.loc[(cdc_new['Industry_type'] == 'Hospitals') &
(cdc_new['Employee_Insurance_Premium'] == 'Decreased'),
['Industry_type',
'No_of_Employees',
'Employee_Insurance_Premium',
'Percent_Female_Employees']]
.sort_values('Percent_Female_Employees', ascending=False))
df

TA貢獻1821條經驗 獲得超6個贊
如果這有效并返回記錄:
SELECT Industry_type, No_of_Employees, Employee_Insurance_Premium, Percent_Female_Employees FROM cdc_new WHERE Industry_type= 'Hospitals' AND Employee_Insurance_Premium='Decreased' ORDER BY Percent_Female_Employees DESC;
記錄集已被修剪和排序,因此您應該按寫入方式使用它。這里使用 pandas 進行演示,而不是分析。
然后使用:
import pandas as pd
cxn = "Connection string to your database"
inSQL = "SELECT Industry_type, No_of_Employees, Employee_Insurance_Premium, Percent_Female_Employees FROM cdc_new WHERE Industry_type= 'Hospitals' AND Employee_Insurance_Premium='Decreased' ORDER BY Percent_Female_Employees DESC;"
df = pd.read_sql(inSQL,cxn)
添加回答
舉報