我是 python 和 pandas 的新手,我設法做我想做的事,但在 python 上運行大約需要 10 分鐘,在 Jupyter 上運行大約需要 1 分鐘。有很多循環,并且可能有一種更聰明的方法來做到這一點。我該怎么做才能讓它更快?歡迎任何建議。提前致謝!我讀過的其他表格很小,大約有 2 列和 10 行。import pandas as pdimport osos.chdir("C:/Users/user/Desktop")df = pd.read_excel('arquivo.xlsx')dias_de_embarque = [None]*df.shape[0]for i in range (0,df.shape[0]): if (df['Centro custo emissor'][i] == 2002040041) & (df['Tp.ausência/presen?a'][i] == 602): dias_de_embarque[i] = round((1/12)*df['Horas'][i],4) else: dias_de_embarque[i] = 0folga_adquirida = [None]*df.shape[0]for i in range (0,df.shape[0]): folga_adquirida[i] = round((5/7) * dias_de_embarque[i],4)dias_de_folga = [None]*df.shape[0]for i in range (0,df.shape[0]): if df['Centro custo emissor'][i] == 2002040041 and df['Tp.ausência/presen?a'][i] == 323: dias_de_folga[i] = round(df['Horas'][i]/8,4) elif df['Centro custo emissor'][i] == 2002040041 and df['Tp.ausência/presen?a'][i] == 608: dias_de_folga[i] = round(df['Horas'][i]*(5/56),4) else: dias_de_folga[i] = 0saldo = [None]*df.shape[0]for i in range (0,df.shape[0]): saldo[i] = folga_adquirida[i] - dias_de_folga[i]treinamento = [None]*df.shape[0]for i in range (0,df.shape[0]): if df['Centro custo emissor'][i] == 2002040041 and df['Tp.ausência/presen?a'][i] == 606: treinamento[i] = round(df['Horas'][i]/8,4) else: treinamento[i] = 0not_alocacao_codigos = pd.read_excel('Apoio e Budget.xlsx', 'not_alocacao_codigos')atividades = [None]*df.shape[0]for i in range (0, df.shape[0]): if df['Opera??o'][i] in set(not_alocacao_codigos['Opera??o']): atividades[i] = not_alocacao_codigos['Atividades Engenharia'][ not_alocacao_codigos[not_alocacao_codigos['Opera??o'] == df.Opera??o[i] ].index [0] ] else: atividades[i] = "-"
1 回答

喵喔喔
TA貢獻1735條經驗 獲得超5個贊
只是不要在所有行中使用循環,例如
dias_de_embarque = [None]*df.shape[0]
for i in range (0,df.shape[0]):
if (df['Centro custo emissor'][i] == 2002040041) & (df['Tp.ausência/presen?a'][i] == 602):
dias_de_embarque[i] = round((1/12)*df['Horas'][i],4)
else:
dias_de_embarque[i] = 0
在 numpy 和 pandas 中,您應該使用如下數組操作:
df['Dias de Embarque'] = 0 # Init new column with 0-vector
編輯:
df.loc[df['Centro custo emissor'] == 2002040041) & (df['Tp.ausência/presen?a'] == 602), 'Dias de Embarque'] = round((1/12)*df['Horas'],4) # At every position, where condition is True, set new value
添加回答
舉報
0/150
提交
取消