我想運行一個包(RAKE)從評論中提取關鍵短語(df['CUSTOMER_RECOMMENDATIONS_TRANS])并創建一個新列(df['keyphrase_RAKE'])來存儲它們對應于每個評論。我收到一條錯誤消息,提示“ValueError:值的長度與索引的長度不匹配”。我知道錯誤背后的原因,但不知道如何解決??梢宰鍪裁??關鍵字返回關鍵短語列表。這是代碼:import RAKEimport operator# Reka setup with stopword directorystop_dir = "SmartStoplist.txt"rake_object = RAKE.Rake(stop_dir)# Sample text to test RAKEdf = pd.read_excel('my.xlsx')for i in df['CUSTOMER_RECOMMENDATIONS_TRANS']: keywords = rake_object.run(i) df['keyphrase_RAKE'] = keywords
1 回答

慕虎7371278
TA貢獻1802條經驗 獲得超4個贊
您可以使用pandas.DataFrame.apply
并避免 for 循環
df['keyphrase_RAKE'] = df['CUSTOMER_RECOMMENDATIONS_TRANS'].apply(rake_object.run)
添加回答
舉報
0/150
提交
取消