我正在嘗試將所有文檔保存在名為:news (44908 Document) 的 ES 索引中,并將它們保存在 DataFrame 中但是在運行腳本時,我只得到前十個文件。這是我的代碼:esClient = Elasticsearch()response = esClient.search(index = 'news', body = {}, )#scrollId = response["_scroll_id"]#print(scrollId)esDocs = response["hits"]["hits"]fields = {}for num, doc in enumerate(esDocs): sourceData = doc["_source"] #response = esClient.scroll(scroll_id=scrollId, scroll = '1m') #scrollId = response['_scroll_id'] #print(scrollId) for key, val in sourceData.items(): if key == 'tags' or key == 'text' or key == 'title': try: fields[key] = np.append(fields[key], val) except KeyError: fields[key] = np.array([val]) else: continue;df = pd.DataFrame(fields)我嘗試使用.scroll()但沒有用。我仍然只得到 10 個第一個文件。我也嘗試指定size = number,但這不是我要找的......這是我的輸出數據框
添加回答
舉報
0/150
提交
取消