已解決430363個問題，去搜搜看，總會有你想問的

爬蟲爬取網頁后，如何保存網頁？

首頁猿問爬蟲爬取網頁后，如何保存網頁？

爬蟲爬取網頁后，如何保存網頁？

爬蟲

犯罪嫌疑人X 2018-10-03 18:15:27

爬蟲從 Internet 中爬取眾多的網頁作為原始網頁庫存儲于本地，然后網頁分析器抽取網頁中的主題內容交給分詞器進行分詞，得到的結果用索引器建立正排和倒排索引，這樣就得到了索引數據庫，用戶查詢時，在通過分詞器切割輸入的查詢詞組并通過檢索器在索引數據庫中進行查詢，得到的結果返回給用戶。請問這里原始網頁庫是該怎么實現，是直接存到數據庫里嗎？還是什么形式？如果是存到數據庫里，應該有哪些字段？

查看完整描述

2 回答

holdtom

TA貢獻1805條經驗獲得超10個贊

他這里的意思是抓取到的網頁直接以文件的方式存放到本地磁盤

反對回復 2018-10-14

2 回答
0 關注
2615 瀏覽

關注

添加回答

舉報

0/150

提交

取消

亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

爬蟲爬取網頁后，如何保存網頁？

爬蟲爬取網頁后，如何保存網頁？

2 回答

添加回答

爬蟲爬取網頁后，如何保存網頁？

爬蟲爬取網頁后，如何保存網頁？