使用java 的一個開源工具 Jtidy 可以清理不規則的html文件并生成 對應的xml文件,但是由于html的容錯性較強,百分之80的網頁都存在錯誤,無法成功轉換,如果我要批量進行轉換用來抽取其中的信息,那么我該怎么處理呢..... 查看完整描述