亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何獲取網頁中的編碼數字?

如何獲取網頁中的編碼數字?

搖曳的薔薇 2023-04-25 15:50:57
我想在網頁中獲取紅色數字,但我得到了編碼字符串。這是我的代碼:import requestsfrom bs4 import BeautifulSoupres = requests.get('https://m.3fang.com/3f/land/zpg/detail/fc8e0948-2a63-449b-886b-2a54269b1498/b/370724.html', headers={'user-agent':'abc'})soup = BeautifulSoup(res.text, 'lxml')print(soup.find('p',{'class':'imp-num'}).text)而不是2491.00,我得到了'\U000de4f7\U000da5fb\U000d4dfa\U000d1fae.\U000d7c4e\U000d7c4e㎡\n            '。如何得到正確的數字?
查看完整描述

1 回答

?
UYOU

TA貢獻1878條經驗 獲得超4個贊

您正在從頁面中提取正確的數據,但由于缺少字體系列,問題出在數據呈現上。抓取的數據有一些 Unicode 字符,這些字符在大多數常見字體系列中并不常見。因此,您可以通過安裝與該網站使用的字體相同的字體來正確查看這些數據。

從 chrome 開發人員工具中,您可以輕松識別該站點正在使用以下兩個 URL 鏈接字體:

  • https://industrydown1.fang.com/node-3fang-wap/1.2.6/font/my_default_c.580b51a2.ttf

  • https://industrydown1.fang.com/node-3fang-wap/1.2.6/font/my_default_a.6ce68cf0.ttf

只需下載這些字體并將它們安裝在您想要可視化此數據的系統上,如果您打算在網頁上使用它,您需要在樣式表中鏈接這些字體。

為了在我的 arch Linux 上安裝這些字體,我下載了這些文件并將它們復制到~/.local/share/fonts/.?然后我執行fc-cache命令更新我系統上的字體緩存。

安裝這些字體后,我將該字體添加為 Visual Studio Code 編輯器上的后備字體,之后我能夠看到正確呈現的這些字符。附上截圖供參考:


對于 PyCharm,導航到File>?Settings。在那里搜索Console Font或導航到Editor>?Color Scheme>?Console Font。在那里設置my_default_c為您的后備字體并勾選選項Enable font ligatures。

查看完整回答
反對 回復 2023-04-25
  • 1 回答
  • 0 關注
  • 105 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號