亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何使用 Python 從 twitter 推文中刪除圖片 URL

如何使用 Python 從 twitter 推文中刪除圖片 URL

慕的地6264312 2022-07-12 09:43:07
我有一個來自 twitterscraper 的數據框,我正在嘗試從文本中刪除圖片 URL輸入:大家好,祝你有美好的一天。pic.twitter.com/Z1yG39NO輸出:大家好,祝你有美好的一天。df['text'] = df['text'].apply(lambda x: re.split('https:\/\/.*[\r\n]*', str(x))[0])我使用此代碼,但它只能刪除 https:謝謝 :-)
查看完整描述

2 回答

?
慕哥6287543

TA貢獻1831條經驗 獲得超10個贊

import re

def cleaning_PicURL (text):

    text = re.sub(r'pic.twitter.com/[\w]*',"", text)

    return text


df['text'] = df['text'].apply(lambda x: cleaning_PicURL(x))

使用上面的代碼,它將從文本中刪除圖片 URL,這里的split函數會將文本拆分為匹配的正則表達式模式并給我們一個列表。在推文中,您可能不確定圖片 URL 的位置,因此使用sub函數而不是split函數更相關,因為sub函數會直接刪除帶有空字符串的匹配文本,它對您來說很容易。正則表達式模式pic.twitter.com/[\w]*將有助于匹配文本中的所有 twitter 圖片 URL。希望這可以消除您的疑問。


例子:


re.sub(r'pic.twitter.com/[\w]*',"", "test pic.twitter.com/va4nFjFQ5B")

'test '


查看完整回答
反對 回復 2022-07-12
?
精慕HU

TA貢獻1845條經驗 獲得超8個贊

做這個 :

df['text'] = df['text'].str.replace(r'pic.twitter.com(.*?)\s(.*)', '')


(.*?)\s(.*) 把這個放在每個帖子特定的 URL 的其余部分


查看完整回答
反對 回復 2022-07-12
  • 2 回答
  • 0 關注
  • 113 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號