亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

Python 遍歷打開的文件

Python 遍歷打開的文件

智慧大石 2023-04-25 16:19:36
我正在嘗試計算“The”一詞在文本中出現的次數(大致)。book1 = 'imitation_of_christ.txt'book2 = 'jesus_of_history.txt'with open(book1, encoding='utf-8') as book1:    lines = book1.readlines()    word = 'the '    times = lines.count(word)    for line in lines:        times += line.count(word)    print (f"The word '{word}'' appears roughly {times} times in {book1}.")我已經編寫了代碼,但我不明白為什么我需要“時間”變量來完成這項工作?我試圖刪除它,但它說了 0 次。有沒有更有效的方法來做我正在做的事情?謝謝
查看完整描述

2 回答

?
呼啦一陣風

TA貢獻1802條經驗 獲得超6個贊

由于lines是一個列表,lines.count(word)因此返回正好等于 的行數word。這是0出于兩個原因:

  1. 全部返回的字符串以readlines()換行符結尾(可能最后一行除外)。由于word不以換行符結尾,因此它永遠不會完全匹配它們中的任何一個。

  2. 即使您刪除了換行符,您也是在將單個單詞與整行進行比較。因此,除非文件每行包含一個單詞,單詞后有一個空格,否則 的元素lines永遠不會完全匹配word。

另一方面,由于line是單個字符串,因此計算該匹配項line.count(word)的子字符串數。該循環將文件所有行中的子字符串數相加。linewordfor

請注意,如果您確實有一行只包含"the ",您的代碼將對該單詞計數兩次。沒必要做

times = lines.count(word)

在循環之前。你應該只初始化times = 0.

您還可以使用以下sum()功能:

times = sum(line.count(word) for line in lines)


查看完整回答
反對 回復 2023-04-25
?
HUH函數

TA貢獻1836條經驗 獲得超4個贊

這是一個非常簡單的方法來讀取整個文件并計算出現次數:


book1 = 'imitation_of_christ.txt'

book2 = 'jesus_of_history.txt'


with open(book1, encoding='utf-8') as book1:

    book = book1.read()

    word = 'the '

    times = book.count(word)


    print (f"The word '{word}'' appears roughly {times} times in {book1}.")


查看完整回答
反對 回復 2023-04-25
  • 2 回答
  • 0 關注
  • 136 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號