最新回答 / 慕村1348781
https://github.com/bainingchao/DataProcess/tree/master/ClearText 點開就能看見源碼
2019-10-27
最新回答 / 海邊落地的愿
老師給了一個這個鏈接1 復旦新聞語料下載:鏈接: https://pan.baidu.com/s/1U3CtXRl-2mH24PNEzTcy8w 提取碼: bxtj?
2019-09-16
最新回答 / weixin_慕慕7264533
這個是列表解析式,這個part是從后面那個part過來的,比如 a = [1,2,3]b = [x for x in a],則b也等于[1,2,3]
2019-08-25
最新回答 / 寶慕林452583
print('{t}?***?{i}?\t?docs?has?been?dealed'??????????????????????.format(i=i,?t=time.strftime('%Y-%m-%d?%H:%M:%S',time.localtime())),'\n',catg,':\t',file[:20])file???
2019-08-09
講師回答 / 伏草惟存
# 正則對字符串清洗def textParse(str_doc):? ? # 正則過濾掉特殊符號、標點、英文、數字等。? ? r1 = '[a-zA-Z0-9’!"#$%&\'()*+,-./::;;|<=>?@,—。?★、…【】《》?“”‘’![\\]^_`{|}~]+'? ? # 去除空格? ? r2 = '\s+'? ? # 去除換行符? ? str_doc=re.sub(r1, ' ', str_doc)? ? # 多個空格成1個? ? str_doc=re.sub(r2, '...
2019-07-22