亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

簡介”introduce”在不用循環語句時信息全,但寫了循環語句,只有第二行信息

content=i_item.xpath(".//div[@class='bd']/p[@class='']/text()").extract()
#數據處理(多行數據)實現格式化,但未實現將所有信息整理
for?i_content?in?content:
????content_s="".join(i_content.split())
????douban_item['introduce']=content_s
和
douban_item['introduce']==i_item.xpath(".//div[@class='bd']/p[@class='']/text()").extract_first()

循環語句使用后,只顯示:
1994?/?美國?/?犯罪 劇情

而我們用XPATH時,可以看到路徑信息應該是:

導演: 弗蘭克·德拉邦特 Frank Darabont???主演: 蒂姆·羅賓斯 Tim Robbins /...
1994?/?美國?/?犯罪 劇情

請問各位有啥辦法爬取這個路徑下的所有信息

正在回答

4 回答

只顯示“1994?/?美國?/?犯罪 劇情”是因為在for循環里,douban_item['introduce']的值被覆蓋了,如果想全部爬取的話,可以聲明douban_item['introduce']為一個數組,把i_content循環append到數組里就可以了

0 回復 有任何疑惑可以回復我~
#1

普六 提問者

非常感謝!!
2018-08-27 回復 有任何疑惑可以回復我~
#2

普六 提問者

不過我去嘗試了后發現,如果只是用數組還是無法顯示導演等信息,嘗試把XPATH路徑中的/text()去掉后就可以了,但是目前還沒找到去除數據中如<pclass=""><br>等符號。
2018-08-27 回復 有任何疑惑可以回復我~
#3

慕數據0594206 回復 普六 提問者

list.append后再''.join(list)
2018-09-17 回復 有任何疑惑可以回復我~
contents?=?''
for?i_content?in?content:
????contents?+=?"".join(i_content.split())
douban_item['introduce']?=?contents
追加字符創即可,循環外賦值
0 回復 有任何疑惑可以回復我~

直接在循環外定義一個空字符串,然后在循環內字符串自相加就可以了

content_s=''
for?i_content?in?content:
????content_s1=("".join(i_content.split()))
????content_s=content_s+content_s1
douban_item['introduce']?=?content_s


0 回復 有任何疑惑可以回復我~

good,已嘗試

0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消

簡介”introduce”在不用循環語句時信息全,但寫了循環語句,只有第二行信息

我要回答 關注問題
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號