python - scrapy xpath 頁面解析找不到
問題描述
下面是頁面大類的html
<p class='house-item clearfix house-item-curr'><p class='item-photo fl'> <a href='http://www.lshqa.cn/zufang/shbs12427828.html' target='_blank'><img src='https://imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg' src='https://imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg' alt='采菊苑租房2800元/月' style='display: inline-block;'></a></p><p class='item-info fl'> <h4 class='house-title'><a href='http://www.lshqa.cn/zufang/shbs12427828.html' target='_blank' class='cBlueB'>采菊苑,77平兩房出租,毛坯3千,好談價!</a> </h4> <p class='f14 f000 mb_10'><a href='http://www.lshqa.cn/xiaoqu/xq-pedpwawows/' target='_blank'>采菊苑</a><span class='f000 mr_10'>2室2廳</span><span class='f000'>77平</span> </p> <p class='f7b mb_10'>南北<em class='mrl_6'>|</em>高層<em class='mrl_6'>|</em>毛坯<em class='mrl_6'>|</em>2008年<em class='mrl_6'>|</em>整租 </p> <p class='f7b mb_15'>寶山-顧村 菊聯路68弄<a href='javascript:void(0)' value='/page/v1/common/maputil.aspx?x=121.372168&y=31.354713' class=' icons_map jsmapicon '></a> </p> </p> <p class='item-pricearea fr'> <p class='price-nub cRed'>2800元/月</p> <p class='f14 f000 mb_15 fsm'> </p> </p><p class='clear'></p> </p>
我用xpath提取text 我的代碼是
class itcast(scrapy.Spider): name = ’SH’ allowd_domains = ['http://sh.centanet.com/'] start_urls = ['http://sh.centanet.com/zufang/p2/'] def parse(self,response):list = response.xpath('//p[@class=’//p[@class=’ouse-item clearfix house-item-curr’]')for i in list: name = i.xpath('//a[@class=’cBlueB’.text()]') print name[0]
我可以找到這個大類報錯是在 for i in list:name =f.xpath()這行,text提取不到。執行代碼找不到,幫我看看我是哪里不對,類似的我也試過好多次,沒辦法了,只能提問了希望能回答下 謝謝!
問題解答
回答1:def parse(response): list = response.xpath('//p[@class=’house-item clearfix house-item-curr’]') for i in list:name = i.xpath('//a[@class=’cBlueB’]')print name[0].text
也許你是這個意思?
回答2:name = i.xpath('//a[@class=’cBlueB’.text()]')這種寫法是錯誤的,text怎么能放在[]里面呢
相關文章:
1. 網頁爬蟲 - python爬蟲翻頁問題,請問各位大神我這段代碼怎樣翻頁,還有價格要登陸后才能看到,應該怎么解決2. python如何不改動文件的情況下修改文件的 修改日期3. python 正則表達式提取4. 算法 - python 給定一個正整數a和一個包含任意個正整數的 列表 b,求所有<=a 的加法組合5. javascript - 微信h5發送圖文信息,部分設備點擊“發送”按鈕時沒反應,問題較難重現,如何能找到可能存在問題的點?6. javascript - 微信小程序里怎么把頁面轉成圖片分享7. 大家好,請問在python腳本中怎么用virtualenv激活指定的環境?8. python - 求一個在def中可以實現調用本def滿足特定條件continue效果的方法(標題說不太清楚,請見題內描述)9. javascript - JS用ajax爬取百度外賣店家信息10. python - Pycharm調試代碼進行列表遍歷時,如何直接賦值指定元素
