用python中的xpath怎么獲取我想要標(biāo)記的內(nèi)容
問題描述
我想獲取h3下面a標(biāo)簽下的完整內(nèi)容(Get a 5% saving on Ripleys Believe It or Not London Tickets),這個(gè)用xpath怎么獲取呢?跪求高手指教
問題解答
回答1:最方便的辦法,選中,有個(gè)復(fù)制到xpath的選項(xiàng)
回答2:chrome下右擊 元素copy->Copy XPath
回答3:之前的答案并沒有針對樓主的問題,因?yàn)闃侵鳑]有將問題描述清楚,我想樓主想說的是直接用text() 方法或text屬性得不到子標(biāo)簽內(nèi)的內(nèi)容(假設(shè)你已經(jīng)看過了xpath的基本語法)。Google搜索xpath get all text, 第一個(gè)就是答案。樓主可以這樣提問:xpath如何取出被標(biāo)簽包含的文字內(nèi)容(雖然這里的答案并不能讓人滿意)
回答4:你試試
response.xpath(’//h3/a/descendant-or-self::text()[normalize-space()]’)
descendant-or-self表明當(dāng)前node和子代nodes
normal-space()去掉whitespace-only nodes的子代nodes(這個(gè)可要可不要)
參考鏈接:http://stackoverflow.com/ques...
相關(guān)文章:
1. 網(wǎng)頁爬蟲 - Python 爬蟲中如何處理驗(yàn)證碼?2. Python如何播放還存在StringIO中的MP3?3. python - 我在使用pip install -r requirements.txt下載時(shí),為什么部分能下載,部分不能下載4. Python爬蟲如何爬取span和span中間的內(nèi)容并分別存入字典里?5. javascript - 請教如何獲取百度貼吧新增的兩個(gè)加密參數(shù)6. python - Win7調(diào)用flup報(bào)錯(cuò)’module’ object has no attribute ’fromfd’7. mysql 一個(gè)sql 返回多個(gè)總數(shù)8. mysql - 分庫分表、分區(qū)、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處9. python - 編碼問題求助10. mysql - 如何減少使用或者不用LEFT JOIN查詢?
