python - lxml.etree為什么會(huì)自動(dòng)加上加上</i>?
問(wèn)題描述
正在學(xué)習(xí)lxml,代碼如下:
from lxml import etreetext = ’’’<i class='cell maincell'> <p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務(wù)</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></i>’’’html = etree.HTML(text)print(etree.tostring(html,encoding=’utf-8’).decode(’utf-8’))
輸出如下:
<html><body><i class='cell maincell'> </i><p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務(wù)</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></body></html>
主要不理解為什么<i>標(biāo)簽?zāi)抢飼?huì)出錯(cuò)呢?請(qǐng)問(wèn)怎么解決這個(gè)問(wèn)題?謝謝~
問(wèn)題解答
回答1:主要是因?yàn)?/p>
p元素內(nèi)容分類(lèi) Flow content, palpable content.允許的內(nèi)容 Phrasing content.允許的父元素任何接受flow content的元素
i元素Content catergories Flow content, phrasing content, palpable content.允許量 phrasing content.
很顯然P元素的父元素應(yīng)該是flow content類(lèi)型的,然而i并不滿(mǎn)足條件,也就是說(shuō)這是不符合規(guī)范的。解決辦法就是i直接換為p。
相關(guān)文章:
1. 網(wǎng)頁(yè)爬蟲(chóng) - python+requests 網(wǎng)頁(yè)重定向求解2. 請(qǐng)問(wèn)寫(xiě)好python模塊以后,文檔怎么寫(xiě)?3. 后端開(kāi)發(fā) - mysql按時(shí)間分段統(tǒng)計(jì)的sql語(yǔ)句怎么寫(xiě)好?4. javascript - iframe 為什么加載網(wǎng)頁(yè)的時(shí)候滾動(dòng)條這樣顯示?5. list - python 求助6. 初來(lái)乍到,相對(duì)路徑問(wèn)題,新手求教7. 哭遼 求大佬解答 控制器的join方法怎么轉(zhuǎn)模型方法8. 老師您好!我有一個(gè)問(wèn)題、9. c++ - 如何在python的阻塞的函數(shù)中獲取變量值10. mysql - 在下剛?cè)腴T(mén)sql 關(guān)于sql的語(yǔ)法詢(xún)問(wèn)
