基于python實現(xiàn)檢索標(biāo)記敏感詞并輸出
一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用于產(chǎn)品的宣傳,可以使用程序檢測敏感詞,以下既是具體代碼。
#檢索敏感詞并描紅輸出#輸入word = input('請輸入或拷貝含有敏感詞的宣傳文字:')#敏感詞庫sensitive = [’第一’,’國家級’,’最高級’,’最佳’,’獨一無二’,’一流’,’僅此一次’,’頂級’, ’頂尖’,’尖端’,’極品’,’極佳’,’絕佳’,’絕對’,’終極’,’極致’,’首個’,’首選’, ’獨家’,’首發(fā)’,’首次’]#在輸入語句中發(fā)現(xiàn)的敏感詞,放在列表中sensitive_find = []#newword用于標(biāo)紅敏感詞,word用于循環(huán)newword = word#遍歷敏感詞庫for item in sensitive: #將至少出現(xiàn)一次的敏感詞放到sensitive_find中,然后標(biāo)紅 if word.count(item)>0: sensitive_find.append(item+’:’+str(word.count(item))+’次’) #newword存放標(biāo)紅后的整段話,word則不變 newword = newword.replace(item,’ 033[1;31m’+item+’033[0m’)print(’發(fā)現(xiàn)敏感詞如下:’)for item in sensitive_find: print(item)print(’敏感詞位置已用星號進行標(biāo)注:n’+newword)
結(jié)果(ps結(jié)果中有標(biāo)紅的部分,這里未顯示,下面用部分截圖說明一下):
請輸入或拷貝含有敏感詞的宣傳文字:天貓首發(fā),耀世登場,世界品質(zhì),慶偉制造。本產(chǎn)品目前是同類產(chǎn)品中最高級的。2018年全網(wǎng)銷售量第一,瑤瑤領(lǐng)先同類產(chǎn)品。國內(nèi)外頂級大師鼎力支持,是您居家生活的唯一選擇。發(fā)現(xiàn)敏感詞如下:第一:1次最高級:1次頂級:1次首發(fā):1次敏感詞位置已用星號進行標(biāo)注:天貓 首發(fā),耀世登場,世界品質(zhì),慶偉制造。本產(chǎn)品目前是同類產(chǎn)品中 最高級的。2018年全網(wǎng)銷售量 第一,瑤瑤領(lǐng)先同類產(chǎn)品。國內(nèi)外 頂級大師鼎力支持,是您居家生活的唯一選擇。
有標(biāo)紅部分的截圖
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. python爬蟲實戰(zhàn)之制作屬于自己的一個IP代理模塊2. moment轉(zhuǎn)化時間戳出現(xiàn)Invalid Date的問題及解決3. python如何實現(xiàn)word批量轉(zhuǎn)HTML4. PHP如何打印跟蹤調(diào)試信息5. Java8內(nèi)存模型PermGen Metaspace實例解析6. CSS3中Transition屬性詳解以及示例分享7. 存儲于xml中需要的HTML轉(zhuǎn)義代碼8. HTML <!DOCTYPE> 標(biāo)簽9. 匹配模式 - XSL教程 - 410. CSS3實例分享之多重背景的實現(xiàn)(Multiple backgrounds)
