文章詳情頁

Python通過Tesseract庫實現(xiàn)文字識別

瀏覽：3日期：2022-08-03 18:15:46

機器視覺

從Google的無人駕駛汽車到可以識別假鈔的自動售賣機，機器視覺一直都是一個應(yīng)用廣泛且具有深遠的影響和雄偉的愿景的領(lǐng)域。

這里我們將重點介紹機器視覺的一個分支：文字識別。介紹如何用一些Python庫來識別和使用在線圖片中的文字。

我們可以很輕松的閱讀圖片里的文字，但是機器閱讀這些圖片就會非常困難，利用這種人類用戶可以正常讀取但是大多數(shù)存貯器沒法讀取的圖片，這時驗證碼（CAPTCHA）就出現(xiàn)了。驗證碼讀取的難易程序也大不相同。

將圖像翻譯成文字一般被稱為光學(xué)文字識別（Optical Character Recognition，OCR）。可以實現(xiàn)OCR的底層庫并不多，目前很多庫都是使用共同的幾個底層OCR庫，或者是在上面進行定制。

OCR庫概述

在讀取和處理圖像、圖像相差的機器學(xué)習(xí)以及創(chuàng)建圖像等任務(wù)中，Python一直都是非常出色的語言。雖然有很多庫可以進行圖像處理，但是這里我們只介紹Tesseract庫。

Tesseract

Tesseract是一個OCR庫，目前由Google贊助。Tesseract是目前公認最優(yōu)秀、最精確的開源OCR系統(tǒng)。除了極高的精確度，Tesseract也具有很高的靈活性。它可以通過訓(xùn)練識別出任何字體，也可以識別出任何Unicode字符。

安裝Tesseract：Windows系統(tǒng)

下載可執(zhí)行安裝文件安裝即可。

安裝pytesseract

Tesseract是一個Python的命令行工具，不是通過import語句導(dǎo)入的庫。安裝之后，要用tesseract命令在Python的外面運行，但我們可以通過pip安裝支持Python版本的Tesseract庫：

pip install pytesseract

處理規(guī)范的文字

你要處理的大多數(shù)文字都是比較干凈、格式規(guī)范的。格式霍英東的文字通常具有以下特點：

使用統(tǒng)一的標準字體（不包含手寫體、草書或者十分“花哨”的字體），復(fù)印或者拍照但是字體清晰、沒有多余的痕跡或者污點排列整齊，沒有歪歪斜斜的字沒有超出圖片范圍，也沒有殘缺不全，或緊緊貼在圖片的邊緣

文字的一些格式問題在圖片預(yù)處理時可以進行解決。例如，可以把圖片轉(zhuǎn)換成灰度圖，調(diào)整亮度和對比度，還可以根據(jù)需要進行裁剪和旋轉(zhuǎn)，在這里不作介紹。

示例：

英文：

Python通過Tesseract庫實現(xiàn)文字識別

識別結(jié)果的準確率還是挺高的。

通過Python代碼實現(xiàn)

英文：

Python通過Tesseract庫實現(xiàn)文字識別

中文：

Python通過Tesseract庫實現(xiàn)文字識別

運行結(jié)果

This is some text, written in Arial, that will be read byTesseract. Here are some symbols: !@#$%'&*()******************************中華人民共和國

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：Python API len函數(shù)操作過程解析下一條：Python爬蟲實現(xiàn)模擬點擊動態(tài)頁面

相關(guān)文章：

1. Spring security 自定義過濾器實現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實例代碼)2. Java8內(nèi)存模型PermGen Metaspace實例解析3. python wsgiref源碼解析4. 一文搞懂 parseInt()函數(shù)異常行為5. python tkinter實現(xiàn)下載進度條及抖音視頻去水印原理6. python學(xué)習(xí)之plot函數(shù)的使用教程7. python 實現(xiàn)關(guān)聯(lián)規(guī)則算法Apriori的示例8. ASP.NET MVC使用正則表達式驗證手機號碼9. Python基于百度AI實現(xiàn)抓取表情包10. python 實現(xiàn)"神經(jīng)衰弱"翻牌游戲

排行榜

					
					Spring security 自定義過濾器實現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實例代碼)
Java8內(nèi)存模型PermGen Metaspace實例解析
IDEA 去除 mybatis.xml 文件黃色警告的圖文教程
Flex挑戰(zhàn)Java和.NET Adobe能否再度崛起
python不到50行代碼完成了多張excel合并的實現(xiàn)示例
基于vue實現(xiàn)簡易打地鼠游戲
ASP.NET MVC使用正則表達式驗證手機號碼
python tkinter實現(xiàn)下載進度條及抖音視頻去水印原理
Python通過Pillow實現(xiàn)圖片對比
JavaScript 防篡改對象的用法示例
解決Django Haystack全文檢索為空的問題