使用Google的Tesseract和OpenCV構(gòu)建光學(xué)字符識(shí)別(OCR)系統(tǒng)
EAST具有U形網(wǎng)絡(luò)。網(wǎng)絡(luò)的第一部分包括在ImageNet數(shù)據(jù)集上訓(xùn)練的卷積層。下一部分是特征合并分支,該分支將當(dāng)前特征圖與上一階段的未合并特征圖連接在一起。然后是卷積層,以減少計(jì)算并生成輸出特征圖。最后,使用卷積層,輸出是顯示文本存在的得分圖和幾何圖,幾何圖可以是旋轉(zhuǎn)的框或覆蓋文本的四邊形,這可以從研究論文中包含的結(jié)構(gòu)圖像中直觀地理解:
我強(qiáng)烈建議你親自閱讀本文(https://arxiv.org/abs/1704.03155) ,以更好地了解EAST模型。OpenCV從版本3.4開(kāi)始包含EAST文本檢測(cè)器模型,這使得實(shí)現(xiàn)自己的文本檢測(cè)器變得超級(jí)方便。生成的本地化文本框可以通過(guò)Tesseract OCR傳遞以提取文本,這樣你將擁有一個(gè)完整的OCR端到端模型。
使用TensorFlow對(duì)象的API進(jìn)行文本檢測(cè)的自定義模型TensorFlow Object API:https://github.com/tensorflow/models/tree/master/research/object_detection構(gòu)建文本檢測(cè)器的最后一種方法是用使用了TensorFlow Object API的自定義文本檢測(cè)器模型。它是一個(gè)開(kāi)放源代碼框架,用于為目標(biāo)檢測(cè)任務(wù)構(gòu)建深度學(xué)習(xí)模型。要詳細(xì)了解它,我建議先閱讀下面這篇詳細(xì)的文章。https://www.a(chǎn)nalyticsvidhya.com/blog/2020/04/build-your-own-object-detection-model-using-tensorflow-api/要構(gòu)建你的自定義文本檢測(cè)器,你顯然需要一個(gè)包含很多圖像的數(shù)據(jù)集,至少要多于100個(gè);然后你需要對(duì)這些圖像進(jìn)行注釋,以便模型可以知道目標(biāo)對(duì)象在哪里并了解有關(guān)它的一切;最后,你可以從TensorFlow’s detection model zoo(https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md) 中根據(jù)性能和速度之間的權(quán)衡選擇一種預(yù)訓(xùn)練的模型。你可以參考這個(gè)綜合性的博客來(lái)構(gòu)建你的自定義模型。博客:https://tensorflow-object-detection-api-tutorial.readthedocs.io/en/latest/training.html#configuring-a-training-pipeline現(xiàn)在。訓(xùn)練可能需要一些計(jì)算,但是如果你真的沒(méi)有足夠的計(jì)算能力,請(qǐng)不要擔(dān)心!你可以使用Google合作實(shí)驗(yàn)室滿足所有要求!這篇文章(https://www.a(chǎn)nalyticsvidhya.com/blog/2020/03/google-colab-machine-learning-deep-learning) 將教你如何有效地使用它。最后,如果你想往前走了一步,并建立一個(gè)最先進(jìn)的YOLO文本探測(cè)器模型,該文章(https://www.a(chǎn)nalyticsvidhya.com/blog/2018/12/practical-guide-object-detection-yolo-framewor-python/) 將是一個(gè)了解它的所有細(xì)節(jié)的敲門磚,是一個(gè)很好的入門教程!
尾注:在這篇文章中,我們討論了OCR中存在的問(wèn)題以及可以用來(lái)解決這項(xiàng)任務(wù)的各種方法。我們還討論了這些方法的各種缺點(diǎn),以及為什么OCR不像看起來(lái)那么容易!
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
10月31日立即下載>> 【限時(shí)免費(fèi)下載】TE暖通空調(diào)系統(tǒng)高效可靠的組件解決方案
-
即日-11.13立即報(bào)名>>> 【在線會(huì)議】多物理場(chǎng)仿真助跑新能源汽車
-
11月28日立即報(bào)名>>> 2024工程師系列—工業(yè)電子技術(shù)在線會(huì)議
-
12月19日立即報(bào)名>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
即日-12.26火熱報(bào)名中>> OFweek2024中國(guó)智造CIO在線峰會(huì)
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專題
- 1 【一周車話】沒(méi)有方向盤(pán)和踏板的車,你敢坐嗎?
- 2 特斯拉發(fā)布無(wú)人駕駛車,還未迎來(lái)“Chatgpt時(shí)刻”
- 3 特斯拉股價(jià)大跌15%:Robotaxi離落地還差一個(gè)蘿卜快跑
- 4 馬斯克給的“驚喜”夠嗎?
- 5 海信給AI電視打樣,12大AI智能體全面升級(jí)大屏體驗(yàn)
- 6 打完“價(jià)格戰(zhàn)”,大模型還要比什么?
- 7 馬斯克致敬“國(guó)產(chǎn)蘿卜”?
- 8 神經(jīng)網(wǎng)絡(luò),誰(shuí)是盈利最強(qiáng)企業(yè)?
- 9 比蘋(píng)果偉大100倍!真正改寫(xiě)人類歷史的智能產(chǎn)品降臨
- 10 諾獎(jiǎng)進(jìn)入“AI時(shí)代”,人類何去何從?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市