久久99精品久久只有精品,国产日韩欧美亚洲另类在线

使用 OpenCV 構建文檔掃描儀

2022-11-02 10:43

磐創(chuàng)AI

關注

介紹

在本文中，我們將使用 OpenCV 庫來開發(fā) Python 文檔掃描器。

OpenCV 的簡要概述： OpenCV 是一個開源庫，用于各種計算機語言的圖像處理，包括 Python、C＋＋等。它可用于檢測照片（例如使用人臉檢測系統(tǒng)的人臉）。

我們的軟件應該能夠正確對齊文檔，檢測捕獲圖像的邊界，提升文檔的質量，并最終提供更好的圖像作為輸出。本質上，我們將輸入一個文檔，即用相機拍攝的未經編輯的圖像。OpenCV 將處理該圖像。

我們的基本工作流程是：

形態(tài)學運算邊緣和輪廓檢測識別角點轉變視角執(zhí)行形態(tài)學操作

形態(tài)學：是一系列圖像處理程序和算法，根據(jù)圖像的高度和寬度來處理圖片。最重要的是它們的大小，而不是它們的相對像素值排序。

kernel ＝ np．ones（（5，5），np．uint8）

img ＝ cv2．morphologyEx（img， cv2．MORPH＿CLOSE， kernel， iterations＝ 3）

我們可以使用morphologyEx（）函數(shù)執(zhí)行操作。Morphology 中的“close”操作與Erosion相同，在此之前是Dilation過程。

我們將創(chuàng)建一個空白文檔，因為在處理邊緣時圖片里的內容會妨礙你，我們不想冒險刪除它們。

從捕獲的圖像中刪除背景

照片中非我們拍攝對象的部分也必須刪除。與裁剪圖像類似，我們將只專注于維護圖像所需的部分�？梢允褂肎rabCut庫。

GrabCut 在接收到輸入圖片及其邊界后，剔除邊界外的所有元素。

為了利用 GrabCut 來識別背景，我們還可以為用戶提供手動設置文檔邊框的選項。

不過，目前，GrabCut 將能夠通過從圖像的每個角落取 20 個像素作為背景來自動識別前景。

mask ＝ np．zeros（img．shape［：2］，np．uint8）

bgdModel ＝ np．zeros（（1，65），np．float64）

fgdModel ＝ np．zeros（（1，65），np．float64）

rect ＝（20，20，img．shape［1］－20，img．shape［0］－20）

cv2．grabCut（img，mask，rect，bgdModel，fgdModel，5，cv2．GC＿INIT＿WITH＿RECT）

mask2 ＝ np．where（（mask＝＝2）｜（mask＝＝0），0，1）．astype（＇uint8＇）

img ＝ img＊mask2［：，：，np．newaxis］

這里的“rect”變量表示我們愿意分離的邊界。你可能會遇到部分背景進入線條內部的情況，但這是可以接受的。我們的目標是對象的任何部分都不應超出邊界。

邊緣和輪廓檢測

我們目前擁有一份與原始文件大小相同的空白文件。同樣，我們將進行邊緣檢測。我們將為此使用Canny函數(shù)。

為了清理文檔的噪聲，我們還使用了高斯模糊。

（注意：Canny 函數(shù)僅適用于灰度圖像，因此如果圖像尚不存在，則將圖像轉換為灰度）。

gray ＝ cv2．cvtColor（img， cv2．COLOR＿BGR2GRAY）

gray ＝ cv2．GaussianBlur（gray，（11， 11）， 0）

＃ Edge Detection．

canny ＝ cv2．Canny（gray， 0， 200）

canny ＝ cv2．dilate（canny， cv2．getStructuringElement（cv2．MORPH＿ELLIPSE，（5， 5）））

我們在最后一行放大了圖像。

在此之后，我們可以繼續(xù)進行輪廓檢測：

我們只會記錄最大的輪廓并在一個新的空白文檔上進行交互。

gray ＝ cv2．cvtColor（img， cv2．COLOR＿BGR2GRAY）

gray ＝ cv2．GaussianBlur（gray，（11， 11）， 0）

＃ Edge Detection．

canny ＝ cv2．Canny（gray， 0， 200）

canny ＝ cv2．dilate（canny， cv2．getStructuringElement（cv2．MORPH＿ELLIPSE，（5， 5）））

識別角點

我們將使用已經注意到的四個角對齊紙張。使用“ Douglas－Peucker ”方法和approxPolyDp（）函數(shù)。

con ＝ np．zeros＿like（img）

＃ Loop over the contours．

for c in page：

＃ Approximate the contour．

epsilon ＝ 0．02 ＊ cv2．arcLength（c， True）

corners ＝ cv2．approxPolyDP（c， epsilon， True）

＃ If our approximated contour has four points

if len（corners）＝＝ 4：

break

cv2．drawContours（con， c，－1，（0， 255， 255）， 3）

cv2．drawContours（con， corners，－1，（0， 255， 0）， 10）

corners ＝ sorted（np．concatenate（corners）．tolist（））

for index， c in enumerate（corners）：

character ＝ chr（65 ＋ index）

cv2．putText（con， character， tuple（c）， cv2．FONT＿HERSHEY＿SIMPLEX， 1，（255， 0， 0）， 1， cv2．LINE＿AA）

標準化四點定位

def order＿points（pts）：

rect ＝ np．zeros（（4， 2）， dtype＝＇float32＇）

pts ＝ np．array（pts）

s ＝ pts．sum（axis＝1）

rect［0］＝ pts［np．argmin（s）］

rect［2］＝ pts［np．argmax（s）］

diff ＝ np．diff（pts， axis＝1）

rect［1］＝ pts［np．argmin（diff）］

rect［3］＝ pts［np．argmax（diff）］

return rect．astype（＇int＇）．tolist（）

尋找目的地坐標：

最后一組坐標可以改變圖像的視角。如果從通常的視角以一定角度拍攝，這將很有幫助。

（tl， tr， br， bl）＝ pts

＃ Finding the maximum width．

widthA ＝ np．sqrt（（（br［0］－ bl［0］）＊＊ 2）＋（（br［1］－ bl［1］）＊＊ 2））

widthB ＝ np．sqrt（（（tr［0］－ tl［0］）＊＊ 2）＋（（tr［1］－ tl［1］）＊＊ 2））

maxWidth ＝ max（int（widthA）， int（widthB））

＃ Finding the maximum height．

heightA ＝ np．sqrt（（（tr［0］－ br［0］）＊＊ 2）＋（（tr［1］－ br［1］）＊＊ 2））

heightB ＝ np．sqrt（（（tl［0］－ bl［0］）＊＊ 2）＋（（tl［1］－ bl［1］）＊＊ 2））

maxHeight ＝ max（int（heightA）， int（heightB））

＃ Final destination co－ordinates．

destination＿corners ＝［［0， 0］，［maxWidth， 0］，［maxWidth， maxHeight］，［0， maxHeight］］

透視變換

源照片的坐標現(xiàn)在必須與我們事先發(fā)現(xiàn)的目標坐標對齊。完成此階段后，圖像看起來就像是從紙張的正上方拍攝的一樣。

＃ Getting the homography．

M ＝ cv2．getPerspectiveTransform（np．float32（corners）， np．float32（destination＿corners））

final ＝ cv2．warpPerspective（orig＿img， M，（destination＿corners［2］［0］， destination＿corners［2］［1］）， flags＝cv2．INTER＿LINEAR）

現(xiàn)在很明顯，以一定角度拍攝的圖像現(xiàn)在已經被完美地掃描出來了。

測試觀察

已經在許多不同方向的照片上測試了這些代碼，你也可以這樣做。在每個樣例上，它都表現(xiàn)出色。

即使圖像的背景是白色（即類似于頁面本身顏色的顏色），GrabCut 也有效且清晰地定義了邊界線。

結論

本教程教我們如何使用 OpenCV 快速輕松地創(chuàng)建文檔掃描儀。

總結：

上傳圖片后，執(zhí)行了：

1. 生成與原始文件高度和寬度相同的空白文檔的形態(tài)學操作

2. 從圖像中刪除了背景。

3. 檢測到圖像中的輪廓和邊界。

4. 檢測到的圖像角點，以矩形的形式

5. 變換圖像的透視圖（如果有）

此文檔掃描儀的一些限制： 即使文檔的一部分在捕獲時位于邊界框架之外，該項目也應正常運行。但它也會導致不準確的透視變換。

廣泛使用的文檔掃描儀應用程序采用了幾種深度學習算法，因為它們的結果更加徹底和準確。

原文標題 : 使用 OpenCV 構建文檔掃描儀

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

登錄登錄即可訪問所有OFweek服務

用戶名/郵箱/手機：
密碼：
忘記密碼？
用其他賬號登錄： QQ | 微信 | 新浪微博

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞