發(fā)布時間:2020-11-09 16:51:56
標(biāo)簽:監(jiān)控探頭如何識車牌
瀏覽(48214)
接上文
監(jiān)控探頭如何識別你的車牌?四通搬家公司通俗講解人工智能(上)
隨著硬件和算法的突破以及大規(guī)模神經(jīng)網(wǎng)絡(luò)的應(yīng)用,使得全天候的車牌定位和識別不再成為問題,那么如何具體實現(xiàn)呢?
02
—
字符分割
將車牌提取出來以后,還要進(jìn)行一次形態(tài)學(xué)處理和濾波器過濾,用來去除微小的干擾元素、粘連和噪點,圖像中非車牌字符的干擾越少,識別正確率就越高!
這時顏色對我們來說也沒有意義了,顏色并不會對字符識別有所幫助。因此我們用純粹的黑白圖像取代彩色的車牌圖像來簡化處理過程,這種圖像只包含純黑和純白,如果之前已經(jīng)把干擾基本消除了的話,我們會得到一張非常清晰的車牌圖像,有字或邊框的地方為純白,無字的背景是黑色。
四通搬家貨車的車牌經(jīng)過處理以后的圖像,比之前清晰很多了
現(xiàn)在,我們面臨一個問題,即分割出來的單字不能帶有邊框,否則會嚴(yán)重影響計算機(jī)的判斷。比如,如果數(shù)字1的上下都有橫線邊框,計算機(jī)可能會將其誤認(rèn)為是字母Z。還有一些家用轎車的車牌外延有一圈不銹鋼邊框,這個邊框的寬度如果不去除的話也會對識別造成很大干擾。
有兩種方法來消除邊框。
,由于邊框是白色,所以從上到下,每一行逐個查看像素是黑還是白,如果發(fā)現(xiàn)一整行的像素全都是白色,則判斷這行一定是邊框。同理,從左至右,每一列逐個查看像素黑白,也能判斷出左右兩端的邊框位置。
第二種方法更簡單,由于攝像頭位置固定,如果我們能保證每次提取出來的車牌圖像尺寸基本一致的話,根據(jù)我國公布的車牌格式標(biāo)準(zhǔn),把所有得到的車牌按比例直接剪裁掉一部分邊界區(qū)域就可以了。
另外,上下的鉚釘可以通過統(tǒng)計整行像素的躍變次數(shù)來去除(因為鉚釘所在的行的像素變化肯定少于有文字部分的行)。
去除了邊框和鉚釘
現(xiàn)在,我們終于得到了一張完美的不含任何干擾因素的車牌,可以開始分割單個字符了。這時就無法按照格式尺寸來直接切割了,因為不能保證拍攝到的車牌圖像尺寸如此精確到能夠按照比例正好分割到字符間隙的位置。
我們需要借助投影法來確定分割位置。所謂投影,就是對一整行或者一整列的像素數(shù)求和。這里要用到列投影也就是垂直投影,即從左至右統(tǒng)計每一列的像素總數(shù),然后畫出一張統(tǒng)計直方圖。
垂直投影展示了字符存在的7個區(qū)域,凡是有字符的地方就是有能量的(黃色),凡是不存在字符的列就是沒有能量的藍(lán)色
簡單地說,由于字符是白色,背景是黑色,那么車牌上字符之間的間隙就是白色像素數(shù)少的部分,通過上邊提到的的垂直投影就可以在直方圖上顯示出波峰和波谷,其中波谷也就是圖上藍(lán)色的能量的幾個位置,它們一定就是字符間隙,從這幾個位置下刀進(jìn)行分割一定錯不了!這樣就可以分割出7個獨立的字符了。
03
—
字符識別
終于進(jìn)入的識別模塊了!總得來說,單字的識別技術(shù)相對于車牌定位和字符分割來講是簡單的部分。
主要的字符識別方法有兩種:
模板匹配
深度神經(jīng)網(wǎng)絡(luò)
模板匹配:常用的識別方法。通過建立已知的字符模板庫,再將需要識別的單個字符與模板庫的字符進(jìn)行比較;也就是用待識別的字符與模板庫中的所有字符圖像逐一做減法,差異小的就是識別結(jié)果。這種方法速度快,但是在神經(jīng)網(wǎng)絡(luò)成熟以后,模板匹配就顯現(xiàn)出了不夠精準(zhǔn)的問題。例如,如果一幅在雨雪天氣中捕獲的不太清晰的車牌圖像,那么同為方塊字的結(jié)構(gòu)類似的漢字間的差異可能并不大,這就會造成識別錯誤。
深度神經(jīng)網(wǎng)絡(luò):和車牌定位中提到的神經(jīng)網(wǎng)絡(luò)是一個道理。將大量不同樣式的單個字符作為樣本,讓計算機(jī)通過神經(jīng)網(wǎng)絡(luò)去學(xué)習(xí)和訓(xùn)練,計算機(jī)就能具備分辨單個字符的能力。實際上,這樣的神經(jīng)網(wǎng)絡(luò)被稱為分類器,也就是將待識別的字符自動歸類到計算機(jī)在訓(xùn)練中學(xué)到的某一類型字符中。這種方法需要海量的各種情況下拍攝到的單個字符樣本,現(xiàn)在道路攝像頭用的識別模塊一般就是這種方法。在巨量訓(xùn)練樣本的加持下,神經(jīng)網(wǎng)絡(luò)具備對較模糊的漢字的精準(zhǔn)識別能力。更關(guān)鍵的是,通過有針對性的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)甚至能夠像人腦一樣對殘缺的字符進(jìn)行一定程度上的推測。
用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一小部分字符樣本
神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)能夠識別出目標(biāo)字符
終,我們得到了正確的結(jié)果!前邊的內(nèi)容看似很長,但隨著硬件的進(jìn)步、普及和成本的下降,內(nèi)置高性能處理芯片的監(jiān)控探頭設(shè)備可以在不足半秒的時間內(nèi)就完成上述所有的步驟。這些探頭無需將拍攝的照片傳回數(shù)據(jù)中心再處理,而是直接拍完就可以自我處理圖像并進(jìn)行識別,準(zhǔn)確率大于95%,通過4G或者有線網(wǎng)絡(luò)傳回識別結(jié)果就可以了,大大降低了交警數(shù)據(jù)中心的負(fù)荷。如果在不通網(wǎng)絡(luò)的地區(qū),則探頭設(shè)備會將識別結(jié)果自動存儲在內(nèi)置硬盤中,交警會定期去探頭所在地取回硬盤數(shù)據(jù)。
彩蛋
—
關(guān)于國外
歐洲的車牌自動識別起步很早,但是準(zhǔn)確率卻不盡如人意。以德國為例,根據(jù)統(tǒng)計,德國黑森州、薩克森和巴伐利亞州在2016到2017年抓拍到的共150萬張違章車牌圖片中,自動識別正確的僅有3萬余張,錯誤率竟然高達(dá)驚人的98%,簡直令人噴飯!不過,歐盟境內(nèi)各國不同的車牌書寫格式也是造成自動識別率低的一個原因。
德國道路卡口照片,左上角的識別結(jié)果將N4046識別成了N4346
由于未處理好鉚釘問題,將JK識別成了UK
識別結(jié)果漏掉了首字母H,仍是未處理好鉚釘造成的粘連問題。
其實,歐洲具備起步很早的光學(xué)字符識別技術(shù)(OCR),可能你在將紙上的文字掃描進(jìn)入電腦并直接形成可編輯的電子文檔時用過這種技術(shù)。對于完全由字母和數(shù)字組成的歐洲車牌來講,借助一種基于類似水域分割和圖論的思想配合成熟的字母數(shù)字OCR模塊可以簡單高效地自動分割并識別字符。上述德國三個州發(fā)生的這種過高的錯誤率應(yīng)該是由于部署了未經(jīng)針對性訓(xùn)練或者設(shè)置了不恰當(dāng)閾值參數(shù)的監(jiān)控設(shè)備所導(dǎo)致的。
OCR掃描筆可以快速將紙上文字錄入電腦
四通搬家保障
讓您放心搬家
爽約5倍賠
期詐3倍賠
亂收費2倍賠