字體:小 中 大 |
|
|
|
| 2025/05/18 03:45:39瀏覽735|回應0|推薦5 | |
最近在繼續研究貨櫃碼的辨識,當然辨識能力是一直在優化提升的!一個有趣的狀況是:我們通常一開始不會預知要辨識的貨櫃碼在影像中的甚麼位置?如果知道,當然辨識區就可以縮小,辨識速度會快一點,就是所謂的設定辨識熱區啦! 但是通常這種辨識是守株待兔的,就是攝影機固定等著貨櫃車經過,拍到影像時不保證貨櫃碼會在影像正中央,就必須全圖找透透,把所有可能是貨櫃碼的目標都一一仔細分析!如果碰到上面的情況就好玩了!想當然耳,使用者想辨識的應該是前面的黃色貨櫃,但是我的軟體辨識能力太強了!連後面白色貨櫃上的貨櫃碼也可以清晰辨識! 所以事實上在複雜畫面中可能的貨櫃碼答案通常不只一個!就像多數招生或徵人考試,考生都會多於錄取名額!使用者看到的唯一答案其實是經過各種合格條件篩選之後,如果答案還是多於一個,就會以某個條件擇優錄取!上例有趣的是背後的貨櫃碼字形符合度還略高於前面的貨櫃,所以是有可能乞丐趕廟公,喧賓奪主的! 這就是辨識能力太強的甜蜜負擔了!大家看到了嗎?這個影像是1080 X 720 = 777600大約80萬畫素,我只用0.12秒就找出兩個正確的貨櫃碼了!如果參數設定說合格答案要通通列出來,就會是如上的答案!如果設定只要一個答案呢?要合乎一般人的直覺期望就不能呆呆的選「最像」的!而是要選字體最大或位置最接近畫面中間的!否則路人甲就可能會意外變成主角了! 有客戶問那最多一次可以辨識多少個貨櫃碼呢?事實上是沒有限制的!因為我們辨識前不會預先知道有多少可能的目標?所以處理程序都是全部進行檢視辨識的!如果合格的都列出,就會有很多個,除非使用者設定上限,否則有多少就會輸出多少! 簡單說,按照我的辨識邏輯過程,多目標或單目標的辨識時間是差不多的!設定單一目標辨識只是所有目標辨識完畢之後選個最合理的冠軍而已!當然如果沒有任何合格的目標,答案就從缺了! 我總是想強調的重點是:影像辨識就是可以作到這麼快速有效,只要用一般電腦就可以跑得很好的!重點是你絕對不能用機器學習(ML)、深度學習(DL)與類神經網路(CNN)等等統計學的技術!任何使用ML、DL與CNN做的影像辨識都不可能那麼快還那麼準的!而且運算量會大幾十倍,價格當然也會貴很多倍!大家不可不知!稱呼ML、DL與CNN是「AI」影像辨識技術?這是我目前聽過最大的謊言!因為它們真的速度又慢又不準,超級不AI的! |
|
| ( 心情隨筆|工作職場 ) |


字體:







