2020-02-11
AI人工智能(néng)知識理解篇—計算機視覺技術
1.計算機視覺技術(ComputerVision),什麼(me)是計算機視覺?
“人的大腦皮層的活動,大約70%是在處理視覺相關信息。視覺就相當于人腦的大門,其它如聽覺、觸覺、味覺那都(dōu)是帶寬較窄的通道(dào)。視覺相當于八車道(dào)的高速,其它感覺是兩(liǎng)旁的人行道(dào)。如果不能(néng)處理視覺信息的話,整個人工智能(néng)系統是個空架子,隻能(néng)做符号推理,比如下棋、定理證明,沒(méi)法進(jìn)入現實世界。計算機視覺之于人工智能(néng),它相當于說芝麻開(kāi)門。大門就在這(zhè)裡(lǐ)面(miàn),這(zhè)個門打不開(kāi),就沒(méi)法研究真實世界的人工智能(néng)。”——朱松純,加州大學(xué)洛杉矶分校UCLA統計學(xué)和計算機科學(xué)教授根據科普中國(guó)撰寫的對(duì)計算機視覺的定義,這(zhè)是一門研究如何讓機器“看”的科學(xué),更進(jìn)一步的說,是指用計算機代替人眼對(duì)目标進(jìn)行識别、跟蹤和測量的機器視覺,并進(jìn)一步做圖形處理,使計算機處理成(chéng)爲更适合人眼觀察或傳送給儀器檢測的圖像。
2.計算機視覺VS機器視覺
計算機視覺更關注圖像信号本身以及圖像相關交叉領域(地圖、醫療影像)的研究;機器視覺則偏重計算機視覺技術工程化,更關注廣義上的圖像信号(激光和攝像頭)和自動化控制(生産線)方面(miàn)的應用。
3.計算機視覺識别技術的分類
物體識别分爲“1VSN”對(duì)不同物體進(jìn)行歸類,以及“1VS1”對(duì)同類型的物體進(jìn)行區分和鑒别;物體屬性識别,結合地圖模型讓物體在視覺的三維空間裡(lǐ)得到記憶的重建,進(jìn)而進(jìn)行場景的分析和判斷;物體行爲識别分爲3個進(jìn)階的步驟,移動識别判斷物體是否做了位移,動作識别判斷物體做的是什麼(me)動作,行爲識别是結合視覺主體和場景的交互做出行爲的分析和判斷。
4.計算機視覺的識别流程
訓練模型:樣本數據包括正樣本(包含待檢目标的樣本)和負樣本(不包含目标的樣本),視覺系統利用算法對(duì)原始樣本進(jìn)行特征的選擇和提取訓練出分類器(模型);此外因爲樣本數據成(chéng)千上萬、提取出來的特征更是翻番,所以一般爲了縮短訓練的過(guò)程,會人爲加入知識庫(提前告訴計算機一些規則),或者引入限制條件來縮小搜索空間。
識别圖像:會先對(duì)圖像進(jìn)行信号變換、降噪等預處理,再來利用分類器對(duì)輸入圖像進(jìn)行目标檢測。一般檢測過(guò)程爲用一個掃描子窗口在待檢測的圖像中不斷的移位滑動,子窗口每到一個位置就會計算出該區域的特征,然後(hòu)用訓練好(hǎo)的分類器對(duì)該特征進(jìn)行篩選,判斷該區域是否爲目标。
5.計算機視覺技術模式圖和對(duì)應企業圖
目前世界上圖像識别最大的數據庫,是斯坦福大學(xué)人工智能(néng)實驗室提供的ImageNet,針對(duì)諸如醫療等細分領域也需要收集相應的訓練數據;Google、Microsoft此類科技巨頭會面(miàn)向(xiàng)市場提供開(kāi)源算法框架,爲初創視覺識别公司提供初級算法。
責任編輯:中山網站建設
【網訊網絡】國(guó)家高新技術企業》十一年專注軟件開(kāi)發(fā),網站建設,網頁設計,APP開(kāi)發(fā),小程序,微信公衆号開(kāi)發(fā),定制各類企業管理軟件(OA、CRM、ERP、OMS訂單管理系統、WMS進(jìn)銷存管理軟件等)!服務熱線:0760-88610046、13924923903,http://www.wansion.net
*請認真填寫需求,我們會在24小時内與您取得聯系。