• 用卓越的智能視覺算法賦能商業
    用卓越的智能視覺算法賦能商業 基于正覺智能自(zì)主研發的AI視頻圖像分(fēn)析算法,提供軟硬一體(tǐ)交付形态,爲園區、樓宇、學校(xiào)、社區、工(gōng)廠(chǎng)等場景提供基于AI識别模型的智能服務
    查看(kàn)詳情

行業前瞻

資訊分(fēn)類

計(jì)算機(jī)如(rú)何看(kàn)世界?如(rú)何看(kàn)懂(dǒng)世界?計(jì)算機(jī)視覺基礎原理(lǐ) 

  • 分(fēn)類:行業前瞻
  • 作(zuò)者:
  • 來(lái)源:
  • 發布時間:2022-09-21
  • 訪問(wèn)量:0

【概要描述】計(jì)算機(jī)視覺是一門(mén)研究如(rú)何讓機(jī)器“看(kàn)見(jiàn)”的科(kē)學。進一步說(shuō),是指用攝像機(jī)和計(jì)算機(jī)代替人(rén)眼對物體(tǐ)進行識别、跟蹤和測量,并進一步做圖形處理(lǐ),然後用計(jì)算機(jī)處理(lǐ)出更适合人(rén)眼觀察的圖像或傳輸到儀器上進行檢測。

計(jì)算機(jī)如(rú)何看(kàn)世界?如(rú)何看(kàn)懂(dǒng)世界?計(jì)算機(jī)視覺基礎原理(lǐ) 

【概要描述】計(jì)算機(jī)視覺是一門(mén)研究如(rú)何讓機(jī)器“看(kàn)見(jiàn)”的科(kē)學。進一步說(shuō),是指用攝像機(jī)和計(jì)算機(jī)代替人(rén)眼對物體(tǐ)進行識别、跟蹤和測量,并進一步做圖形處理(lǐ),然後用計(jì)算機(jī)處理(lǐ)出更适合人(rén)眼觀察的圖像或傳輸到儀器上進行檢測。

  • 分(fēn)類:行業前瞻
  • 作(zuò)者:
  • 來(lái)源:
  • 發布時間:2022-09-21
  • 訪問(wèn)量:0
詳情

計(jì)算機(jī)如(rú)何看(kàn)世界?如(rú)何看(kàn)懂(dǒng)世界?  

 

 

 

  • 人(rén)工(gōng)智能是來(lái)模拟人(rén)類認知能力的技術(shù)。人(rén)工(gōng)智能最核心的能力就(jiù)是根據給定的輸入,做出判斷和預測。例如(rú):在人(rén)臉識别應用中,它是根據輸入的照(zhào)片判斷照(zhào)片中的人(rén)是誰。

 

  • 計(jì)算機(jī)視覺是一門(mén)研究如(rú)何讓機(jī)器“看(kàn)見(jiàn)”的科(kē)學。進一步說(shuō),是指用攝像機(jī)和計(jì)算機(jī)代替人(rén)眼對物體(tǐ)進行識别、跟蹤和測量,并進一步做圖形處理(lǐ),然後用計(jì)算機(jī)處理(lǐ)出更适合人(rén)眼觀察的圖像或傳輸到儀器上進行檢測。

 

  • 計(jì)算機(jī)視覺作(zuò)爲一門(mén)科(kē)學學科(kē),研究相(xiàng)關的理(lǐ)論和技術(shù),試圖建立一個能夠從(cóng)圖像或多維數據中獲取‘信息’的人(rén)工(gōng)智能系統,這裡(lǐ)的信息指的是香農定義的信息,可(kě)以用來(lái)幫助做“決策”。因爲感知可(kě)以看(kàn)作(zuò)是從(cóng)感官信号中提取信息,所以計(jì)算機(jī)視覺也可(kě)以看(kàn)作(zuò)是研究如(rú)何讓人(rén)工(gōng)系統從(cóng)圖像或多維數據中“感知”的科(kē)學。

 

 

 

 

 

 


在技術(shù)分(fēn)類上,依據應用場景一般分(fēn)類爲工(gōng)業視覺和計(jì)算機(jī)視覺

 

 

 

 

 

 

在應用分(fēn)類上,分(fēn)爲工(gōng)業檢測類以及肉眼可(kě)見(jiàn)類型檢測

 

 
工(gōng)業檢測類:瑕疵檢測、高精度尺寸檢測、産品外觀檢測、工(gōng)器具外觀檢測、工(gōng)藝檢測(印花、噴塗等),替代人(rén)眼檢查
 
肉眼可(kě)見(jiàn)類檢測:動作(zuò)檢測、物品檢測、顔色檢測、流程檢測、車輛(liàng)檢測、人(rén)臉檢測,基本爲人(rén)眼可(kě)見(jiàn)的形态,主要爲減輕人(rén)員(yuán)大(dà)量檢查的攝像頭的時間
 
 
 
 
人(rén)的視覺,我們是怎麽看(kàn)懂(dǒng)事(shì)物的?
 
 
 
視網膜是含有光(guāng)感受器官和神經阻滞網絡的薄膜,光(guāng)刺激在視網膜上經神經處理(lǐ)産生(shēng)的神經沖動沿視神經纖維傳出眼睛,通過視覺神經傳出大(dà)腦皮層進行處理(lǐ)并最終引起知覺,或者說(shuō)在大(dà)腦中刺激對光(guāng)刺激産生(shēng)影(yǐng)響,形成關于場景的表象,大(dà)腦皮層要完成一系列處理(lǐ)工(gōng)作(zuò),從(cóng)圖像存儲直到根據圖像做出響應。
 
 
 
 

STEP1 看(kàn)見(jiàn)事(shì)物

光(guāng)刺激視網膜接收,并通過視網膜傳導。

 

 

STEP2 大(dà)腦處理(lǐ)

1. 參考存儲的圖像(素材)

2. 特征提取:例如(rú)形狀、顔色、位置、物理(lǐ)法則、聯想

3. 判斷确認

 

 

STEP3 進行描述

根據目标的特征、物理(lǐ)邏輯、聯想等手段确認唯一的答案後,進行描述。

 

 

 

 
 
 
 
計(jì)算機(jī)的視覺,計(jì)算機(jī)是怎麽看(kàn)懂(dǒng)事(shì)物的?
 
 
在計(jì)算機(jī)視覺種主要研究的三維場景中的對象,包括人(rén)、物、環境三大(dà)塊,針對三維場景中的三維信息(幾何、表現、行爲)處理(lǐ)。
 
 

STEP1  看(kàn)見(jiàn)事(shì)物

通過數字攝像頭拍(pāi)攝物體(tǐ)獲得(de)物品得(de)圖像數據。

 

 

STEP2 模型處理(lǐ)
 

1. 多層次特征提取:例如(rú)形狀、顔色、位置等

2. 分(fēn)類

3. 壓縮

4. 關聯

 

 

STEP4 給出結果

根據目标的特征、物理(lǐ)邏輯等技術(shù)方式确認出多個答案,選取其中置信度較高的進行描述。

 

 

  

 

 

 肉眼能分(fēn)清的不代表計(jì)算機(jī)可(kě)以識别

 

 

 

 

人(rén)類在判斷一件(jiàn)物品或者行爲時的時候是基于多年(nián)積累的經驗,并且帶有橫向的聯想,例如(rú)判斷是不是足球,你(nǐ)會聯想到國(guó)足踢過。計(jì)算機(jī)做出的判斷隻能根據特征,還(hái)是人(rén)爲規定好的特征,當超出規定範圍的特征出現時,就(jiù)無法識别了。 通過以上說(shuō)明,我們會了解人(rén)的感知過程和計(jì)算機(jī)的識别有一定邏輯雷同,但(dàn)也存在事(shì)實上的差異,人(rén)眼中看(kàn)到的簡單事(shì)物也許對于計(jì)算機(jī)來(lái)說(shuō)是漫長複雜的判斷過程與計(jì)算公式,這是因爲計(jì)算機(jī)描述畫(huà)面的過程與人(rén)類有差異。在采集素材的過程中,真實的環境對識别結果也會産生(shēng)較大(dà)影(yǐng)響,特别是光(guāng)線環境的變化,體(tǐ)現在戶外、室内的應用都(dōu)會導緻準确率上的差異。

 

關鍵詞:

掃二維碼用手機(jī)看(kàn)

地址:上海市徐彙區浦北路(lù)7号中星城(chéng)1910号

電話(huà):4000-594188

版權所有 © 2021 上海領壹信息科技有限公司     

網站(zhàn)建設:中企動力  上海浦西