當前位置: 首頁 > 工業(yè)電氣產(chǎn)品 > 端子與連接器 > 線路板連接器 > FFC連接器
發(fā)布日期:2022-05-18 點擊率:69
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。
目前絕大部分數(shù)字信息都是以圖片或視頻的形式存在的,若要對這些信息進行有效分析利用,則要依賴于機器視覺技術(shù)的發(fā)展,雖然目前已有的技術(shù)已經(jīng)能夠解決很多問題,但離解決所有問題還很遙遠,因此機器視覺的應(yīng)用前景還是非常廣闊的。
什么是機器視覺?
機器視覺是人工智能的一個重要分支,其核心是使用“機器眼”來代替人眼。機器視覺系統(tǒng)通過圖像/視頻采集裝置,將采集到的圖像/視頻輸入到視覺算法中進行計算,最終得到人類需要的信息。這里提到的視覺算法有很多種,例如,傳統(tǒng)的圖像處理方法以及近些年的深度學習方法等。
圖1-2a展示了一個由彩色圖像組成的、分類的數(shù)據(jù)集Cifar10,其中有飛機、汽車、鳥、貓、鹿、狗、青蛙、馬、船、卡車10個類別,且每個類別中都有1000張32×32的彩色圖片。圖1-2b展示的是不同算法在Cifar10數(shù)據(jù)集上的分類效果。
▲圖1-2a Cifar10數(shù)據(jù)集展示
▲圖1-2b 傳統(tǒng)圖像處理方法與深度學習方法在Cifar10數(shù)據(jù)集上的效果對比
從中我們可以看出,在深度學習出現(xiàn)以前,傳統(tǒng)的圖像處理和機器學習方法并不能很好地完成這樣一個簡單的分類任務(wù),而深度學習的出現(xiàn)使得機器有了達到人類水平的可能。事實上,AlphaGo的出現(xiàn)已經(jīng)證明了在一些領(lǐng)域,機器有了超越人類的能力。
由于深度學習技術(shù)的發(fā)展、計算能力的提升和視覺數(shù)據(jù)的增長,視覺智能計算技術(shù)在不少應(yīng)用當中都取得了令人矚目的成績。
圖像視頻的識別、檢測、分割、生成、超分辨、captioning、搜索等經(jīng)典和新生的問題紛紛取得了不小的突破。這些技術(shù)正廣泛應(yīng)用于城市治理、金融、工業(yè)、互聯(lián)網(wǎng)等領(lǐng)域。
以下將以9個場景為例,對一些常見的應(yīng)用場景進行介紹,讓讀者直觀地理解機器視覺都能解決哪些問題。
01 人臉識別
人臉識別(Face Recognition)是基于人的面部特征信息進行身份識別的一種生物識別技術(shù)。它通過采集含有人臉的圖片或視頻流,并在圖片中自動檢測和跟蹤人臉,進而對檢測到的人臉進行面部識別。人臉識別可提供圖像或視頻中的人臉檢測定位、人臉屬性識別、人臉比對、活體檢測等功能。
人臉識別是機器視覺最成熟、最熱門的領(lǐng)域,近幾年,人臉識別已經(jīng)逐步超過指紋識別成為生物識別的主導技術(shù)。人臉識別分為4個處理過程——人臉圖像采集及檢測、人臉圖像預處理、人臉圖像特征提取以及匹配與識別,其主要應(yīng)用及說明如下:
人臉支付:將人臉與用戶的支付渠道綁定,支付階段即可刷臉付款,無須出示銀行卡、手機等,提高支付效率(如圖1-3)
人臉開卡:客戶在銀行等部門開卡時,可通過身份證和人臉識別進行身份校驗,以防止借用身份證進行開卡
人臉登錄:用戶注冊階段錄入人臉圖片,在安全性要求較高的場景中啟動人臉登錄驗證,以提高安全性
VIP人臉識別:通過人臉識別自動確定客戶的身份,提供差異化服務(wù)
人臉簽到:活動開始前錄入人臉圖片,活動當天即可通過刷臉進行簽到,提高簽到效率
人臉考勤:利用高精度的人臉識別、比對能力,搭建考勤系統(tǒng),提升考勤效率,提高防作弊能力(如圖1-3所示)
人臉閘機:在機場、鐵路、海關(guān)等場合利用人臉識別確定乘客身份
會員識別:會員到店無須出示會員憑證,只要刷臉即可完成會員身份驗證,實現(xiàn)無卡化身份確認和人流統(tǒng)計
安防監(jiān)控:在銀行、機場、商場、市場等人流密集的公共場所對人群進行監(jiān)控,實現(xiàn)人流自動統(tǒng)計、特定人物的自動識別和追蹤
相冊分類:通過人臉檢測,自動識別照片庫中的人物角色,并進行分類管理,提升產(chǎn)品的用戶體驗
人臉美顏:基于人臉檢測和關(guān)鍵點識別,實現(xiàn)人臉的特效美顏、特效相機、貼片等互動娛樂功能
▲圖1-3 人臉識別應(yīng)用場景
由于人臉識別產(chǎn)業(yè)的需求旺盛,眾多大型科技公司和人工智能創(chuàng)業(yè)公司均有涉足該領(lǐng)域,目前該技術(shù)已經(jīng)處于大規(guī)模商用階段,未來3——5年仍將繼續(xù)保持高速增長。
02 視頻監(jiān)控分析
視頻監(jiān)控分析是利用機器視覺技術(shù)對視頻中的特定內(nèi)容信息進行快速檢索、查詢、分析的技術(shù)。由于攝像頭的廣泛應(yīng)用,由其產(chǎn)生的視頻數(shù)據(jù)已是一個天文數(shù)字,這些數(shù)據(jù)蘊藏的價值巨大,靠人工根本無法統(tǒng)計,而機器視覺技術(shù)的逐步成熟,使得視頻分析成為可能。
通過這項技術(shù),公安部門可以在海量的監(jiān)控視頻中搜尋到罪犯;在擁有大量流動人群的交通領(lǐng)域,該技術(shù)也被廣泛應(yīng)用于人群分析、防控預警等。
城市治理是視頻監(jiān)控分析應(yīng)用價值最高的領(lǐng)域之一,以下列舉了一些典型的應(yīng)用場景及說明:
交通擁堵治理:視頻分析技術(shù)可用于進行車輛檢測、車型識別、車牌識別、非機動車檢測、行人檢測、紅綠燈識別、車輛排隊長度、車輛通行速度、擁堵程度判斷分析。
識別、分析這些信息可用于實現(xiàn)交通態(tài)勢預測和紅綠燈優(yōu)化配置,從而緩解交通擁堵指數(shù),加快車輛通行速度,提升城市運行效率
異常事件檢測與軌跡跟蹤:視頻分析技術(shù)可用于檢測擁堵、逆行、違法停車、緩行、拋錨、事故、快速路上的行人和非機動車、路面拋灑物、路口行人大量聚集等異常交通事件的發(fā)生(如圖1-4)。
根據(jù)這些信息,一方面可以實時報警,由交警介入處理;另一方面,視頻索引可以實現(xiàn)高效的以圖搜圖查詢,通過車輛軌跡跟蹤保留證據(jù),實現(xiàn)非現(xiàn)場執(zhí)法,可以節(jié)省大量警力,并提升交通管理的效率
平安城市情報搜集分析:視頻分析技術(shù)可用于視頻中動態(tài)人臉和基礎(chǔ)人臉的實時比對,人群密度和不同方向人群流量的分析,智能研判、自動預警重點人員、重點車輛、重點物品在重點時間段出現(xiàn)在重點區(qū)域的有效線索,實現(xiàn)基于視頻數(shù)據(jù)的案件串并與動態(tài)人員管控,為嫌疑人建立地理畫像模型,提高主動防御、精確布控的水平,從海量視頻中追蹤罪犯成為可能
廠區(qū)安全管理:視頻分析技術(shù)可用于對廠區(qū)人員是否戴安全帽,是否在安全區(qū)域作業(yè)等安全管理問題進行分析,此技術(shù)還可應(yīng)用于其他有安全管控需求的區(qū)域,如礦山安全管理、倉庫管理等
門店客流分析:在商場或門店部署攝像裝置,利用視頻分析技術(shù),可實現(xiàn)識別顧客身份、分析顧客行為、指導導購人員進行精準推薦、監(jiān)控顧客異常行為等功能
▲圖1-4 交通異常事件監(jiān)測
視頻/監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,將視覺分析技術(shù)應(yīng)用于視頻監(jiān)控領(lǐng)域正在形成一種趨勢,目前已率先應(yīng)用于交通、安防、零售、社區(qū)、樓宇、校園、工地等場合。
03 工業(yè)瑕疵檢測
機器視覺技術(shù)可以快速獲取大量信息,并進行自動處理。在自動化生產(chǎn)過程中,人們將機器視覺系統(tǒng)廣泛應(yīng)用于工業(yè)瑕疵診斷、工況監(jiān)視和質(zhì)量控制等領(lǐng)域。
工業(yè)瑕疵診斷是指利用傳感器(如工業(yè)相機、X光等)將工業(yè)產(chǎn)品內(nèi)外部的瑕疵進行成像,通過機器學習技術(shù)對這些瑕疵圖片進行識別(如圖1-5),確定瑕疵的種類、位置,甚至對瑕疵產(chǎn)生的原因進行分析的一項技術(shù)。目前,工業(yè)瑕疵診斷已成為機器視覺的一個非常重要的應(yīng)用領(lǐng)域。
▲圖1-5 工業(yè)瑕疵診斷應(yīng)用場景
隨著制造業(yè)向智能化、無人化方向發(fā)展,以及人工成本的逐年上升,廣泛存在于制造業(yè)的產(chǎn)品外觀檢測迫切需要通過機器視覺技術(shù)替代人工外檢人員。
一方面圖像外檢技術(shù)可以運用到一些危險環(huán)境和人工視覺難以滿足要求的場合;另一方面,更重要的是,人工檢測面臨檢測速度慢、檢測準確率不穩(wěn)定(隨著人眼檢測時間的增加,檢測準確率明顯下降)、不同質(zhì)檢員的檢測水平不一致的情況,同時,質(zhì)檢員的責任心、狀態(tài)也會影響檢測水平,這些都會直接影響產(chǎn)品的品質(zhì)。
而圖像外檢技術(shù)可以大大提高生產(chǎn)效率、速度和生產(chǎn)的自動化程度,降低人工成本。
04 圖片識別分析
這里所說的圖片識別是指人臉識別之外的靜態(tài)圖片識別,圖片識別可應(yīng)用于多種場景,目前應(yīng)用比較多的是以圖搜圖、物體/場景識別、車型識別、人物屬性、服裝、時尚分析、鑒黃、貨架掃描識別、農(nóng)作物病蟲害識別等。
這里列舉一個圖像搜索的例子:拍立淘。拍立淘是手機淘寶的一個應(yīng)用,主要通過圖片來代替文字進行搜索,以幫助用戶搜索無法用簡單文字描述的需求。
比如,你看到一條裙子很好看,但又很難用簡單的語言文字來描述這條裙子的樣子,那么這個時候就可以使用拍立淘,通過圖片輕松地在淘寶上搜出同款裙子,或者是與它非常接近的款式,如圖1-6所示。
▲圖1-6 圖片識別應(yīng)用效果
05 自動駕駛/駕駛輔助
自動駕駛汽車是一種通過計算機實現(xiàn)無人駕駛的智能汽車,它依靠人工智能、機器視覺、雷達、監(jiān)控裝置和全球定位系統(tǒng)協(xié)同合作,讓計算機可以在沒有任何人類主動操作的情況下,自動安全地操作機動車輛(如圖1-7)。機器視覺的快速發(fā)展促進了自動駕駛技術(shù)的成熟,使無人駕駛在未來成為可能。
▲圖1-7 自動駕駛汽車應(yīng)用場景
自動駕駛技術(shù)鏈比較長,主要包含感知階段、規(guī)劃階段和控制階段三個部分。機器視覺技術(shù)主要應(yīng)用在無人駕駛的感知階段,其基本原理可概括如下。
使用機器視覺獲取場景中的深度信息,以幫助進行后續(xù)的圖像語義理解,在自動駕駛中幫助探索可行駛區(qū)域和目標障礙物。
通過視頻預估每一個像素的運動方向和運動速度。
對物體進行檢測與追蹤。在無人駕駛中,檢測與追蹤的目標主要是各種車輛、行人、非機動車。
對于整個場景的理解。最重要的有兩點,第一是道路線檢測,其次是在道路線檢測下更進一步,即將場景中的每一個像素都打成標簽,這也稱為場景分割或場景解析。
同步地圖構(gòu)建和定位技術(shù)。
06 三維圖像視覺
三維圖像視覺主要是對三維物體進行識別,其主要應(yīng)用于三維機器視覺、雙目立體視覺、三維重建、三維掃描、三維測繪、三維視覺測量、工業(yè)仿真等領(lǐng)域。三維信息相比二維信息,能夠更全面、真實地反映客觀物體,提供更大的信息量。
近年來,三維圖像視覺已經(jīng)成為計算機視覺領(lǐng)域的重要課題,在虛擬現(xiàn)實、文物保護、機械加工、影視特技制作、計算機仿真、服裝設(shè)計、科研、醫(yī)學診斷、工程設(shè)計、刑事偵查現(xiàn)場痕跡分析、自動在線檢測、質(zhì)量控制、機器人及許多生產(chǎn)過程中得到越來越廣泛的應(yīng)用。
07 醫(yī)療影像診斷
醫(yī)療數(shù)據(jù)中有90%以上的數(shù)據(jù)來自于醫(yī)療影像。醫(yī)療影像領(lǐng)域擁有孕育深度學習的海量數(shù)據(jù),醫(yī)療影像診斷可以輔助醫(yī)生做出判斷(如圖1-8),提升醫(yī)生的診斷效率。目前,醫(yī)療影像診斷主要應(yīng)用于如下場景中:
腫瘤探測:通過圖像技術(shù),醫(yī)療影像診斷可進行如皮膚色素瘤、乳腺癌、肺部癌變的早期識別
腫瘤發(fā)展追蹤:機器視覺技術(shù)可以根據(jù)器官組織的分布,預測出腫瘤擴散到不同部位的概率,并能從圖片中獲取癌變組織的形狀、位置、濃度等信息
血液量化與可視化:通過核磁共振圖像,醫(yī)療影像診斷可以更有效地再現(xiàn)心臟內(nèi)部血液的流量變化,并可探測心臟是否發(fā)生病變
病理解讀:不同醫(yī)生對于同一張圖片的理解可能會有不同,機器視覺技術(shù)可用于解讀圖片,并向醫(yī)生提供較為全面的報告,使醫(yī)生能夠了解到多種不同的病理可能性
糖尿病視網(wǎng)膜病變檢測:由糖尿病導致的視網(wǎng)膜病變是失明的一大主因,而早期治療可以有效減緩這一癥狀。機器視覺技術(shù)可以辨認出患者是否處于糖尿病視網(wǎng)膜病變早期,并能根據(jù)圖片像素判斷病情的發(fā)展程
圖1-8是肝臟及結(jié)節(jié)分割技術(shù)的影像分析結(jié)果。
▲圖1-8 肝臟及結(jié)節(jié)分割技術(shù),從左至右:CT原始影像、真實結(jié)果、算法結(jié)果
08 文字識別
計算機文字識別,俗稱光學字符識別(Optical Character Recognition),是利用光學掃描技術(shù)將票據(jù)、報刊、書籍、文稿及其他印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計算機輸入技術(shù)。該技術(shù)可應(yīng)用于如下場景中:
卡證類識別:如身份證、名片、行駛證、駕駛證、銀行卡、營業(yè)執(zhí)照、戶口本、簽證、房產(chǎn)證等證件類文字識別
票據(jù)類識別:定額發(fā)票、火車票、飛機票、出租車票等票據(jù)類文字識別
出版類識別:書籍、報刊等印刷物的識別
實體標識識別:道路指示牌識別(如圖1-9)、廣告牌識別等
▲圖1-9 文字識別技術(shù)的應(yīng)用場景
09 圖像/視頻的生成及設(shè)計
人工智能技術(shù)不僅可以對現(xiàn)有的圖片、視頻進行分析、編輯,還可以進行再創(chuàng)造。機器視覺技術(shù)可以快速、批量、自動化地進行圖片設(shè)計,因此其可為企業(yè)大幅度節(jié)省設(shè)計人力成本。
人工智能可以從藝術(shù)作品中抽象出視覺模式,然后將這些模式應(yīng)用于具有該作品的標志性特征的攝影圖像的幻想再現(xiàn)。這些算法還可以將任何粗糙的涂鴉轉(zhuǎn)換成令人印象深刻的繪畫,看起來就像是由描繪真實世界模型的專家級人類藝術(shù)家創(chuàng)建的一樣。
人工智能技術(shù)可以手繪人臉的草圖,并通過算法將其轉(zhuǎn)化為逼真的圖像;還可以指導計算機渲染任何圖像,使其看起來好像是由特定人類藝術(shù)家以特定風格創(chuàng)作的一樣;甚至可以對任何圖像、圖案圖形和其他不在源頭中的細節(jié)化腐朽為神奇。
機器視覺是實現(xiàn)工業(yè)自動化,工廠智慧化的關(guān)鍵零部件之一。一是工業(yè)4.0浪潮席卷全球,制造智能化必然帶來生產(chǎn)設(shè)備的升級;二是我國人口紅利優(yōu)勢逐漸弱化,制造廠商傾向于機器代人,減少人工成本;三是消費水平的升級,消費者對產(chǎn)品的品質(zhì)提出更高的要求,使得制造商加大質(zhì)量把控。三者環(huán)環(huán)相扣,為機器視覺的市場,在智能制造領(lǐng)域帶來新的發(fā)展契機。
許多北美的機器視覺廠商表示,十幾年前的中國,這些高端的視覺產(chǎn)品很難打開銷路。近幾年,國內(nèi)制造商家處于轉(zhuǎn)型升級期間,對這些高端的視覺產(chǎn)品,逐漸有了采購意愿。既然國內(nèi)機器視覺技術(shù)市場容量增大,那么從工業(yè)用戶角度看,如何看待如今的機器視覺市場呢?
在工業(yè)領(lǐng)域,機器視覺充當生產(chǎn)設(shè)備“眼睛”的功能,解決人眼無法識別、檢測的工作,實現(xiàn)效率好、成本低的經(jīng)濟效益,是視覺技術(shù)發(fā)展的出發(fā)點和落腳點。那么,對于客戶使用角度看,制造商更傾向高精度、高準確率,大視野自動變焦檢測,以及軟件的快速導入等方面。
首先是檢測的高精度,高準確率。這個是機器代替人眼最基礎(chǔ)的,也是最直接的目的。人工檢測容易產(chǎn)生疲態(tài),導致工作質(zhì)量不佳,并且精密制造領(lǐng)域,機器視覺比人眼有著絕對的優(yōu)勢。目前來看,機器視覺的測量和判斷,已經(jīng)非常成熟。例如,創(chuàng)科視覺的視覺系統(tǒng),在李群自動化的機器人應(yīng)用上,準確率一達到97%以上。
有些工廠生產(chǎn)物件體積龐大,對視覺檢測來說,是一項較大的挑戰(zhàn)。以往對大視野檢測,會采取兩種方法,一種是用兩個讀碼器覆蓋的方式,另一種是用高分辨率相機,加光源、鏡頭,再加上一些定制化軟件來操作。這兩種大視野檢測,需要有專業(yè)工程師做調(diào)試和維護,從客戶的使用和維護成本來說,都不算理想,所以很難進行大規(guī)模部署。康耐視在今年推出的DATAMAN370系列讀碼器,正是順應(yīng)客戶對大視野檢測的需求,并在PCD板、包裝、印刷等領(lǐng)域成功應(yīng)用。
從視覺技術(shù)軟件使用來說,開發(fā)商能否做到快速地系統(tǒng)導入,將在一定程度上決定客戶的接受度。對于系統(tǒng)來說,固然是越簡單越好。客戶視覺系統(tǒng)的使用,應(yīng)更傾向于“傻瓜式”的操作和開發(fā)。如創(chuàng)視科技開發(fā)視覺平臺CKVsionSDK,將眾多功能模塊化,如BLOB分析、算數(shù)運算、邏輯運算、色彩匹配等功能分為多個模塊,客戶根據(jù)自身的需求,將模塊快速導入應(yīng)用。
機器視覺是一項綜合技術(shù),其主要的市場分布在電子制造業(yè)、汽車制造、制藥、食品與包裝機械等領(lǐng)域。根據(jù)前瞻研究院報告數(shù)據(jù)顯示,電子制造業(yè)在機器視覺市場占比46.57%,汽車產(chǎn)業(yè)次之,占比為31.02%。此外,物流、食品、包裝、印刷等行業(yè)的滲透率也逐年的提高。
文章來源: 計算機視覺戰(zhàn)隊
下一篇: PLC、DCS、FCS三大控
上一篇: 利用 xNet 加強基于關(guān)