:::

文章專欄

首頁\
文章專欄

主題：人工智慧在視覺辨識的應用

2022/01/10

一般人們對於環境狀態的理解方式最常依賴「視覺(Vision)」，也就是「眼觀四面」的概念，透過視覺進行環境狀態的判別，並且在大腦中產生正確的意識，從而進行行動策略的依據，例如：開車「看到」行人、障礙物等必須進行閃避的動作，「看到」標線、標誌等必須進行遵循前進的方向等，這些類似的反應動作，其實不單是開車而已，生活情境中有著許多的類似的例子，這裡就不再贅述。

而人工智慧在「視覺辨識」的發展也是非常重要的，目前視覺辨識技術應用涵蓋著以下領域：

分類(Classificatin)，知道看到什麼。
目標偵測(Objetct Detection)，知道看到什麼，並且知道在哪裡。
分割(Segmentation)，知道看到什麼，知道在哪裡，更知道其外型。
風格轉換(Style Transfer)，知道看到什麼，還知道可以怎麼轉變其風格。

以上四類的視覺辨識技術應用，其實就是以符合人類以視覺判斷外界環境的並且產生意識的過程，這些視覺辨識的技術，在人工智慧實現的方式，以目前而言大都會採用深度學習的方式進行處理，透過類神經網路的訓練與推論驗證進行設計與應用。

由於視覺辨識技術應用於對環境的探測通常都有著需要「即時(Real Time)」反應的需求，且通常視覺辨識的資料量都是相對龐大，因此視覺辨識所採用的計算機平台在運算能力上就必須要有一定水準以上的效能，目前對於需要即時反應需求的做法，最常採用「邊緣運算(Edge Computing)」，也就是在環境當中架設一套專門用以進行環境視覺辨識的裝置，這套裝置必須要能夠獨立運作，不能過度倚賴網路雲端的服務(試想，萬一網路通訊環境訊號不良怎麼辦?)，當然若有網路通訊環境，這套邊緣運算裝置還可以透過雲端服務進行監控，這會有加分的效果，但目前視覺辨識的應用，大都已經在邊緣運算裝置進行開發，也是目前的發展趨勢了。

人工智慧的視覺辨識技術，目前也是仰賴「機器學習」技術進行系統演算法的訓練，主要的流程如下：

訓練用的影像資料集的建立
影像資料的前處理
深度學習類神經網路模型的訓練
類神經網路模型的推論驗證
佈署類神經網路模型至計算機設備
測試計算機設備實際運作視覺辨識的效能
評估是否進行修正策略

以上這7個過程，基本上1至4都是人工智慧演算法運作的過程，5至7則是人工智慧佈署與應用的過程，這裡每個過程就目前發展趨勢來看，已經朝向「雲端運算」與「邊緣運算」整合的方向發展。(輪替)熱門時事、產品知識、生活常識、網友分享、新聞、影片張貼、病毒式行銷、事件或過程。

目前人工智慧在視覺辨識系統的應用例，在各種領域裡都有大放異彩的表現，以下酌量列出相關的應用領域：

教育應用，在本次新冠疫情之後，人們開始思考遠距教學實施的各種問題，實施遠距教學首先除了是要面對網路通訊問題之外，還要面對各種視訊環境的運作方式，透過人工智慧視覺辨識系統，可以進行學生的各種學習過程的評估，從是否專心於線上課程學習到課程評量測驗施測的管理，都可以是透過視覺辨識的方式進行，教師透過人臉表情的識別可以進行學生的學習專注度的評估等。
智慧商店，視覺辨識可以進行以下商店運作的行為，如：來客辨識偵測、商品辨識結帳、商品貨架管理、商店保全監控等，近年來，各大雲端服務大廠更是將智慧商店的雲端服務做到非常完善，從商店端各類狀況的監控，到各種商品營收的後台資料庫管理，透過雲端運算更讓智慧商店朝向「無人化」的方向發展。
智慧製造，其實「智慧製造」一詞，在很久之前就已經提出，而視覺辨識在其應用更是行之有年，只是近年來隨著製造工藝不斷提升，對於工廠內的各種生產情境的管控，讓視覺辨識技術要朝向「極高精度」、「極快反應」與「遠端佈署」的方向發展，最顯而易見的就是各種「智慧工業檢測」技術不斷提升，大幅度提高高精度需求的產品生產的良率。

CAVEDU教育團隊講師
曾俊霖

回上頁回首頁