識別原理:模仿大腦建超級網絡 逐層分析數據

文章日期:2019年11月02日

【明報專訊】識別原理看似簡單,過程其實經過了一連串圖像處理及複雜運算,當中使用到深度神經網絡及深度學習技術。

人類大腦約有千億個神經元(神經細胞,下左圖),每個神經元由樹突、軸突和細胞體組成,樹突用來接收傳入信息,而軸突末端則和其他神經元連接,以傳遞信號,大腦內形成一個錯縱複雜的超級網絡,與腦細胞聯繫。

深度神經網絡(下右圖)是參考大腦神經網絡運作來分析數據,學習識別圖像。

網絡結構一般包含輸入層、隱藏層(兩層或以上)及輸出層,而每一層由多個神經元(激發函數)互相連接,並作出計算。

黃君義解釋,「人臉影像的每一像素(例如X1、X2、X3至X1000)顏色(數值)是一個輸入值,經神經元計算得出的輸出值,會傳給下一個神經元,成為該神經元的輸入值,餘此類推,逐層計算,直到最後一層輸出配對結果。」

藉大量樣本 從錯誤中「學習」

除了「深度神經網絡」技術,要提高識別的準確度,得靠深度學習技術。舉例說,從一群短髮的人中挑出所有女性,對電腦來說並不容易,但當提供大量人臉樣本給深度神經網絡「學習」,梳理出當中的特徵、辨識規律,電腦便懂得預測。「學習」過程中,如果電腦計算錯誤,會調整神經網絡的函數內容,並重新計算,直至得出正確數值。當神經網絡「學習」完成後,能準確識別人臉。

相關字詞﹕每日明報-FEATURE

RELATED