識別原理：模仿大腦建超級網絡逐層分析數據

文章日期：2019年11月02日

Share

（明報製圖）

prev next

【明報專訊】識別原理看似簡單，過程其實經過了一連串圖像處理及複雜運算，當中使用到深度神經網絡及深度學習技術。

人類大腦約有千億個神經元（神經細胞，下左圖），每個神經元由樹突、軸突和細胞體組成，樹突用來接收傳入信息，而軸突末端則和其他神經元連接，以傳遞信號，大腦內形成一個錯縱複雜的超級網絡，與腦細胞聯繫。

深度神經網絡（下右圖）是參考大腦神經網絡運作來分析數據，學習識別圖像。

網絡結構一般包含輸入層、隱藏層（兩層或以上）及輸出層，而每一層由多個神經元（激發函數）互相連接，並作出計算。

黃君義解釋，「人臉影像的每一像素（例如X1、X2、X3至X1000）顏色（數值）是一個輸入值，經神經元計算得出的輸出值，會傳給下一個神經元，成為該神經元的輸入值，餘此類推，逐層計算，直到最後一層輸出配對結果。」

藉大量樣本從錯誤中「學習」

除了「深度神經網絡」技術，要提高識別的準確度，得靠深度學習技術。舉例說，從一群短髮的人中挑出所有女性，對電腦來說並不容易，但當提供大量人臉樣本給深度神經網絡「學習」，梳理出當中的特徵、辨識規律，電腦便懂得預測。「學習」過程中，如果電腦計算錯誤，會調整神經網絡的函數內容，並重新計算，直至得出正確數值。當神經網絡「學習」完成後，能準確識別人臉。

相關字詞﹕每日明報-FEATURE