㈠ dtwDTW演算法原理
在孤立詞語音識別中,DTW(動態時間歸整)演算法因其簡單有效性而被廣泛應用。該演算法基於動態規劃思想,解決了因發音長短不一導致的模板匹配問題。相較於HMM演算法在訓練階段需要大量數據和復雜計算,DTW演算法在訓練和建立模板階段幾乎無需額外計算,因此在孤立詞語音識別中仍得到廣泛使用。
在識別過程中,先通過端點演算法確定語音的起點和終點。參考模板(已存入模板庫的詞條)和測試模板(要識別的詞條語音)通常採用相同類型的特徵矢量(如MFCC、LPC系數),具有相同的幀長、窗函數和幀移。計算參考模板與測試模板之間的距離,以此評估相似度。距離函數常採用歐氏距離,若兩模板長度不一致,則通過線性擴張將測試模板映射為與參考模板相同長度的序列,再計算距離。然而,這種方法未考慮到語音中各段在不同情況下的持續時間變化,識別效果可能不佳。
為解決上述問題,採用動態規劃(DP)方法。將測試和參考模板的幀號標在二維直角坐標系中,通過這些點形成網路,尋找一條從左下角到右上角的路徑,路徑中的每個點代表計算的幀號。所選路徑從發音快慢變化的角度出發,確保發音順序不變。路徑可用函數描述,通過約束斜率在0.5~2范圍內,確保路徑不過於傾斜。
最優路徑問題可歸結為:在滿足約束條件下,尋找具有最小累積距離的路徑。路徑搜索策略從左下角出發,遍歷網路中的點,每通過一個點時計算累積距離,並保留最小累積距離的路徑。對於每個點,其前一個可到達的點僅限於左側、左上側和左上側的左側兩點,通過比較到達每個點的路徑累積距離,選擇最小值作為當前點的路徑距離。
實現DTW演算法時,使用兩個矩陣:積累距離矩陣D和幀匹配距離矩陣d。矩陣中的d(i,j)表示測試模板第i幀與參考模板第j幀之間的距離;D(N,M)表示最佳匹配路徑對應的匹配距離。通過DP演算法,可以高效地找到最佳路徑,從而進行語音識別。
總之,DTW演算法通過動態規劃的方法,解決了孤立詞語音識別中的模板匹配問題,為語音識別領域提供了有效解決方案。
㈡ 人臉識別的識別演算法
人臉識別的基本方法
人臉識別的方法很多,以下介紹一些主要的人臉識別方法。
(1)幾何特徵的人臉識別方法
幾何特徵可以是眼、鼻、嘴等的形狀和它們之間的幾何關系(如相互之間的距離)。這些演算法識別速度快,需要的內存小,但識別率較低。
(2)基於特徵臉(PCA)的人臉識別方法
特徵臉方法是基於KL變換的人臉識別方法,KL變換是圖像壓縮的一種最優正交變換。高維的圖像空間經過KL變換後得到一組新的正交基,保留其中重要的正交基,由這些基可以張成低維線性空間。如果假設人臉在這些低維線性空間的投影具有可分性,就可以將這些投影用作識別的特徵矢量,這就是特徵臉方法的基本思想。這些方法需要較多的訓練樣本,而且完全是基於圖像灰度的統計特性的。目前有一些改進型的特徵臉方法。
(3)神經網路的人臉識別方法
神經網路的輸入可以是降低解析度的人臉圖像、局部區域的自相關函數、局部紋理的二階矩等。這類方法同樣需要較多的樣本進行訓練,而在許多應用中,樣本數量是很有限的。
(4)彈性圖匹配的人臉識別方法
彈性圖匹配法在二維的空間中定義了一種對於通常的人臉變形具有一定的不變性的距離,並採用屬性拓撲圖來代表人臉,拓撲圖的任一頂點均包含一特徵向量,用來記錄人臉在該頂點位置附近的信息。該方法結合了灰度特性和幾何因素,在比對時可以允許圖像存在彈性形變,在克服表情變化對識別的影響方面收到了較好的效果,同時對於單個人也不再需要多個樣本進行訓練。
(5)線段Hausdorff 距離(LHD) 的人臉識別方法
心理學的研究表明,人類在識別輪廓圖(比如漫畫)的速度和准確度上絲毫不比識別灰度圖差。LHD是基於從人臉灰度圖像中提取出來的線段圖的,它定義的是兩個線段集之間的距離,與眾不同的是,LHD並不建立不同線段集之間線段的一一對應關系,因此它更能適應線段圖之間的微小變化。實驗結果表明,LHD在不同光照條件下和不同姿態情況下都有非常出色的表現,但是它在大表情的情況下識別效果不好。
(6)支持向量機(SVM) 的人臉識別方法
近年來,支持向量機是統計模式識別領域的一個新的熱點,它試圖使得學習機在經驗風險和泛化能力上達到一種妥協,從而提高學習機的性能。支持向量機主要解決的是一個2分類問題,它的基本思想是試圖把一個低維的線性不可分的問題轉化成一個高維的線性可分的問題。通常的實驗結果表明SVM有較好的識別率,但是它需要大量的訓練樣本(每類300個),這在實際應用中往往是不現實的。而且支持向量機訓練時間長,方法實現復雜,該函數的取法沒有統一的理論。
人臉識別的方法很多,當前的一個研究方向是多方法的融合,以提高識別率。
在人臉識別中,第一類的變化是應該放大而作為區分個體的標準的,而第二類的變化應該消除,因為它們可以代表同一個個體。通常稱第一類變化為類間變化,而稱第二類變化為類內變化。對於人臉,類內變化往往大於類間變化,從而使在受類內變化干擾的情況下利用類間變化區分個體變得異常困難。正是基於上述原因,一直到21 世紀初,國外才開始出現人臉識別的商用,但由於人臉識別演算法非常復雜,只能採用龐大的伺服器,基於強大的計算機平台。
如果可以的話,可以Te一下colorreco,更好的技術解答。