1. HMM實現中文分詞中維比特演算法運行出現問題
乍一聽似乎很玄妙,但是其實很簡單。下面是相關參數介紹,也是第一眼覺得很抽象,但是慢慢看下去隨著具體含義的解釋就漸漸清晰。
HMM(Hidden Markov Model): 隱式馬爾科夫模型。
HMM模型可以應用在很多領域,所以它的模型參數描述一般都比較抽象,以下篇幅針對HMM的模型參數介紹直接使用它在中文分詞中的實際含義來講:
HMM的典型介紹就是這個模型是一個五元組:
StatusSet: 狀態值集合
ObservedSet: 觀察值集合
TransProbMatrix: 轉移概率矩陣
EmitProbMatrix: 發射概率矩陣
2. HMM是什麼意思
隱馬爾可夫模型(HMM)是指隱馬爾可夫模型,是一種用於描述參數未知的馬爾可夫過程的統計模型。困難在於從可觀察的參數中確定過程的隱藏參數。這些參數然後被用於進一步的分析,例如模式識別。
隱馬爾可夫模型最早是由倫納德·鮑姆(Leonard E. Baum)和其他作者在20世紀60年代下半葉的一系列統計論文中描述的。隱馬爾可夫模型的最初應用之一是語音識別,始於20世紀70年代中期。
20世紀80年代後半期,隱馬爾可夫模型開始應用於生物序列的分析,特別是DNA。自此,隱馬爾可夫模型逐漸成為生物信息學領域不可或缺的技術。

3)參數不變性假設。上面介紹的三大要素不隨時間的變化而改變,即在整個訓練過程中一直保持不變。
3. 語音識別文件的聲學模型
語音識別系統的模型通常由聲學模型和語言模型兩部分組成,分別對應於語音到音節概率的計算和音節到字概率的計算。本節和下一節分別介紹聲學模型和語言模型方面的技術。
HMM聲學建模:馬爾可夫模型的概念是一個離散時域有限狀態自動機,隱馬爾可夫模型HMM是指這一馬爾可夫模型的內部狀態外界不可見,外界只能看到各個時刻的輸出值。對語音識別系統,輸出值通常就是從各個幀計算而得的聲學特徵。用HMM刻畫語音信號需作出兩個假設,一是內部狀態的轉移只與上一狀態有關,另一是輸出值只與當前狀態(或當前的狀態轉移)有關,這兩個假設大大降低了模型的復雜度。HMM的打分、解碼和訓練相應的演算法是前向演算法、Viterbi演算法和前向後向演算法。
語音識別中使用HMM通常是用從左向右單向、帶自環、帶跨越的拓撲結構來對識別基元建模,一個音素就是一個三至五狀態的HMM,一個詞就是構成詞的多個音素的HMM串列起來構成的HMM,而連續語音識別的整個模型就是詞和靜音組合起來的HMM。上下文相關建模:協同發音,指的是一個音受前後相鄰音的影響而發生變化,從發聲機理上看就是人的發聲器官在一個音轉向另一個音時其特性只能漸變,從而使得後一個音的頻譜與其他條件下的頻譜產生差異。上下文相關建模方法在建模時考慮了這一影響,從而使模型能更准確地描述語音,只考慮前一音的影響的稱為Bi- Phone,考慮前一音和後一音的影響的稱為Tri-Phone。
英語的上下文相關建模通常以音素為基元,由於有些音素對其後音素的影響是相似的,因而可以通過音素解碼狀態的聚類進行模型參數的共享。聚類的結果稱為senone。決策樹用來實現高效的triphone對senone的對應,通過回答一系列前後音所屬類別(元/輔音、清/濁音等等)的問題,最終確定其HMM狀態應使用哪個senone。分類回歸樹CART模型用以進行詞到音素的發音標注。

4. HMM中解碼問題的求解有什麼比較好的演算法
我學它的時候老師講HMM主要解決三個問題類型,評估問題,解碼問題和機械學習。em(BW)演算法用於解決第三個問題類型,用觀測數據來訓練模型參數。用哪個function得看你作業是屬於哪種類型。而且要看你的模型是哪種,單純的left to right模型的話狀態轉移矩陣中只保存相同狀態的轉移概率和對下一個狀態的轉移概率,其他的都是0。建議用kevin murphy的HMM工具箱,它應該是世界上使用率最高最有名的。
5. 分析HMM前向演算法的原理和作用
前向演算法
前向演算法用於HMM的模型評估問題。假如我們已知HMM的三元組
。假如共有N種狀態,那麼對於觀測序列O,共有N的T次方種路徑。
希望回答能夠幫助到你。
6. 關於語音識別的HMM和MFCC的關系
MFCC用於HMM的訓練(和識別)過程中,因為HMM中針對每一幀語音(或者每一個音素)有特徵向量,而這里採用什麼特徵向量根據具體情況決定,可以選用MFCC
7. HMM演算法訓練的狀態怎麼設定
根據自己的理解,設定幾個狀態,然後輸入大量對象,統計概率分布,最後訓練
8. 判別分析方法、聚類分析方法、HMM方法簡介
三個學分的通選課,A類
曾經作為力學系的限選課開出.
歡迎大二以上有數理基礎的同學選修.
《生物信息學演算法導論》課程介紹
課程英文名:Introction to Computational Biology
課程號:00331440
開課單位:力學系、理論生物學中心
開課教師:朱懷球
上課時間:每周四晚
上課地點:理教201
選課地點、時間:三教103,9月5日星期五上午8:00~12:00
一、課程設置目的及主要內容
隨著人類基因組計劃的不斷推進,運用理論模型和數值計算研究生命科學,已經成為一門 最吸引人的新興學科,是當今生命科學和自然科學的核心領域和最具活力的前沿領域之一 。生物信息學/計算生物學以現代分子生物學數據作為主要研究對象,發展理論模型和計算方法,揭示以基因組信息結構為主的生物復性,以及生長、發育、遺傳、進化等生命 現象的根本規律。本課程主要為具有數理背景的大學二年級以上本科生(含大二)和相關領域的研究生開設,偏重理論建模和演算法的學習。首先介紹當代生命科學的發展和現狀, 然後介紹計算生物學中幾種主要的研究方法,包括統計學方法、Markov過程模型、資訊理論方法、機器學習方法等,並結合當今生物信息學領域的最新進展,討論上述各種方法實際研究中的應用(包括基因序列信息分析、基因預測、分子進化及系統發育樹和蛋白質調控網路等重要問題)。 本課程注重學科交叉、融合,以介紹思想、方法為主,深入淺出,避免繁瑣、抽象的數學形式,啟發學生綜合運用數學、物理、工程科學和計算機知識的能力,拓寬知識面,了解學科前沿和最新進展,培養跨越生命科學、計算科學、數理科學等不同領域的「大科學」素質和意識,為今後選擇新興交叉學科領域進行深造奠定基礎。
二、課程大綱
第1章 緒論 (1學時)
從人類基因組計劃說起
計算生物學——後基因組時代的呼喚
計算生物學主要研究內容和方法
以生命科學為核心的「大科學」
第2章 生物學基礎 (5學時)
What is life?——從薛定鍔的思考到「雙螺旋」的發現
生命的演化和分類
生命的分子組成
遺傳的分子基礎
基因組與基因結構
第3章 生物信息資料庫和計算生物學主要問題 (3學時)
生物信息資料庫簡介
計算生物學主要問題之一:序列比對
計算生物學主要問題之二:核酸和蛋白質結構與功能預測
計算生物學主要問題之三:基因組序列分析
計算生物學主要問題之四:功能基因組相關信息分析
第4章 計算生物學的統計學方法 (10學時)
統計方法的基本概念
回歸分析方法及其應用
判別分析方法及其應用
聚類分析方法及其應用
第5章 計算生物學的Markov過程模型 (6學時)
Markov過程的基本概念
隱Markov模型(HMM)的基本原理
HMM模型的計算生物學應用
第6章 生物學的資訊理論基礎 (6學時)
信源與信息熵
離散信道與平均互信息
編碼理論簡介
生物遺傳信息的傳遞
第7章 遺傳演算法和人工神經網路方法簡介 (8學時)
遺傳演算法的基本原理和方法
遺傳演算法與人工生命模型
人工神經網路的基本概念
人工神經網路的模式識別演算法
第8章 生物信息學/計算生物學的若乾重要問題 (6學時)
基因預測演算法和軟體
分子進化與系統發育
基因調控網路
三、本課程考試方式
在老師指導下,結合所講內容進行學科調研,要求同學在期中、期末分別完成兩次調研論 文,論文題目不限。
9. HMM 前向後向演算法是怎麼回事啊,最好帶個例子。
前向就是把當前狀態之前的可觀測序列搞成一個概率,後向就是把當前狀態之後的搞成一個概率,這樣HMM參數就可以通過迭代的方法求解了,有個叫An introction to Hidden Markov Model的文章不錯,可以看下
10. hmm的無監督訓練方法是什麼演算法
通用迭代演算法