導航:首頁 > 源碼編譯 > 匹配分詞演算法

匹配分詞演算法

發布時間:2024-07-22 10:45:34

A. 有哪些比較好的中文分詞方案

1. 好詞典很重要m不論什麼樣的分詞方法, 優秀的詞典必不可少, 越拿老掉牙的詞典對越新的文本進行分詞, 就越會分成一團糟. 怎樣構建一個優秀的詞典, 快速發現新新詞彙.。可以看有幾篇文章,講的非常透徹明白 : 互聯網時代的社會語言學:基於SNS的文本數據挖掘。

2. 演算法跟著需求走,建議根據不同的需求選用不同的演算法, 例如, 類似知乎頭部搜索的 AutoComplete 部分, 講究的是速度快, 興趣相關( 優先找和你賬戶相關, 和可能感興趣的內容 ), 分詞演算法反而在其次了. 而像全文搜索這樣大段大段的長文字.。我覺得則更注重的是精準, 應該選一個像CRF這樣的演算法。

閱讀全文

與匹配分詞演算法相關的資料

熱點內容
ftp命令編碼格式 瀏覽:298
程序員那麼可愛陸離穿正裝 瀏覽:169
源碼的賬號密碼在哪個文件 瀏覽:437
如何在中國農業銀行app綁定銀行卡 瀏覽:990
shopnum1多用戶商城系統源碼 瀏覽:743
紅包廣告平台源碼 瀏覽:770
硬碟格式化時用的dos命令是 瀏覽:940
找人緩解壓力 瀏覽:935
iphone的pdf 瀏覽:349
90壓縮餅干怎麼吃 瀏覽:666
php教材下載 瀏覽:915
什麼解壓密碼最好 瀏覽:589
資料庫與伺服器如何連接 瀏覽:444
架構師需要閱讀的源碼 瀏覽:483
ch編譯器 瀏覽:456
java必須自己寫一個編譯器嗎 瀏覽:944
如何製作androidrom 瀏覽:476
單片機萬能板怎麼寫入程序 瀏覽:27
邁銳寶xl壓縮比 瀏覽:346
靠演算法買彩票 瀏覽:503