導航:首頁 > 源碼編譯 > 單詞出現頻率最高10個演算法

單詞出現頻率最高10個演算法

發布時間:2023-08-23 04:47:15

python統計字元串中單詞數量

使用比較基本的方法寫的參考代碼:

#!/usr/bin/envpython
#-*-coding:utf-8-*-
#python2.7
importre
printu'請輸入字元串:'
wz=raw_input()
s=wz.lower()
#小寫單詞的正則表達式
r='[a-z]+'
#找到所有單詞
ws=re.findall(r,s)
#定義一個字典來存儲單詞和次數
dt={}
forwinws:
dt[w]=dt.setdefault(w,0)+1
#wd來存儲單詞集合,可能有幾個,比如2個單詞,都出現30次
wd=[]
#max用來存儲單詞出現的最多的次數
max=0
forword,timesindt.items():
iftimes>max:
wd=[]
wd.append(word)
max=times
eliftimes==max:
wd.append(word)

printu'有%s個單詞,出現頻率最高:'%len(wd)
forxinwd:
print"%s %s"%(x,max)

測試

請輸入字元串:
!!!
有2個單詞,出現頻率最高:
a2
good2

㈡ 高頻詞問題,請教編程演算法(不一定要編程實現,演算法即可)

以下方法應該是最優了,關注高人的解答。。

1、先過濾不參與統計的符號,如單引號,逗號等
2、通過split分段函數將字元串以空格為界限分割,並將分割出來的每個單詞保存到數組中
3、使用最優排序演算法將單詞進行排序
4、聲明兩個變數str和n,分別用於記錄當前單詞和出現次數
5、開始遍歷,由於已經經過了排序,所以相同的單詞一定是排在一起的,因此,如果下一個單詞和當前相同就將計數加一,否則就和n比較,較大的保留在變數中。
6、遍歷完畢,保留在變數中的,就是頻率就高的單詞!

閱讀全文

與單詞出現頻率最高10個演算法相關的資料

熱點內容
勁舞伺服器中斷是什麼原因 瀏覽:630
40歲北漂程序員 瀏覽:55
下載釘釘app是什麼 瀏覽:222
什麼伺服器支持雲播放 瀏覽:835
什麼app進貨牛排比較好 瀏覽:107
為什麼鴻蒙用安卓app 瀏覽:82
手相面相pdf 瀏覽:376
軍犬不聽命令追出大門 瀏覽:915
程序員必背97件事 瀏覽:941
雲伺服器python怎麼讀取 瀏覽:33
哪裡買雲伺服器劃算 瀏覽:238
四川日報pdf 瀏覽:967
按摩解壓助眠小姐姐 瀏覽:411
風冷壓縮機水冷卻器 瀏覽:879
伺服器播放器如何打開方式 瀏覽:790
phppython快 瀏覽:367
pdf轉換word免費版 瀏覽:37
二手的有什麼APP 瀏覽:329
伺服器的應用鏡像是什麼 瀏覽:153
命令行的使用方法 瀏覽:514