A. 如何從頭開始編一個拼音輸入法
需要學習輸入法框架的 API;不同系統的輸入法框架有較大差異,可能會涉及一些系統底層的細節;調試困難;Windows 的輸入法以 DLL 注入方式載入,需要事先注冊到系統,且不可運行時替換 (hot-swap);Mac OS 對輸入法做超時控制,難以利用斷點單步調試我的建議是,在理解輸入法工作原理的基礎上,先寫一個邏輯純粹的、在命令行上以 REPL (Read-eval-print loop) 方式工作的輸入法原型。比方說,首先實現輸入一串編碼、查詞典、輸出查詢結果。如果是做拼音輸入法,可進一步在詞典查詢基礎上完成片語、語句的轉換。然後,再增加選字、編輯等功能鍵的處理邏輯。不可顯示為字元的按鍵,可通過轉義序列模擬,例如 `rime_api_console` 採用花括弧+IBus鍵名表示任意的按鍵:`shuruufa{Left}{Left}{BackSpace}{End}`https://github.com/lotem/librime/blob/master/tools/rime_api_console.cc#L144這樣做的好處是可以將測試用的按鍵序列保存為文本,通過輸入重定向重放測試場景:```$ rime_api_console< test_key_sequence.txt```原型將輸入法所需邏輯完全實現後,即可集成到真實的輸入法框架,完善用戶介面等等。最後,藉機宣傳一下 RIME:RIME/中州韻輸入法引擎,是一套跨平台的輸入法演算法框架,即在輸入法與操作系統介面之上封裝了一套輸入法常用的演算法和邏輯組件,允許用戶以 YAML 文檔格式自定義輸入方案和碼表,快速建立拼音、注音、五筆及類似形態的輸入法。對於需要特殊邏輯的輸入法,可通過編程擴展該框架,使開發者只須專注於相關邏輯。目前這一框架的不足是介面尚未完全定型、缺少開發文檔。
B. 哪種拼音輸入法快
個人感覺:
搜狗拼音輸入法,是最快的。
C. 請問QQ拼音輸入法用戶詞順序調整演算法是怎樣的
我也正為這個苦惱,我覺得這個演算法有問題,例如我打 「個」 每次第一個字都出現哥 ,無論你輸入多少次個,都不能調整到首位。感覺這個動態詞頻是不是有點問題呢?
D. 請問QQ拼音輸入法用戶詞順序調整演算法是怎樣的
QQ輸入法的確存在這樣的問題,你將設置里的動態詞頻 選上或是將「冇理由 頂固。
E. 搜狗拼音輸入法有哪些特點和功能啊
一、內置細胞詞庫 輸入更准確
細胞詞庫是由搜狗首創、可在線升級的細分化詞庫,同時該詞庫是完全開放共享的。除了專業類的詞庫外,還為不同領域的詞彙使用者提供了分門別類的詞語集合,安裝細胞詞庫後,就可以輸入幾乎所有的中文詞彙,同時可以直接快速准確的輸入。如安裝了並啟用了「唐詩三百首」的細胞詞庫,我們可以直接輸入唐詩三百首的詩句、作者名與詩名等詞彙。
細胞詞庫的安裝非常簡單,每一個細胞詞庫就是一個安裝文件(如圖所示),只要雙擊後就可以直接安裝了,與安裝搜狗輸入法的皮膚一樣簡單易用。
細胞詞庫安裝文件
我們可以通過搜狗輸入法的屬性設置來管理細胞詞庫,打開「搜狗拼音輸入法設置」窗口,然後點擊「細胞詞庫」標簽,選中「啟用細胞詞庫」前的復選框就可以使用細胞詞庫了,選中下面細胞詞庫的名稱點擊確定後就可以使用該細胞詞庫(如圖所示)。
設置細胞詞庫
點擊「查看詞庫信息」按鈕,可以看到該細胞詞庫的詳細信息(如圖3)所示,其中包括詞庫的名稱、條數、生成日期等。
細胞詞庫信息
安裝好細胞詞庫後,我們就可以直接輸入該詞庫的整句了,如直接輸入「鋤禾日當午」(如圖所示),可以一次性的輸入整句,這樣就可即准確又快速的輸入該詩句了。
細胞詞庫輸入狀態
另外細胞詞庫並不是一成不變的,它可以隨時升級,輸入法可以自動下載每個詞庫的最新版本,這樣就可以保證用戶擁有一個動態化的細胞詞庫,能夠輸入最新的電影、最新的歌名等。
二、打字高手 輸入漢字統計
在新版拼音輸入中增加了輸入統計功能,使用該功能我們就可以在輸入漢字的時候,自動計算出輸入漢字的總字數、打字速度與最快打字速度等(如圖所示),通過該功能就可以自動計算出我們的最快打字速度。點擊窗口上的「復制統計數據」按鈕,即可把統計的數字復制到剪貼板上,保存下來或是通過QQ發送給好友。
該功能的使用也非常簡單,只需滑鼠右鍵點擊輸入法的狀態條,然後在彈出菜單中點擊「輸入統計」菜單,即可(如圖6所示)。
三、更換皮膚 隨心隨欲
在搜狗拼音輸入法3.0預覽版中,又增加了幾款特色的皮膚,如果你是一個喜歡個性的人,那就快來根據自己的喜好選擇一款你喜你的皮膚吧。右鍵點擊輸入法狀態條,然後在彈出菜單中選擇「更換皮膚」菜單項,接著在彈出的二級菜單中選擇你喜歡的皮膚即可(如圖所示)。
如果你正在炒股,那就快來選擇「牛市沖天」皮膚,快來「牛」一把吧。
四、個性化設置 輸入更快捷
新版搜狗拼音輸入法為了用戶更加快速便捷的輸入漢字,增加了幾個個性化的設置,如智能刪除誤造詞功能,在我們造詞的時候,如果出現了錯誤,那麼在2秒後按下退格鍵就能夠自動刪除新造的錯詞,另外還增加了快速輸入英文與中文數字,無需切換輸入法即可直接輸入網址與電子郵箱地址等(如圖所示)。
通過這些項目的設置,可以讓我們更加快速的輸入信息,無需多次切換輸入法即可快速輸入信息,提高了輸入信息的效率。
五、其他方面升級
除了上面介紹的幾個大的改動外,新版搜狗拼音輸入法還在一些細節上進行優化與改進,方便用戶的使用。
新版搜狗拼音輸入法支持Google輸入法的導入,可以直接把Google輸入法的詞庫導入到搜狗拼音輸入中,只需要打開搜狗拼音輸入法的屬性設置窗口,然後點擊「詞庫」標簽,點擊窗口上的「導入文本詞庫」按鈕,選擇Google輸入法的用戶詞庫即可(如圖所示)。除了Google輸入法外,同時還可以導入拼音加加、紫光拼音、微軟拼音等輸入法的詞庫。
我們還可以直接在輸入窗口上點擊右鍵菜單,對輸入法進行快速設置(如圖所示),同時可以直接使用滑鼠右鍵來選詞,提高了用戶的輸入速度。
另外搜狗輸入法還支持Unicode移植,這樣就可以在繁體、英文甚至日文等非中文的Windows系統上使用搜狗拼音輸入法,使得其它操作系統用戶也能夠方便的使用該輸入法。由於新版搜狗拼音輸入法對詞庫的核心作了較大的改進,所以在輸入文字的速度上有了進一步的提升,使用戶能夠更快速的輸入漢字。同時對於微軟新版Vista操作系統的兼容性做了較大的改進,使得輸入法能夠完全兼容IE7.0瀏覽器。
F. 拼音輸入法的演算法,急需,越詳細越好,謝謝,非常感謝。
215456351
G. 微軟拼音輸入法的編碼規則
微軟拼音輸入法是中國第三代漢字編碼輸入法.中文的輸入法是從1974年8月開始基礎工作,這個工程項目又叫「748工程」,其主要成果之一是《漢字頻度表》,首先為漢字信息處理提供了重要的基礎數據。經過對《漢字頻度表》和其它字表的統計分析,國家標准總局頒布了漢字信息處理領域的第一個國家標准《信息交換用漢字編碼字元集·基本集》(GB2312-80)。這是一個在中國的漢字信息處理歷史上劃時代的、具有深遠影響的標准。
1981年,武漢大學等公布了在《新華字典》字集范圍內的字根頻度統計結果。1984年,國家文字改革委員會與武漢大學公布了《辭海》字集范圍內漢字筆畫、部件、結構的動態統計分析結果。
1985年,國家文字改革委員會與山西大學公布了人命姓氏用字的抽樣統計分析結果。
1986年,北京航空學院、新華社利用計算機技術分別公布了基於大型語料庫的新的漢字使用頻度統計和流通頻度統計1985年後,北京師范大學、上海交通大學、北京語言學院等分別使用各具特色的自動分詞技術公布了基於大型語料庫的現代漢語詞語使用頻度統計北京大學計算機語言研究所還建立了以漢語語法為中心的「現代漢語語法信息詞典」 內容全面、翔實、使用方便的漢語語料庫、字詞屬性庫對推動漢字編碼鍵盤輸入技術的發展起到了重大作用。
九十年代後公布的與漢字鍵盤輸入系統有關的國家標准有GB13000.1《信息技術多八位編碼字元(UCS)》、GB18030 《信息技術 信息交換用漢字編碼字元集基本集的擴充》、GB18031 《信息技術 數字鍵盤漢字輸入通用要求》、GB15834 《標點符號用法》和即將公布的有GB/T18220-2000《信息技術 通用鍵盤漢字輸入通用要求》。語委頒布的規范有GF3001 《信息處理 GB13000.1字元漢字部件規范》、GF3002 《GB13000.1字元集漢字筆順規范》、GF3003 《信息處理用漢語拼音方案表示規范通用鍵盤》。
下面是從第一代輸入法到微軟輸入法的一些介紹:
第一代漢字編碼輸入法
電子工業部第六所於1983年正式公布了我國第一個中文磁碟操作系統CC-DOS,這在我國中文信息處理歷史上具有劃時代的意義。CC-DOS是在PC-DOS的基礎上擴充、修改而成。在廣泛使用的CC-DOS 2.1版中,有簡拼、首尾碼、快速碼和區位碼輸入法,已經涵蓋了包括音碼、形碼、音形碼和數字碼這些主要類型的輸入法,對我國計算機應用的普及起到了開路先鋒的作用。
當時使用得最廣泛的輸入法是簡拼和首尾碼。簡拼是純音碼,使用的是介於全拼和雙拼之間的一種拼音方法,對三個及三個字母以上的韻母進行了壓縮。首尾碼是一種純形碼,包含97個部件,分為52類;部件到鍵盤字母的映射沒有太多的規律可循,記憶量很大;編碼時只取字首和字尾各一個部件,對於未列出的變形部件需要輸入者自己去猜測其應歸屬的鍵位。這兩種方法都不支持聯想,也不支持片語,都有很多重碼。因此,在輸入時選擇、翻頁操作很頻繁,眼睛需要不斷地掃描提示行以便在眾多的重碼中找尋所需的字,輸得又累又慢,更不可能實現盲打。
快速碼是通過壓縮拼音加碼方法實現的,可以在一定的程度上離散重碼。由於快速碼的加碼方法沒有規律可循,因此沒有得到真正的應用。區位碼需要完全要靠死記6763個漢字和符號的數字編碼來輸入,因此除了用於輸入當時還沒有其它辦法輸入的標點符號外,基本上沒有人實際使用。
另一個早期的漢字編碼輸入法是電報碼。電報碼為4位等長碼方案,使用的碼字從0000到9999,可以代表一萬個字元(包括漢字、字母、符號)。電報碼沒有重碼,但編碼的規律性不強,十分難記。因此,它完全是為了郵電部門那些已經熟悉電報碼的人的需要而移植進計算機的,對一般的漢字輸入者沒有什麼意義。
1986年,聯想集團在推出聯想漢卡的同時推出了聯想式漢字環境,首先使用了聯想方法來加快漢字的輸入。那時還沒有片語輸入方法,聯想技術讓人耳目一新。漢字輸入過程由原來的編碼->翻頁->選擇->編碼...變成了編碼->選擇->選擇...,因此稍後的很多輸入法都採用了這種技術。不過,按照現代漢字編碼輸入技術的標准來看,聯想技術仍然存在兩個致命的弱點。一個弱點是,如果後續要輸入的字與前面已輸入的字不能構成片語的話,則聯想就會失敗。另一個弱點是,聯想選擇時人機交互過於頻繁,雖然平均碼長縮短了,但是實際的輸入速度反而會下降。
總之,第一代漢字編碼輸入法的特點是:在DOS環境下,以單字為單位進行輸入,在屏幕底部提供專門的提示行顯示數量眾多的重碼字,翻頁、選擇操作頻繁;用數字鍵選擇重碼字,用ALT+數字鍵可重復選擇出現在提示行中的重碼字;連極為常用的標點符號的輸入都需要使用區位碼,很不方便;聯想技術的採用使輸入效率有所改善,但其作用是相當有限的;各種輸入法間的切換(包括切換到英文)都是通過復合功能鍵ALT+Fn(F1-F12)來進行的;支持全形和半形方式,但不支持中文標點方式;不支持片語輸入,更不支持自定義片語。
第二代漢字編碼輸入法
1986年,四通公司與日本三井物業合作,推出了四通MS-2400中文電子打字機,宣告了中國專業電子打字時代的到來。隨著四通打字機的廣泛使用,首先捆綁在四通打字機上的五筆字型輸入法流傳開來,後來捆綁到四通打字機上的由劉衛民發明的雙音輸入法也在當時得到比較廣泛的使用。
五筆字型是最典型的純形碼部件類方案。在五筆字型中,一般將部件稱為字根。五筆字型採用了130個基本字根。基本字根按起筆分為五類,對應通用鍵盤上的五個區。每類又細分為五組,每組對應一個鍵盤字母。在一個漢字中,字根間的關系被歸納為「單、散、連、交」四種。在漢字拆分時,遵循「取大優先,兼顧直觀,能連不交,能散不連」的原則。五筆字型將漢字被分為鍵名漢字、成字字根漢字和鍵外漢字三種,分別服從不同的編碼規則。另外,字的編碼還有一、二、三級簡碼,其形成方法是取相應全碼的前一、二、三個字母。五筆字型將片語也分為二字詞、三字詞和多字詞三種。二字詞按順序取各字的前兩個字根來編碼。三字詞按順序取頭兩個字的第一個字根和末字的前二個字根來編碼。多字詞按順序取第一、二、三、末字的第一個字根來編碼。
五筆字型以非常復雜的編碼規則換來了在GB2312-80字元集內較低的重碼率。當採用強制簡碼時,還可進一步將低重碼率。片語編碼被放進全碼字的剩餘編碼空間中,實現了字詞混合編碼。只要收錄的片語量不大,發生重碼的可能性是比較小的。一般的五筆字型不具備自造詞的功能。五筆字型擁有的這些特點,正好適應了職業打字的需要,成為它在職業打字時代非常流行的重要原因之一。
雖然五筆字型在市場上取得了巨大的成功,但它存在的問題也是不容忽視的。首先,五筆字型是非常難學的,而且容易遺忘。它除了有非常復雜的編碼規則而外,還有很多例外需要記憶。五筆字型打字員在打字時對一些常見字出現「卡殼」的現象是很普遍的事情。這時就需要臨時換用拼音輸入法。其次,五筆字型的擴展性差。當字元集從GB2312-80到GBK和GB18030過渡時,當片語量增大時,五筆字型在碼長為4的碼位上會出現大量的重碼,使其喪失重碼率低的優勢。五筆字型採用的是4碼無重碼自動上屏的策略,4碼重碼增多就迫使打字員的視線更多地離開稿件來觀察提示行以確認自己的輸入,從而降低錄入速度。最後,五筆字型最致命的弱點是規范性差。張孝存等就此提出了言辭激烈的批評:「五筆字型違反語言文字規范。它對漢字的拆分具有相當大的隨意性,對國民基礎文化素質具有不可忽視的負面影響。它對規范的漢字教育的沖擊同其應用范圍的擴大成正比[20]。」
雙音輸入法是一種比較巧妙的純音碼 [23][25]。雙音輸入法最大的特點就是「以詞定字、反向聯想」,以緩解純音碼方式下單字重碼過多的問題。因為二字詞的數量很多,所以一般情況下總可以找到某個二字詞,它的第一個字就是你想要輸入的字。如果該二字詞處於提示行的第一候選位置,則可以省略選擇鍵;否則需要用數字鍵進行選擇。如果整個二字詞都是你需要的,你可以加一個空格鍵輸入第二個字。也就是說,如果採用雙拼的話,利用「以詞定字」技術可以使得常用字輸入時的平均擊鍵數為2.5,而且基本上避免了傳統拼音+聯想方式下過多地掃視提示行和翻頁、選擇的毛病。在雙音輸入法中,對於三字詞和四字詞,取各字的聲母作為編碼來輸入,必要時加空格結束。對於不認識的字,可以打入「\\」調用「手寫模擬」。雖然可以自定義片語,但它不支持在線造詞。造詞時需要用外部文本編輯器按照它定義的格式輸入編碼和對應的片語。
雙音輸入法是拼音漢字輸入歷史上的一大進步,在當時受到了許多非職業打字員的歡迎。但是,它也存在一些比較嚴重的不足,以至於現在幾乎沒有人再使用它了。首先,雖然在輸入效率上它較傳統的拼音有很大的提升,但是它與後來的語句級拼音輸入法如智能ABC相比,還有相當的差距。另外,「以詞定字」時很多字可以採用多個詞來確定,而有的字難以找到詞來確定,用戶常常感到不知所措。雖然雙音輸入法中提供了很多其它的方法來解決單字的錄入問題。例如,鄧、郭、姚等姓氏用字的輸入就有6條輔助規則。要記住這些方法並判斷何時採用何種方法可不是一件容易的事情。由於只能離線造詞,所以片語的自定義也很不方便。
第三代漢字編碼輸入法
到了九十年代末,隨著微機價格的進一步降低、存儲處理能力的進一步增強、Windows圖形操作系統的流行和國際互聯網的興起,用戶界面變得非常友好,微機大面積地進入中國的普通百姓家庭,進入了中小學教育中,真正實現了微機在中國的大普及。
微機的大普及使得打字成為每個人的基本技能,就像會寫漢字一樣;需要別人打字就像需要別人代筆一樣,實際上是文盲的標志。這樣便造就了一個龐大的非職業打字員用戶群體。打字員作為一個職業正在快速消失。一般用戶在打字時的操作方式是「想打」,與職業打字員的「盲打」方式完全不同。「盲打」要求操作者盡量少看屏幕,輸入法提供的反饋信息只有在操作員不能「盲打」時才偶爾派上用場;而「想打」時操作者始終是看著屏幕的,輸入法所提供反饋的方式和反饋信息量的大小都會對操作者的輸入活動產生巨大影響。Windows圖形操作系統為人機界面的豐富化提供了前提條件,可以滿足反饋信息多樣化的需求。
現代微機強大的存儲處理能力為新型的存儲密集型和處理密集型輸入法的誕生提供了物質基礎。輸入法程序不再局限於DOS時代64KB的駐留內存中。千兆級的運算速度使得復雜的智能演算法得以投入運行。硬碟容量不僅從兆級擴大到千兆級,訪問硬碟的速度也比DOS時代大大提高。將巨型的詞庫存儲在硬碟上並進行快速搜索已不成問題。
計算機教育日益廣泛地在中小學開展後,學生們從小就開始學習打字了。漢字編碼與語言文字教育的關系問題被尖銳地提了出來。起碼的要求是,漢字編碼不能與語言文字知識相沖突。理想的情況是,把漢字編碼輸入與語言文字知識的學習結合起來,起到相互促進的作用。
在上述背景下,第三代漢字編碼輸入法應運而生,其指導思想是:規范、易學、易用並且盡量保持輸入速度。這一時期,智能化拼音輸入法的研究高潮迭起,也出現了以筆畫或筆對為輸入單位的純形碼,還出現了以聲母和筆畫(或筆對)為基礎的音形碼[29]-[48]。
(1) 智能化拼音輸入法
智能化拼音輸入法按其實現原理可以分為四種:基於理解的、基於語用統計的、基於模板匹配的和基於上下文關聯的。
智能ABC是目前Windows操作系統上使用得最為廣泛的准語句級拼音輸入法,因為它是以片語和短語為單位而不是以全句為單位進行轉換的。智能ABC最大的特色是能夠非常方便地自定義片語和調整重碼字詞的順序。用戶只需按自己的想法進行輸入,輸入時可以不進行手工分詞,系統會從前到後逐個進行自動分詞。在沒有片語時,系統自動按單字方式顯示重碼字供用戶選擇;一旦用戶選定並組成新詞後,系統就可以記住它。在系統分詞不正確或系統提供的詞不是用戶需要的詞時,用戶也可以加以修改,系統也能記住用戶所作的修改。通過較長時間的使用後,如果用戶沒有發生變化,系統逐步適應該用戶的使用習慣,使用戶的輸入過程變得自如起來。
智能ABC也有很多值得改進的地方。首先,在輸入時可以隨意使用全拼、簡拼、混拼,輸入者可以在任何時候進行音字轉換,過多的方式讓用戶不知哪種是最好的。看似非常靈活,但卻實際上是把優化輸入的任務交給了用戶。但大多數用戶不是這方面的專家,不可能很好地完成這項任務,從而導致用戶走很多彎路或形成不好的、低效的輸入習慣。其次,音字轉換的准確率不高,句內修改很頻繁,導致輸入速度不理想,即使使用雙拼也沒有自然碼的效率高。
微軟拼音是真正意義上的語句級音字轉換智能輸入法,是微軟自然語言處理技術多年科研成果的結晶。微軟拼音採用拼音作為漢字的錄入方式,用戶不需要經過專門的學習和培訓,就可以方便使用並熟練掌握這種漢字輸入技術。微軟拼音採用基於語句的整句轉換方式,用戶連續輸入整句話的拼音,不必人工分詞、挑選候選詞語,這樣既保證了用戶的思維流暢,又大大提高了輸入的效率。微軟拼音提供的人機界面非常具有特色。組字窗口可以嵌入正在輸入的文本的插入游標處,減少用戶在輸入時視線的移動頻率,使得輸入法的易用性得到了很大提高。逐鍵變換並提示轉換結果,使得用戶不必自己做何時進行轉換的決策。用戶可以輸入的編碼長度沒有限制,當超過系統的長度上限或遇到句號時系統會自動進行轉換,以便用戶能繼續不間斷地輸入。由於考慮的上下文較廣,微軟拼音能夠達到很高的轉換准確率。微軟拼音在默認情況下拒絕用戶輸入簡拼和混拼,可以引導用戶養成良好的輸入習慣。
微軟拼音也存在一些問題。首先,在編碼輸入出錯或轉換不正確時進行句內編輯的操作很繁瑣和低效。其次,逐鍵變換時往往會把已經轉換正確的內容又修改錯了,用戶不得不隨時監視輸入內容的正確性,當已轉換的內容較多時是非常勞心的。另外,微軟拼音沒有提供方法加速單字的錄入,也沒提供方法來輸入不認識的字,是不完備的輸入法。
基於筆畫(或筆對)和/或聲母的輸入法
採用筆畫、聲母這兩個最簡單的漢字特徵信息來進行編碼,可以極大地提高輸入法的易學性[12]。但是,漢字的筆畫一般歸為五種。筆畫種類太少,勢必增加編碼的長度,從而影響輸入速度。於是,如何縮短碼長、提高錄入效率成了這類輸入法成功與否的關鍵問題。
福建雙筆碼軟體開發有限公司研製的雙筆碼是一種基於筆畫的純形碼。為了克服筆畫種類過少的問題,雙筆碼引入了一種新的筆畫類型「叉」,從而將筆畫種類擴大為六種,取碼時按順序每取兩筆構成一個筆對,共可形成36種不同的筆對,並在鍵盤上相應的鍵位區內選擇鍵位輸入。另外,雙筆碼還規定病字旁、「口」、提手旁和「日」應作為一個整體取碼。根據漢字不同構造的組合形狀,雙筆碼把漢字劃為三類基本字型即左右型、上下型和綜合型。不論哪種類型的漢字,均按四碼進行編碼。雙筆碼片語的輸入方法為:二字詞輸入每個字的頭兩碼;三字詞輸入前兩個字的頭一碼和末字打頭兩碼,四字及四字以上詞輸入一、二、三、末字的頭一碼。
雙筆碼的優點是:與傳統的部件類輸入法相比,記憶量減少了許多;採用筆對和36鍵編碼後平均碼長也相當短;如果不按筆對而按單筆畫輸入,就可以非常容易地向數字鍵盤移植雙筆碼。但是雙筆碼的缺點也非常明顯:作為基於筆畫的輸入法,它的取碼和編碼規則復雜,例外也不少,學習難度仍然很大;採用了上排數字鍵進行編碼,擊打不方便,且與常用數字的輸入相沖突,影響了實際輸入速度。
陳勁松先生發明的二筆輸入法是目前使用得比較廣泛的輸入法之一。它是一種基於聲母和筆畫的輸入法,也可以單純基於筆畫進行輸入。二筆輸入法的30個編碼字元在通用鍵盤上分布於六個區,即五個雙筆畫區和一個單筆畫區。區內再根據雙筆畫的第二筆或根據單筆畫,按橫、豎、撇、點、折的順序定位。但10個設定偏旁部首的鍵位需要記憶。二筆輸入法將漢字按字形結構分為獨體字和合體字。輸入漢字時,第一碼取漢字拼音首字母,從第二碼起取筆畫,最多取四碼,不足四碼應全取,不能取雙筆畫時就取單筆畫。獨體字不必拆分;第一碼取拼音首字母,第二碼起按筆順取筆畫的代碼,最多取四碼。合體字拆分成兩半,按漢字筆順規則,先寫的部分定為前半,後寫部分為後半;第一碼取取拼音首字母,第二碼取前半的第一、二筆,第三碼取後半的第一、二筆,第四碼取後半的第三、四筆。二筆輸入法片語的編碼規則為:二字詞取每個字的前二碼,三字詞取第一字的前二碼和最後兩個字的第一碼,四字及四字以上詞取前三字和最後一字的第一碼。
二筆輸入法的優點是:編碼規則比雙筆碼更加簡單,使用的編碼字元也僅有30個;通過使用聲母和筆畫兩種漢字特徵信息編碼,區分同碼字詞的能力得到了增強,取得了較高的輸入效率;對於不認識的字還可以按全形方式輸入;如果不按筆對而按單筆畫輸入,也可以非常容易地向數字鍵盤移植。但是二筆輸入法也還存在問題:由於使用了筆對和設定部首,並需區分獨體字和合體字進行不同的編碼,因而學習難度和使用難度仍然較大。
數字鍵盤編碼輸入法
迄今為止,全國手機擁有量已超過3億,手機簡訊息的產值超過50億人民幣。手機擁有量已經超過PC機用戶,用手機輸入漢字的人群遠遠超過用通用大鍵盤輸入漢字的人群。
目前,美國特捷公司的T9拼音和T9筆畫輸入法、加拿大字源公司的字能筆畫輸入法和Motorola公司的iTap輸入法壟斷了中國大陸和港台的手機輸入法市場。但是,國外的手機數字鍵盤輸入法很不盡人意。以筆畫輸入為例,iTap用9個筆畫,字能用8個筆畫,T9用5個筆畫。相同的一個筆畫,不同的手機可以放在不同的位置上,輸入速度也不理想。
為了打破外國手機輸入法壟斷中國手機市場和手機輸入法不規范的尷尬局面。由中國中文信息學會等主辦,由黃金碼出版社(香港)有限公司等單位承辦,於2004年11月21日,在人民大會堂舉行了為期三天的中國首屆手機中文輸入大賽暨漢字數字碼輸入技術應用高峰論壇。在32支參賽隊伍中,有23支參加模擬手機漢字數字碼輸入比賽,9支參加手機中文輸入比賽。除了已參賽的數字編碼方案外,比較引人注意的還有王永民先生的五筆數碼[49]、鄭岩松先生的左右數碼[50]等。以下僅對當前使用得最為廣泛的T9拼音、T9筆畫和首屆手機中文輸入大賽中獲得冠軍的黃金碼、大眾數字碼進行介紹。
T9拼音本質上採用的是一種全拼單字加聯想的早期通用鍵盤輸入技術。其最重要的創新是可以根據手機鍵盤上按鍵的組合情況判斷是否能組合成合法的普通話音節,從而避免了傳統上通過多次按鍵來輸入一個拼音字母的弊端。但是,當按鍵組合適合多個合法的普通話音節,而且默認選擇的普通話音節又不是用戶所需要的時,用戶還是得進行手動選擇。另外,全拼的拼式過長、需要按1鍵進入選擇狀態和聯想造成的過度人機交互都使得T9拼音的輸入效率很低,而且全拼對普通話不好的人難度很大。
T9筆畫採用目前多數輸入法對筆畫的歸類方法將漢字筆畫歸為橫、豎、撇、點、折五類,分別用1、2、3、4、5表示。錄漢字時,按筆順進行輸入,逐鍵提示,每屏數個,高頻優先,最長可輸入12個筆畫,並支持聯想。由於分別使用五個鍵表示五種筆畫,因此不需要像T9拼音一樣對組合情況進行智能判斷,內部處理邏輯很簡單。T9筆畫充分利用了豐富的筆畫信息和不等長碼的短碼位,並可以直接鍵選重碼字,所以它的實際輸入效率比T9拼音還高。
大眾數字碼[51]用10個數字對字詞進行編碼。除了用1、2、3、4、5分別表示橫、豎、撇、點、折五種筆畫外,還用6、7、8、9、0分別表示交、插、八、小、口五類部件。單字按筆順取第一、二、三、四、末五個代碼、不足時按實際碼長,片語的碼長為6位。大眾數字碼使用了相當多的筆畫組合作為部件,但由於歸類清晰,記憶起來比很多同類的輸入法要容易些,加上精心的編碼規則降低了重碼率,使得它在比賽中脫穎而出。不過,應當看到它使用的部件相當多,編碼規則也並不簡單,學習難度還是相當大的。
黃金碼用9個數字對字詞進行編碼。除了用1、2、3、4、5分別表示橫、豎、撇、點、折五種筆畫外,還用6、7、8、9分別表示「口」、「十」、「八」、「亠」四類部件。編碼時分字首和字尾,也區分獨體字與合體字的不同。在提示行不為空時,0、*和#用做選擇鍵。黃金碼最大的特色是,在輸入時若用於編碼的數字與已輸入的編碼一起不能構成另外的字詞編碼時,該數字鍵就可以用於選擇同碼字詞,這樣就大大地增加了輸入法的鍵選能力,縮短了動態平均碼長;結合高頻先見的不等長碼的使用,在輸入時基本上不用翻頁,進一步提高了輸入效率。不過,字首與字尾的區分沒有標准可循,常常因人而異;動態地使用剩餘編碼鍵選擇重碼字詞也造成選擇鍵位置變化太大,加重了人機交互的負擔。
以上是我從事電腦工作以來接觸的幾種我熟悉的輸入法,不知道對你能否有所幫助.
H. 怎樣用九鍵拼音打字
可以的,很簡單,只需要一步,也就是只需要一步:你需要那個拼音就按哪個鍵,比如「打」,拼音是da,d在3鍵,a在2鍵,所以你只要輸入32就可以了。 如果沒有出來da的拼音,從鍵盤左側選擇正確的拼音。
輸入法(IME)是指為了將各種符號輸入計算機或其他設備(如手機)而採用的編碼方法。漢字輸入的編碼方法,基本上都是採用將音、形、義與特定的鍵相聯系,再根據不同漢字進行組合來完成漢字的輸入的。
拼音輸入法是按照拼音規定來進行輸入漢字的,不需要特殊記憶,符合人的思維習慣,只要會拼音就可以輸入漢字。目前主流拼音是立足於義務教育的拼音知識、漢字知識和普通話水平之上,所以對使用者普通話和識字及拼音水平的提高有促進作用。
使用電腦工作或在互聯網上沖浪的朋友都離不開輸入法,隨著拼音輸入法的逐步改進和完善,其新功能和新特性已經吸引了越來越多用戶的注意力,加之漢語拼音是中國啟蒙教育的核心內容之一,凡接受過中文教育的人對漢語拼音並不陌生,而對於剛剛接觸電腦的人來說,因為只要會漢語拼音就可以使用拼音輸入法打字,所以拼音輸入法成為了越來越多人輸入漢字的首選。
I. 谷歌拼音輸入法和搜狗拼音輸入法有什麼區別
谷歌拼音輸入法基本是模仿搜狗拼音輸入法的
說白了,谷歌只是輸入法,他不會惡意安裝其他軟體,而且有很棒的英文寫作助手,很實用。
搜狗輸入法外觀漂亮,第一次打一些比較流行的詞的時候很方便,支持五筆,但是對英文支持不好,而且經常彈廣告,經常偷偷安裝搜狗瀏覽器。
J. 搜狗拼音輸入法可以干什麼
輸入法是指為了將各種符號輸入計算機或其他設備(如手機)而採用的編碼方法。漢字輸入的編碼方法,基本上都是採用將音、形、義與特定的鍵相聯系,再根據不同漢字進行組合來完成漢字的輸入的。拼音輸入法是按照拼音規定來進行輸入漢字的,不需要特殊記憶,符合人的思維習慣,只要會拼音就可以輸入漢字。
搜狗拼音輸入法是搜狐公司開發設計的一款輸入法,它與傳統輸入法不同的是採用了搜索引擎技術,根據搜索詞生成的輸入法互聯網詞庫覆蓋所有類別的流行詞彙。搜狗輸入法最新的智能組詞演算法應用了領先的搜索引擎技術,分析搜索引擎語料庫的語言模型,使搜狗輸入法的首選詞准確率非常高。搜狗輸入法提供全面的按鍵設置和外觀選擇,盡可能適應各種常見輸入法的輸入習慣。搜狗輸入法設計了許多體貼的功能,例如 ign→ing 拼音糾錯、網址輸入模式、詞語聯想、自動在線升級詞庫等,同時搜狗輸入法有多處提高輸入效率的精心設計,例如:快速輸入特殊符號、快速輸入時間、智能刪除誤造錯詞等。此外,搜狗輸入法官網還開通了皮膚下載頻道。搜狗拼音輸入法是新一代的網路輸入法,擁有最高的首選詞准確率、最強大的功能、最漂亮的外觀,已經成為了許多網友的裝機必備軟體。