⑴ ASCII碼和漢字編譯的概念
ASCII(():美國信息交換標准代碼)是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言。漢字編碼(Chinesecharacterencoding)是為漢字設計的一種便於輸入計算機的代碼。
由於電子計算機現有的輸入鍵盤與英文打字機鍵盤完全兼容。因而如何輸入非拉丁字母的文字(包括漢字)便成了多年來人們研究的課題。漢字信息處理系統一般包括編碼、輸入、存儲、編輯、輸出和傳輸。編碼是關鍵。不解決這個問題,漢字就不能進入計算機。GB2312-80是1980年制定的中國漢字編碼國家標准。共收錄7445個字元,其中漢字6763個。GB2312兼容標准ASCII碼,採用擴展ASCII碼的編碼空間進行編碼,一個漢字佔用兩個位元組,每個位元組的最高位為1。《漢字內碼擴展規范》(GBK)於1995年制定,兼容GB2312、GB13000-1、BIG5編碼中的所有漢字,使用雙位元組編碼,編碼空間為0x8140~0xFEFE,共有23940個碼位,其中GBK1區和GBK2區也是GB2312的編碼范圍。
⑵ 字元串的結束標志
字元串結束標志是「」。
而0則是''的ASCII碼表示,是第一個ASCII碼,數字0的ASCII碼是48,所以寫程序要用''結尾,比如char a[3] = {'h','i',''},或者直接char a[] ="hi",編譯器都會認為是字元串數組,且以''結束。
調試程序時,可以看到內存裡面是0,這是ASCII碼的表示,也可以看作是一個unsigned int類型。 , 都是轉義字元,都是不能用普通顯示字元顯示的。它們表示一個字元,但不是字串結束字元。
字元串的應用參考
1、連接運算concat(s1,s2,s3?sn)相當於s1+s2+s3+?+sn.
例:concat(『11』,'aa』)='11aa』;
2、求子串。Copy(s,I,I)從字元串s中截取第I個字元開始後的長度為l的子串。
例:(『abdag』,2,3)=』bda』
3、刪除子串。過程 Delete(s,I,l) 從字元串s中刪除第I個字元開始後的長度為l的子串。
例:s:=』abcde』;delete(s,2,3)