漢字的數(shù)量 |
時(shí)間:2009-07-02 09:15:10 來(lái)源: 作者: |
漢字的數(shù)量并沒(méi)有準(zhǔn)確數(shù)字,大約將近十萬(wàn)個(gè)(北京國(guó)安咨詢?cè)O(shè)備公司漢字字庫(kù)收入有出處漢字91251個(gè)),日常所使用的漢字只有幾千字。據(jù)統(tǒng)計(jì),1000個(gè)常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字時(shí)已到99%,簡(jiǎn)體與繁體的統(tǒng)計(jì)結(jié)果相差不大。 歷史上出現(xiàn)過(guò)的漢字總數(shù)有8萬(wàn)多(也有6萬(wàn)多的說(shuō)法),其中多數(shù)為異體字和罕用字。絕大多數(shù)異體字和罕用字已自然消亡或被規(guī)范掉,除古文之外一般只在人名、地名中偶爾出現(xiàn)。此外,繼第一批簡(jiǎn)化字后,還有一批“二簡(jiǎn)字”,已被廢除,但仍有少數(shù)字在社會(huì)上流行。 漢字?jǐn)?shù)量的首次統(tǒng)計(jì)是漢朝許慎在《說(shuō)文解字》中進(jìn)行的,共收錄9353字。其后,南朝時(shí)顧野王所撰的《玉篇》據(jù)記載共收16917字,在此基礎(chǔ)上修訂的《大廣益會(huì)玉篇》則據(jù)說(shuō)有22726字。此后收字較多的是宋朝官修的《類篇》,收字31319個(gè);另一部宋朝官修的《集韻》中收字53525個(gè),曾經(jīng)是收字最多的一部書。 另外有些字典收字也較多,如清朝的《康熙字典》收字47035個(gè);日本的《大漢和字典》收字48902個(gè),另有附錄1062個(gè);臺(tái)灣的《中文大字典》收字49905個(gè);《漢語(yǔ)大字典》收字54678個(gè)。 在漢字計(jì)算機(jī)編碼標(biāo)準(zhǔn)中,目前最大的漢字編碼是臺(tái)灣的“國(guó)家標(biāo)準(zhǔn)”CNS11643,目前(4.0)共收錄可考證之繁簡(jiǎn)、日、韓語(yǔ)漢字共76,067個(gè),但并不普及,只有在戶政系統(tǒng)等少數(shù)環(huán)境使用。臺(tái)港民間通用的大五碼收錄繁體漢字13053個(gè)。GB18030是中華人民共和國(guó)現(xiàn)時(shí)最新的內(nèi)碼字集,GBK收錄簡(jiǎn)體、繁體及日語(yǔ)、韓語(yǔ)漢字20912個(gè),而早期的GB2312收錄簡(jiǎn)體漢字6763個(gè)。而Unicode的中日韓統(tǒng)一表意文字基本字集則收錄漢字20902個(gè),另有兩個(gè)擴(kuò)展區(qū),總數(shù)亦高達(dá)七萬(wàn)多字。 初期的漢字系統(tǒng)字?jǐn)?shù)不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經(jīng)歷了逐步復(fù)雜、字?jǐn)?shù)大量增加的階段。漢字?jǐn)?shù)量的過(guò)度增加又引發(fā)了漢字學(xué)習(xí)的困難,單一漢字能表示的意義有限,于是有許多單一的漢語(yǔ)意義是用漢語(yǔ)詞語(yǔ)表示,例如常見(jiàn)的雙字詞。目前漢語(yǔ)書寫的發(fā)展多朝向造新詞而非造新字。 |
聯(lián)系客服