漢字為什么可以借助筆順編碼精準(zhǔn)排序?因?yàn)椋?/span>
1)一個(gè)理想的漢字排序必須做到每個(gè)漢字只出現(xiàn)一次,并且比較任意兩個(gè)漢字你知道哪個(gè)漢字應(yīng)該排在前面,哪個(gè)漢字應(yīng)該排在后面。
2)一個(gè)漢字對(duì)應(yīng)一個(gè)英語單詞(也可看作一個(gè)英文字),而漢字的筆畫對(duì)應(yīng)英語單詞(英文字)的字母。只要把漢字筆畫之間的順序規(guī)定下來,漢字根據(jù)其規(guī)范了的筆順就自動(dòng)排成了序列。對(duì)于筆畫、筆順都完全相同的漢字,則依據(jù)其音序排列。
3)將漢字的筆畫對(duì)應(yīng)英語的字母,這是一個(gè)有相當(dāng)難度的一項(xiàng)工作。為什么?因?yàn)?首先,該編碼必須把所有的筆畫筆形包含其中,不能有一個(gè)遺漏。其次,代碼和筆畫筆形之間的關(guān)系一一對(duì)應(yīng),不能有絲毫的混淆。例如:
代碼C表示“橫豎橫”和“乙形”兩種筆畫,而“乙形”筆畫又包含多種筆形,例如“乙”字的筆畫、“九”第二畫、“飛”第一畫,這三字中的相關(guān)筆畫它們的筆形有相似性,但不完全一樣,而且很難各自給這些筆形以精確的描述和統(tǒng)一規(guī)范的名稱。
代碼D表示“橫豎橫豎”和“異形”兩種筆畫,其中“橫豎橫豎”這一筆畫只有“凸”字里面有(第四畫),而“異形”指一些怪異的筆畫筆形,如“〇”這個(gè)字的筆畫就是這種。而且,這個(gè)“〇”的筆形,與“凸”字里面“橫豎橫豎”或“橫折折折”這一筆形,歸類一起,是完全符合邏輯的。因?yàn)椤皺M折折折”就是三折,而“〇”這一筆形表示無限多折(三折以上),當(dāng)然它們可以歸為一種筆畫。
代碼M表示“豎折折”(“虧”字第三畫)、“豎折折鉤”(“專”字第三畫)等筆形。注意,在這里帶鉤和不帶鉤的兩種筆形被看作一種筆畫,使用同一個(gè)代碼。
把雖然不完全一樣但有相似性的筆形,劃歸為一種筆畫,用某一個(gè)英文字母作代碼,如上述的C、D、M。這種模糊化處理是必須的,因?yàn)闈h字的筆畫筆形太復(fù)雜多樣了。如果每一種筆形都用一個(gè)字母代碼,勢必造成字母不夠用的情況,而且會(huì)帶來難以記住的困難。
筆順碼的筆形歸類、筆畫劃分除了模糊化處理外,也有精確化處理。例如,傳統(tǒng)的“點(diǎn)”這一筆畫,在筆順碼中則分為“左點(diǎn)”和“右點(diǎn)”,分別以代碼“Y”、“Z”表示。傳統(tǒng)的“捺”這一筆畫,在筆順碼中則分為“捺”和“提捺”,分別以代碼“T”、“X”表示。一般的處理原則是:近端(或始端)精確,遠(yuǎn)端(或尾端)模糊。
總之,這些筆形筆畫和代碼的設(shè)置是非常巧妙、智慧和富有創(chuàng)意的。
3)胡喬木說:“我們要盡可能使?jié)h字成為一種'拼形’的文字?!睗h字信息化技術(shù)方面的資深專家許壽椿教授曾著文說:“英文等拼音文字的字母是基元性的,即字母是最小單位,不能夠、不需要再進(jìn)一步拆分。而漢字是可以也需要拆分的,它不是基元性的。”漢字筆順碼,實(shí)際上就是做了一件把漢字拆分為筆畫序列的工作,這是一種以部件(筆畫)結(jié)構(gòu)來發(fā)掘漢字的規(guī)律性的一項(xiàng)工作。
4)筆順碼最初是作為“挑戰(zhàn)部首”的形象出現(xiàn)的,這可以從筆順碼發(fā)明者出版的書《漢字新序——挑戰(zhàn)部首檢字》(武漢出版社,2008.5)看出。說是“挑戰(zhàn)”,是從創(chuàng)新發(fā)明的角度來說的,但筆者認(rèn)為,既是挑戰(zhàn),也是傳承。筆順碼查檢法什么地方傳承了部首查檢法?它傳承了部首查檢法的以形研字、以形查字的傳統(tǒng),即是說,它們都是從字的形態(tài)為出發(fā)點(diǎn)的。只不過部首查檢法是以漢字的中間部件(偏旁)為基礎(chǔ)的,而筆順碼查檢法是以漢字的最小最基本部件(筆形筆畫)為基礎(chǔ)的。正因?yàn)槎哂幸欢ǖ膫鞒行?,所以使用筆順碼編纂的字典也像使用部首編纂的字典有類似的地方,譬如,所有具有相同偏旁的的漢字都放在了一起,雖然兩種字典相同偏旁的字的排列次序不一樣。其實(shí),筆順碼查檢法的真正挑戰(zhàn)對(duì)象是拼音查檢法,因?yàn)槠匆舨闄z法是在工業(yè)化時(shí)代西方“以語音為中心”的錯(cuò)誤的文字學(xué)說的大環(huán)境下的產(chǎn)物;而且,從使用實(shí)踐的角度說,拼音查檢法是一種沒有多少實(shí)用價(jià)值架子,因?yàn)槟阋榈淖只旧隙际遣恢?、不?huì)讀的,你怎么查?最后還是要依賴部首查檢。而且該類字典常常附以一個(gè)以“〇”打頭的接近300個(gè)字的“難檢字筆畫索引”表,有這么多難檢字,從這一點(diǎn)就可以認(rèn)為這類查檢法不是很有效、很理想的的查檢法。
(《筆順碼字典》編委 溫羅發(fā)20190928)
聯(lián)系客服