2011年1月13日 星期四

[0089] 今天說中文




今天沒有談瑪黛茶,撈過界五四三對於中文字體的感想。

這個世紀 Unicode 成為了電腦系統的內碼之後,對於中文的發展有很大的影響。好的方面是終於可以擺脫那殘害台灣許久的 Big-5 碼,以及中日韓的漢字和簡繁體都合在一起了,壞的方面是中文也將會被侷限在這些字碼有收錄的字中,因為它很難再因為約定俗成而造出新的字,因為大家只會去用打得出來的字。

大多數的外國人對於中文的發展過程並不瞭解,也搞不清楚簡體跟繁體的差別,但是因為中國經濟崛起,對於中文的興趣也越來越高。不過相較簡體,我們所承襲的原版正體中文,應該還擁有更多包容的內涵以及學習的價值。

--------

語言文字這個東西是拿來溝通用的,大家都用錯多那就變對了,對的沒有人用也會變錯的。只要人們可以經由這些文字或語言達到溝通效果就好了,沒有什麼是絕對正確或絕對錯誤。

中文的發展已經有三四千年的歷史,也是現在四大古文明中唯一還活著的文字系統,也是唯一地球上還在通用的象形文字 (應該是)。

我每次看到這些老外的文字時候都覺得自己承襲的文字系統很屌,因為這是目前世界上公認最難學的語言文字,我說很屌的是我們這一邊用的中文主流系統,因為對岸用的是分支系統。

如果以前唸書還有印象的話,中文的發展大致從甲骨文(上古),金文(商周),籀文(周),大篆(周),小篆(秦),隸書(漢),楷書,後來因為越來越懶就寫出了行書和草書。緊接著因為印刷術的盛行,出現了宋體或明體這些改變很小的字體。

這些字體一直隨著時代改變而改變,因為朝代在變,政體在變,使用的人在變,不同地區也會造成不同改變,印刷抄寫的錯誤也會造成改變,簡單的說,如果不變的話,這個文字就已經死亡了,就像現在的拉丁文情形一樣。

因為有這麼多變,所以大家如果都用不相同的語言系統將會難以溝通,更甚者將有可能造成這語言分支太多而難以繼承,最後慢慢消失。不過中國歷史上有個暴君叫做秦始皇,把所有文字都給統一了,只有他叫李斯推行的小篆文字才是正確,其他大篆通通都要改。雖然這傢伙在歷史上是個混球,但是他卻是是造成了中文歷經數千年不死的一個主要人物之一。(當然蔡倫跟畢昇也很重要)

而後只要換了朝代,統治者都會想要在文字語言上動一點手腳,既使過了數千年到現在都一樣,就算把它改的亂七八糟也無所謂,反正他是統治者,他說了算。

前面都是一堆屁話,後面才是我想要說的重點。

中文大概有九成以上都是屬於會意形聲字,而象形指事字就是組成這些意音字的基礎,轉注假借字是因為時代環境而產生的借用字。這個系統其實是這世界上最古早龐大並且還存活的人工智慧系統,而且每一個字都有它的一個故事,每一個字都有它的價值,可以很簡單的從這個文字的組成去找到這文字所代表的原始意義。(所以英文叫它 Ideography idea+graphy表義文字)

只有我們承襲了正體中文的這個系統,不管政治上的認同為何,不管政黨屬性為何,都不會改變這樣的事實。

我想說的是,去除掉政治上的信仰之後,事實上簡體字並沒有這麼邪惡,它只是歷史發展過程中必然會發生的分支系統。

而且,怎樣去定義哪些字是屬於簡體字,哪些字又屬於正體字呢?要誰說了算?


我還沒出生的年代當時的政府在努力的反共,所以共產黨搞出來的簡體是邪惡的,要鄙棄它,後來搞台灣主體化,當時政府努力的反中,所以中國的簡體是邪惡的,要鄙棄它。但是又有多少人真的瞭解反對的東西到底是什麼?

這個在 1950 年代,對岸因為政治需要而創造出來的簡化字系統讓古早流傳下來中文分裂了幾十年。只不過這些字並不是憑空造出來的,共匪沒有這麼厲害可以創造出新一套的文字,而是被去頭去邊去尾留下來的標準化草書。

只是簡化的過程有很多不合邏輯的地方,像是 『開』 -> 『开』 把門去掉只留下手,意思都不對,再也不是意音字。還有被刪字而不得不大量借字,像是 『幹』 -> 『干』,沒有了幹,那要怎樣臭幹啊。結果留下了很多象形指事字,創造了很多轉注假借字,少了更多會意形聲字。

簡體中文當初是從草書去做正體化,草書最有名的就是王羲之的鬼畫符,因為他實在太懶的寫正楷體,就隨便畫一畫,又因為他是大師,所以他畫出來就是草書的代表。

但是我相信大部分的人都是像王羲之一樣,都會很懶得一筆一筆把標準楷體的字寫好,尤其在簽信用卡簽單的時候,誰不是一筆寫完一個字,而且還常會少個邊掉個頭。照這樣的標準來看,我們因為懶而造出怪異的手寫中文字,其實跟簡體中文的創造過程並不會差太多。

(題外話,日文平假名的也是從草書去簡化。)

在電腦和網路不發達的年代,這兩種字體系統一直都是井水不犯河水,互不相關,互不隸屬。但是在網路把這世界連起來以後,這一堆問題就通通都跑出來了。

如果以字碼來看,上一個世紀對岸用的中文系統內碼 GB2312 有收錄了6763個中文字,上個世紀殘害台灣許久的故障中文內碼 Big-5 有收錄了 13060 個中文字。(這個世紀因為新的系統包括 Windows XP, Mac OS X, 使用了 Unicode 當內碼,讓 Unicode 成為新世紀的主流。)

(我記憶印象中)這兩者長的不一樣的字大概有兩千字上下,而長的完全相同的字還有四千多字,甚至 Big-5 碼也收錄了不少廣泛認為的簡體字,像是『体』這個字就是其中之一。但是 Big-5 碼也少收了很多異俗體字,像是『够』。(這個字反而被對岸內碼GB 2312收錄)

我想這群堅持正體的人要反對的簡體,應該只有這兩千字左右這些長的不一樣的簡化字。因為其他四千多字都是一樣的。

但是中文到底有多少字,實在太多了,如果以 CCCII 中文資訊交換碼來看,有收錄了七萬多字,而由行政院主計處做的 CNS11643 中文標準交換碼來看,目前收錄了八萬七千多字(好像到十萬字了)。清朝康熙字典收錄的字有四萬多字。目前的 Unicode 收錄了兩萬多字。(Unicode 還會繼續長大)

將近十萬個中文字當中,只有兩千個左右的簡化字有爭議。

大約只有2%的差異,好像沒有什麼大不了的吧。

縱然使用簡體中文系統的人遠大於使用正體中文的人,但是也不會改變正體中文的主流價值。分支總有一天會和主流會合,因為這兩者的根本是完全在相同的根源上。

我們承襲了正體中文,既然可以接受異體字和俗體字的存在,為什麼不能接受簡體字的併存。

(以前還有異類印刷體,因為早期印刷活字是拿日本人的漢字來用,所以會有不同的印刷體)

異體字就像是『群』『羣』,『翌』『翊』,俗體字就像是『豬』『猪』,『貓』『猫』

正體 -> 簡體 『鳥』 -> 『鸟』,『維』 -> 『维』
後面的簡字不就很像平常用手寫的字型,三四個點都連成一線。

這些異體和俗體就是因為時代和環境的演變而逐漸發展出來的新字體,不論是寫錯還是印錯而造成,但是簡體也是時代變遷因此而造出來的字體。當去除掉了反共反中這種政治意念圖騰之後,沒有任何理由不能接受簡體字的存在。它也不過就是數千年中文發展過程中的一小塊旁支而已。

我們應該要以自己是文化主流的角度來看這個簡體分支系統,所以應該要這樣說,
我們所使用的[正體]中文[字形]不但是正統並且是全部,其中它包含了繁體,異體,俗體,簡體,印刷體,經文體。

(字音,字意又是另外的題目了)

其實去掉了政治圖騰意識信仰,單純從事物的本質來看,很多事情都會變的很簡單。


這篇只是一些54321。

引用請註明來源
Also Post @
http://blog.yerbamate.tw
http://www.wretch.cc/blog/yerbamate75

沒有留言:

張貼留言

注意:只有此網誌的成員可以留言。