這可以解決彷古書籍錄入時的排版問題,以及打印和印刷出版問題!
辜老也看出了這套標準的價值,卻又不免擔心:「要是我們佔用了太多的碼位,會不會引來糾紛啊?」
「這個辜老就放心吧。」周至都樂了:「不是每個民族都是中華民族,這麼說吧——全世界所有文字符算一石,我華夏獨佔八斗。」
辜老也笑了:「這開討論會呢,肘子你嚴肅點!」
其實周至真不是開玩笑,因為直到兩千零五年,unicode的第十萬個字符被引入成為標準之一。
而直到二零二零年,unicode13.0,一共才收錄十四萬三千多個字符。
當然現在有了周至的干預,第一版的unicode,光漢字字符周至就打算給它塞七八萬進去。
國際標準化組織裏邊中國想要發揮作用有點困難,但是統一碼聯盟就不一樣了,就連繳納會費的個人都能夠發揮作用。
只要周至能夠干預它,讓這個標準的1.0版,在win95發行之前就推出來,然後被微軟採用,信息時代的漢字編碼標準之爭,就得提前劃上句號了。
說起來微軟本身並不是不想用unicode,恰恰相反,老比對這事兒很上心,只是實在等不到它出來,最終不得不選擇iso/iec 10646而已。
主要原因就是unicode雖然好,但是屬於非官方組織搞的東西,大家都缺乏一種急迫感,否則也不至於到了2020年,gbk都擴展到七萬多漢字了,而unicode還依舊有無數的漢字碼位空着。
周至覺得,這種急迫感,中國可以給。
「肘子肘子?」辜老的聲音傳來。
「啊?什麼?」周至這才回過神來,一臉懵。
「剛剛李教授講了那麼多困難,你有沒有什麼意見?」
「李教授說,現在gb13000即將出台,而採集七萬漢字,工作量會非常的巨大,他說你說的東西有價值,但是現在執行起來也不能操之過急。」
「其實如果gb體系對多八位同意擴展的話,也能夠解決碼位容量的問題,更大的方便,是解決將來升級後的兼容問題。」
「還有就是實際應用的問題,大字庫的使用場景到底還是有限的,我們還是要先解決有沒有的問題,再解決好不好的問題。」
「這個說法我不同意。」周至很直白:「因為與gb對標的,說到底還是iso/iec 10646,這個體系本身就是存在缺陷的,除了佔着一個國際標準化組織的名頭之外,遠比unicode的理念落後。」
「哪怕是我們將來有了gb13000,甚至將之擴展為碼位更多的gb標準,那最終得到的,也只是一個地方標準,是我們關起門來自己造出的一個東西,除了在國內強制推行以外,在世界其它地區是難以被接受的。」
「如果我們的新編碼能夠得到unicode組織的認可,那麼我們的大字庫就會成為全世界絕大多數計算機軟硬件產商傾向使用的標準,而且不僅僅是為我國大陸服務,還能夠在台島,港島,澳京,新家坡各個使用中文漢字的地區推廣應用。」
「至於先解決有沒有的問題,再解決好不好的問題,這話我同意。」周至據理力爭:「但是有沒有的問題,我們在推出gb2312的時候就已經解決了。」
「我和李教授的分歧,其實就在他認為還沒到解決好不好的時候,而我認為,已經到了!」
「肘子你沒有從事過這方面的工作,對於其中的困難可能認識不足。」李紅江說道:「就拿那麼多的漢字來說,光建立柵格數位字就是一件煩難的工作。」
「還好吧?」周至說道:「一天一百字,一年就是三萬六千五百字,兩年不就七萬多字了?」
「哪裏有那麼容易,這裏邊涉及到字體設計,比重高低,中宮收放,製作點陣,上機輸入,整理編碼」
「這些很難?」周至奇怪:「可我和我同學,已經用一年多的時間,做出四萬字的稿紙了啊?」
「什麼?」李紅江驚訝得都站起了身來:「你?和你同學?!」
辜幼文招了招手,一名參會學生從會議室角落裏拖着一個拖車過來,從上面搬下一個紙箱打開,放到李紅江的面前。
「這是肘子這次帶來的,小李你看看,合不合用。」
「這是這是」李紅江看着箱子上面按照筆畫部首標註的排序區間和字碼列表,打開之後,入眼是一張張工整的手工書寫四字體標準字,做上面那一個,就是這個漢子的標準點陣字,剩下三個分別是黑體,宋體,彷宋體。
「你們做了多少了?」李紅江嘴唇都有些哆嗦:「肘子你剛剛說四萬?」
「對,到目前為止,已經做到了四萬一千零三十三個,漢字十三結構和標準部件,以及簡化漢字,我們全做完了,然後《康熙字典》,也做了一半。」
「現在只需要一個類似機讀卡的程序,將這些掃到信息系統里,我們就有了一個四萬多字的基線版本。」
「不管我們使用gb還是用unicode,我們都可以通過編碼將這些點陣字納入碼位,構成一個新的大字庫。」
「那gb標準的擴容就迫在眉睫,gb13000還未推廣,就已經落後了」李紅江的話語裏,充滿了苦澀的味道。
「剛剛李教授所說的困難,我覺得都是不難解決的。」周至說道:「關鍵是我們有沒有決心和態度。」
「如果有決心,那麼我們不管使用何種標準,都得將華夏大字庫考慮進去,哪怕是現在暫時做不到,也要給將來的擴張留夠餘地。」
「建庫不難,編碼也不難,難的是標準的制定。只要制定好了大字庫的標準,一切工作以容納全體漢字展開,着這個前提下摸索思路和方法,我個人覺得,其意義遠大於現在的gb13000。」
「gb13000,還是處在頭痛醫頭腳痛醫腳,先搞一個能用的用着的思路上,這個思路本身,就是有問題的。」
「我們的目標應該一開始就落在構建全世界都能夠通用的,可兼容的,可擴展的,具備海量碼位的華夏大字庫上,並且如ascii嗎一樣,力爭使其成為唯一國際通用標準。」
「至於即將推出的gb13000,甚至更之前的gb2312,只是這個大字庫在不同應用場景下的子集而已,將來我們還可以定義出幾個子集,分別滿足普通用戶,政府機關,專業出版社,大型圖書館使用,達到效率優化和成本縮減的兼顧。」
一筆閣 www.pinbige.com