第七百四十章 新字庫

類別:都市言情 作者:二子從周字數:2164更新時間:24/07/01 04:50:44
    說起這些,周至都不禁感慨:“所以說樹挪死人挪活,什麼時候讓關叔也出來得了。”

    “他?”關媽不禁冷笑:“他在夾川還能當大男人,出來怕是不習慣!”

    “大男人做不成就做耙耳朵嘛,大丈夫能屈能伸,哪裏存在呢?”

    “你就光會胡說八道。”關媽笑道:“連你叔的玩笑也亂開!”

    “什麼是耙耳朵?”付霞問道:“豬耳朵滷過頭了,不好吃啊?”

    “哈哈哈哈……”周至和關媽都捧腹大笑,關媽笑得眼淚都要出來了:“我就喜歡看你的節目,就是愛看這樣的效果哈哈哈哈……”

    第二天一早,周至來到了蜀大中文系。

    小會議室裏邊已經坐了一圈的人,見到周至進來,絕大多數人都露出了驚訝莫名的神色。

    這……這特麼就是個高中生,有資格參加這樣的多學科聯動會議?!

    “肘子坐這兒來。”辜幼文對周至招手:“聽說裏高考考得不錯?”

    真是高中生!辜老已經很久沒有參加類似的會議了,現在會上第一句話,居然是關心這孩子高考不錯?

    “辜老好。”周至趕緊坐下。

    “人齊了我們就開始。”辜開來說着對邊上一名胖大老者說道:“要不老王你來開個頭?”

    老者笑眯眯地道:“今天請大家過來呢,是應中文系辜主任的邀請,討論一個小朋友的提議。大家先聽聽看,聽完介紹,我們再做詳細討論。”

    “周至同學,解鈴還須繫鈴人繫鈴人,還是你先說說想法吧。”

    “周至,這是我們學校計算機系的麥明川麥主任。”辜老介紹道。

    “好,那我先說說我設想的這個《中華大字庫》的思路。”

    會議室裏頓時傳出“嗡”的一聲,所有人心裏的第一個反應就是——少年人你好大的口氣!當真不知道天高地厚了!

    倒是麥主任先將手舉起來,將會場秩序重新控制住:“大家先別急着討論,我們會給大家留夠討論的時間。我們先讓周至同學說說他的想法。”

    與會的大多數人,都露出了以爲深長的笑容,雖然麥主任今天帶着大家過來了,想必昨天就和辜主任進行過討論,然而直到現在都沒有任何的表態,卻支着這個少年上臺,那意思很明白——我來是來給你面子的,如果你一定要讓這孩子出醜,那我也管不着。

    周至卻毫不怯場,手裏連個稿子都沒有:“想來大家都知道,我們目前在使用的gb 2312字庫,是我國第一個簡體中文字符集的國家標準,於1980年,由中國國家標準總局發佈,1981年5月1日實施。”

    “它的準確全稱,是叫做《信息交換用漢字編碼字符集基本集》,其中規定了6763個漢字,以及682個非漢字圖形。”

    “與西方文字不同,漢字是表意文字,成千上萬的不同含義需要成千上萬的不同漢字來表示。西方文字主要是拼音文字,通過幾十個字母的組合就可以變出成千上萬的單詞。在計算機裏面,西方文字只需要給幾十個字母編碼就夠了,而每一個漢字都要一個編碼才行。”

    “隨着時代的進步和發展,gb2312已經滿足不了應用的需要,比如‘鎔’字現在是高頻率使用字,而 gb 2312卻沒有爲它編碼,因而政府、新聞、出版、印刷等行業和部門,在使用中感到十分不便。”

    “所以說,隨着信息技術的發展,gb2312的6763個漢字,已經不能再滿足人們使用要求。”

    “而對於蜀大中文系,歷史系,圖書館這些單位來說,六千多個漢字,更是難以滿足信息數字化的需要。”

    “最近,國際標準化組織下屬編碼字符集工作組,研製了一套新的編碼字符集標準,叫做iso/iec 10646。”

    會議室裏又是一陣驚呼。

    之前說的那些都是實際情況介紹,只要是稍微有點興趣的人,翻翻資料,都能夠說得出來。

    可是iso/iec 10646國際標準則是國際標準化組織剛剛提出來的,而且到現在都只頒佈了一部分,這孩子已經接觸到前沿信息了。

    周至繼續說道:“這是一個針對多文種處理的編碼字符集標準,目的是對世界上的所有文字統一編碼,以實現世界上所有文字在計算機上的統一處理。”

    “理論上以此爲基礎,我們能構建出一個在信息技術工程上通用的多八位編碼字符集,搭建出一個多文種的基本編碼體系結構。”

    會議室裏已經有人忍不住舉起了手來,打斷了周至的發言:“周至同學,你是從哪裏知道我們國家正在根據iso/iec10646標準,準備搭建多文種基本編碼體系結構的?”

    “推測啊,”周至說道:“既然gb2312已經不敷使用,自然就需要拓展;正好iso/iec 10646國際標準化字符集已經出臺,給了漢字內碼相當大的拓展空間,因此我們自然就可以根據這個制定出擴展規範,最終得到擴展後的字庫了,難道不是嗎?”

    “呃……”那人想了一下,還真就是這個邏輯思路。

    麥主任介紹道:“這是我們系的李紅江教授,同時他也是國家信息技術編碼字符集工作組成員。”

    李紅江說道:“我承認,肘子你說的一切都對,但你可能還不知道吧?這個事情,我們國家已經在緊鑼密鼓地展開了。”

    “新的字庫,便是如你所說,將基於通用多八位編碼字符集,適應16/32位操作系統,一共擴展到23940個碼位,收錄21003個漢字。稱爲gb 13000,很快就會推出了,到時候,就能夠解決漢字輸入的絕大多數問題。”

    這個消息會議室裏很多人都是第一次知道,大家都興奮異常,不由得鼓起掌來。

    李紅江這才笑道:“作爲一名高中生,能夠找到我們國家在信息技術方面的一個痛點,並且做了一定的研究,甚至提出了和國家相契合的解決思路,這已經很不容易了。”

    說完對麥主任輕鬆地笑道:“所以說,少年強則中國強,像周至同學這樣的,是我們信息產業的希望啊!”

    話雖是這樣說,其實意思也很明白,那就是這些問題國家都已經考慮過了,新編碼馬上就要出來了,就不勞你一個高中畢業生來操這份心了。

    周至一直靜靜地等待李紅江說完,然後才說道:“兩萬一千個漢字,就能夠解決問題了嗎?”

    “兩萬一千零三個!”李紅江強調道:“從六千多個擴展到兩萬一千零三個,擴展了三倍多,這是多大的成就和進步?”