重生之乘风而起(二子从周)_第七百四十二章新方案（2 / 2）_重生之乘风而起最新章节免费阅读无弹窗

“当前全收集，则指当前我们已知的汉字符号，包括大陆简化字，宝岛、港澳、新岛的繁体字，还有岛国，朝韩所用的一些汉字符号，全部采纳到新编码体系中来。”

“未来可拓展的意思，就是要给字库留够充足的冗余编码空间，给将来采集更多的文字符号做好准备。”周至侃侃而谈：“刚刚旦增大师已经说了，我国是多民族的国家，很多民族都有自己的文字，这些文字，同样是我们华夏一族大家庭的瑰宝。”

“因此我们要留足这个字库的拓展空间，以备将来时机成熟后，将这些少数民族的文字也收纳进来。”

“这就是我的设想，关于华夏标准大字库的设想。”

“呃……周至同学。”李红江倒也是光棍：“我给你道个歉，也给辜老和旦增大师道个歉，之前自己的确没有意识到这个问题的重要性。”

“但是我之前已经说了，gb13000是根据iso/iec1064来设计的，通用多八位编码字符集的码位就只有两万多个，就好像一个养殖场，鸡笼子就这么多，实在是装不下你们说的这么多鸡啊？”

“所以说这个多八位编码字符集是有问题的呀，不适合中国的需要呀，那我们为什么还要凑合着用呢？”周至反问道。

“要是不用这个，那又用哪个呢？”李红江倒是不觉得周至是在无理取闹，能够提出问题来不是本事儿，关键是问题提出来之后，你还得能够解决问题才算。

“为什么不用unicode呢？”

“unicode？”李红江想了一下：“unicode八字还没一撇吧？国际标准都还没有出来，我们哪来的参照？”

unicode的汉语翻译，叫做统一码，也叫万国码、单一码，是由统一码联盟开发的一项计算机科学领域里的业界标准，主要就包括字符集和编码方案。

统一码是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符，设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。

统一码设计之初的目的，就是为了打造一个能够容纳世界上所有文字和符号的字符编码方案。

其设计思路，就是用数字0-0x10ffff来映射所有字符，最多可以容纳1114112个字符，或者说有1114112个码位。

后世大家所熟悉的utf-8、utf-16、utf-32，其实都是将数字转换到程序数据的编码方案。

当然这些码位也不是随便乱用的，而是规定了区间，比如上一世给汉字使用的区间，就是3400-4dbf，4e00-9fff，20000-3ffff三段，称作：中日韩越统一表意文字区间。

这就有一百多万个码位，装下所有汉字绰绰有余。

因为不存在上限，utf理论上还可以继续扩展。

当然从上一世的经验来看，也完全没有这个必要，足够用了。