大家好,今天小编关注到一个比较有意思的话题,就是关于java语言生僻的问题,于是小编就整理了1个相关介绍j***a语言生僻的解答,让我们一起看看吧。
GB2312何时能够代替UTF-8?
- GB2312,1980年发布,收入汉字6763个(基本是简体)。
- GBK,1995年发布,收录21003个汉字(常用简体、繁体)。
- GB18030,2000年发布,覆盖所有Unicode code point(理论上有1114112个)。
一个常用汉字(BMP内,code point<=0xFFFF)用UTF-8需要3个字节,用GB系列只要2个字节。
历史原因,对文字存储的要求、计算机的处理能力和存储能力,覆盖面越来越广。GB231270年代末的设计的,在原ASCII码基础上扩展出更大容量的编码,以容纳数量众多的汉字,以及日本、俄文等符号。
UTF-8是unicode的一种存储格式,对应Unicode编码的所有字符,包含东西方文字,亚洲文字涵盖中日韩,中文涵盖少数民族文字。
GB只流行于大陆,连大中华地区都没覆盖,但是UTF8全球通用。
- GB2312,1980年发布,收入汉字6763个(基本是简体)。
- GBK,1995年发布,收录21003个汉字(常用简体、繁体)。
- GB18030,2000年发布,2005修订了,又扩展了B区,以支持更多的汉字。
GBxxx好处是存储容量小,一个汉字2字节,utf8需要3-4字节,对大量使用中文的大陆计算机来说GBxxx可以节约存储、传输效率,但是在互联网上会带来乱码,需要进行编码转换。
GB是国家强制标准,包括Windows在内的操作系统,办公软件必须支持GB才是合格产品,才能在市场销售,只支持的UTF-8的洋软件不符合国标,在国内销售受限。
GB2312已经是被替代标准,现在的软件都支持GB18030,GBK都会被替代。GB2312替代UTF8基本就是蒸汽机替代电车,没有可能性。
问题说反了,其实现在UTF-8差不多已经是事实标准,而GB2312可以说是完全成为过去时了。其实原因确实也很简单,就是兼容性。
GB2312作为上个世纪80年代公布的一项国家标准,在当时确实很有意义。但是随着科技发展,其实已经完全不能满足现在计算机系统的需要了。因为GB2312作为一项中国的标准,只收录了不到七千多个汉字,虽然能够满足基本的汉字需求。但是对于现在各种繁体字以及其他民族的文字没有收录,所以很多场合其实并不能满足。
第二个就是兼容性了。随着linux以及开源文化的流行,世界各种文化背景的人都参与到了程序开发中。自然就产生了一种需求,就是有种编码能够兼容世界上所有文字,能够在任何场合正确不出乱码。而UTF8恰恰就可以满足这种需求。所以linux很早就提供了对UTF8的完整支持。
所以现在有两条路,一条路是独木桥,你自己走过去没啥问题,但是想要和人家互通,就要付出编码转码的代价,很容易出现乱码问题;而另外一条路是宽敞大道,你走上去可以和世界互通不出任何问题。我相信不管是谁,肯定都会选择第二条路。
真能挑事啊,还知道GB2312,请问GB2312的6763个字符能能覆盖博大精深的汉语言文学吗?另外GBK和GB18030了解一下?UTF-8是国际标准,GB2312永远代替不了UTF-8,何况还有UTF-7、16、32等等,与其胡思乱想,不如多学习吧。
到此,以上就是小编对于j***a语言生僻的问题就介绍到这了,希望介绍关于j***a语言生僻的1点解答对大家有用。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。 转载请注明出处:http://www.rongung.com/post/22215.html