蓉杠学习网

j***a语言生僻,j***a生僻字怎么处理

大家好,今天小编关注到一个比较意思的话题,就是关于java语言生僻的问题,于是小编就整理了1个相关介绍j***a语言生僻的解答,让我们一起看看吧。

  1. GB2312何时能够代替UTF-8?

GB2312何时能够代替UTF-8

  • GB2312,1980年发布,收入汉字6763个(基本是简体)。
  • GBK,1995年发布,收录21003个汉字(常用简体、繁体)。
  • GB18030,2000年发布,覆盖所有Unicode code point(理论上有1114112个)。

存储常用汉字时,UTF-8比GB系列占用空间多。

一个常用汉字(BMP内,code point<=0xFFFF)用UTF-8需要3个字节,用GB系列只要2个字节。

java语言生僻,java生僻字怎么处理div>
图片来源网络,侵删)

历史原因,对文字存储的要求计算机处理能力和存储能力,覆盖面越来越广。GB231270年代末的设计的,在原ASCII基础扩展出更大容量的编码,以容纳数量众多的汉字,以及日本、俄文等符号

UTF-8是unicode的一种存储格式对应Unicode编码的所有字符,包含东西方文字,亚洲文字涵盖中日韩,中文涵盖少数民族文字。

GB只流行于大陆,连大中华地区都没覆盖,但是UTF8全球通用。

java语言生僻,java生僻字怎么处理
(图片来源网络,侵删)
  • GB2312,1980年发布,收入汉字6763个(基本是简体)。
  • GBK,1995年发布,收录21003个汉字(常用简体、繁体)。
  • GB18030,2000年发布,2005修订了,又扩展了B区,以支持更多的汉字。

GBxxx好处是存储容量小,一个汉字2字节,utf8需要3-4字节,对大量使用中文的大陆计算机来说GBxxx可以节约存储、传输效率,但是在互联网上会带来乱码,需要进行编码转换

GB是国家强制标准包括Windows在内的操作系统,办公软件必须支持GB才是合格产品,才能在市场销售,只支持的UTF-8的洋软件不符合国标,在国内销售受限。

GB2312已经是被替代标准,现在的软件都支持GB18030,GBK都会被替代。GB2312替代UTF8基本就是蒸汽机替代电车,没有可能性。

java语言生僻,java生僻字怎么处理
(图片来源网络,侵删)

问题说反了,其实现在UTF-8差不多已经是事实标准,而GB2312可以说是完全成为过去时了。其实原因确实也很简单,就是兼容性。

GB2312作为上个世纪80年代公布的一项国家标准,在当时确实很有意义。但是随着科技发展,其实已经完全不能满足现在计算机系统的需要了。因为GB2312作为一项中国的标准,只收录了不到七千多个汉字,虽然能够满足基本的汉字需求。但是对于现在各种繁体字以及其他民族的文字没有收录,所以很多场合其实并不能满足。

第二个就是兼容性了。随着linux以及开源文化的流行,世界各种文化背景的人都参与到了程序开发中。自然就产生了一种需求,就是有种编码能够兼容世界上所有文字,能够在任何场合正确不出乱码。而UTF8恰恰就可以满足这种需求。所以linux很早就提供了对UTF8的完整支持。

所以现在有两条路,一条路是独木桥,你自己走过去没啥问题,但是想要和人家互通,就要付出编码转码的代价,很容易出现乱码问题;而另外一条路是宽敞大道,你走上去可以和世界互通不出任何问题。我相信不管是谁,肯定都会选择第二条路。

真能挑事啊,还知道GB2312,请问GB2312的6763个字符能能覆盖博大精深的汉语言文学吗?另外GBK和GB18030了解一下?UTF-8是国际标准,GB2312永远代替不了UTF-8,何况还有UTF-7、16、32等等,与其胡思乱想,不如多学习吧。

到此,以上就是小编对于j***a语言生僻的问题就介绍到这了,希望介绍关于j***a语言生僻的1点解答对大家有用。

[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:83115484@qq.com,我们会予以删除相关文章,保证您的权利。 转载请注明出处:http://www.rongung.com/post/22215.html

分享:
扫描分享到社交APP