博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
10、面试官:java中的编码格式转化都有哪几种方式?(中兴面试题)
阅读量:4035 次
发布时间:2019-05-24

本文共 2460 字,大约阅读时间需要 8 分钟。

昨天晚上在微信上有人跟我说,他去中兴面试,面试官问了一个很变态的问题,问Java中的编码格式转换都有哪几种方式?由于之前就知道String中的转换方式,还有一些工具类,因此今天就好好的整理一下java中jdk提供的几种转换方式,希望在今年的面试中对你有帮助。

一、编码转换原理

1、为什么需要编码

很早之前计算机存储的就只是英文,一共26个英文字母。而且计算机存储信息的最小单位是一个字节8位,能够表示256个字符。这对于早起的英文来说足够了。即使是加上一些常见符号也足够。

后来随着时间的发展,中国、日本等国的计算机也开始蓬勃发展,于是计算机不仅仅要存储英文了,也开始存储中文了。但是中文我们都知道几万个太多了,一个字节肯定放不下。怎么办呢?一个字节表示不下,那就多用几个字节就好了。这几个字节在存储的时候还要再转化为bit,这时候就要涉及到编码了。

2、编码方式

计算中提拱了多种编码方式,常见的有 ASCII、ISO-8859-1、GB2312、GBK、UTF-8、UTF-16 等。它们规定了转化的规则,按照这个规则就可以让计算机正确的表示我们的字符。

像GB2312、GBK、UTF-8、UTF-16等很多种方式都可以表示汉字,他们有什么区别呢?

(1)GB2312

它是双字节编码,总的编码范围是 A1-F7,其中从 A1-A9 是符号区,总共包含 682 个符号,从 B0-F7 是汉字区,包含 6763 个汉字。

(2)GBK

它的编码范围是 8140~FEFE(去掉 XX7F)总共有 23940 个码位,它能表示 21003 个汉字。

(3)UTF-8

而 UTF-8 采用了一种变长技术,每个编码区域有不同的字码长度。不同类型的字符可以是由 1~6 个字节组成。

3、转码方式

(1)IO流

这里就是面试问题的核心答案了,编码的目的上面已经说了,主要是字节和字符之间的转化。既然涉及到字节和字符很容易我们就能想到java中的IO流。也就是说java中编码的转换其实就是IO流中的类来实现的。

在这里插入图片描述

最核心的就是上面几个类,当然这里只是给出了输入的一部分,还有一些输出的类。

(2)String

String类中也提供了一些转码的方法。下面我们会通过实例来说明。为什么String可以实现呢?这是因为String底层保存的其实就是一个一个字节,而且String还有方法直接转化为字符。所以String肯定也能实现。

(3)Charset

这个Charset是javaNIO中的一个类,整个流程就是读取数据,然后转化为byte,也就是字符。然后重新编码成字符就OK了。

下面我们使用代码来实现一下:

二、代码实现

1、IO流

public void convertionFile() throws IOException {
File file = new File("D://fdd/java的架构师技术栈.txt"); FileInputStream fis = new FileInputStream(file); InputStreamReader inReader = new InputStreamReader(fis, "gbk"); FileOutputStream fos = new FileOutputStream(file); OutputStreamWriter outReader = new OutputStreamWriter(fos, "utf-8"); }

2、String

public void convertionString() throws UnsupportedEncodingException {
String s = "java的架构师技术栈"; // 正常情况下转码的过程 byte[] b = s.getBytes("gbk");// 编码 String sa = new String(b, "gbk");// 解码 System.out.println(sa); // 错误状态下转码的过程 b = sa.getBytes("utf-8");// 编码 sa = new String(b, "utf-8");// 解码 System.err.println(sa); }

3、Charset

public void convertionCharset() throws IOException {
Charset charset = StandardCharsets.UTF_8; // 从字符集中创建相应的编码和解码器 CharsetEncoder encoder = charset.newEncoder(); CharsetDecoder decoder = charset.newDecoder(); // 构造一个buffer CharBuffer charBuffer = CharBuffer.allocate(64); charBuffer.put('A'); charBuffer.flip(); // 将字符序列转换成字节序列 ByteBuffer bb = encoder.encode(charBuffer); // 将字节序列转换成字符序列 bb.flip(); CharBuffer cb = decoder.decode(bb); }

以上就是三基本的实现方式,当然还有一些其他的,比如Spring中提供的编码转换工具等等。在这里就不说了,因为技术太多,实现的方式也太多,我们就看这几种即可。

OK,今天的文章就先到这,如有问题还请批评指正。

的实现方式,当然还有一些其他的,比如Spring中提供的编码转换工具等等。在这里就不说了,因为技术太多,实现的方式也太多,我们就看这几种即可。

OK,今天的文章就先到这,如有问题还请批评指正。

在这里插入图片描述

转载地址:http://vnbdi.baihongyu.com/

你可能感兴趣的文章
retext出现Could not parse file contents, check if you have the necessary module installed解决方案
查看>>
pyQt不同窗体间的值传递(一)——对话框关闭时返回值给主窗口
查看>>
linux mint下使用外部SMTP(如网易yeah.net)发邮件
查看>>
北京联通华为光猫HG8346R破解改桥接
查看>>
python使用win32*模块模拟人工操作——城通网盘下载器(一)
查看>>
python append 与浅拷贝
查看>>
Matlab与CUDA C的混合编程配置出现的问题及解决方案
查看>>
python自动化工具之pywinauto(零)
查看>>
python一句话之利用文件对话框获取文件路径
查看>>
PaperDownloader——文献命名6起来
查看>>
PaperDownloader 1.5.1——更加人性化的文献下载命名解决方案
查看>>
如何将PaperDownloader下载的文献存放到任意位置
查看>>
C/C++中关于动态生成一维数组和二维数组的学习
查看>>
JVM最简生存指南
查看>>
漂亮的代码,糟糕的行为——解决Java运行时的内存问题
查看>>
Java的对象驻留
查看>>
logback高级特性使用(二) 自定义Pattern模板
查看>>
JVM并发机制探讨—内存模型、内存可见性和指令重排序
查看>>
可扩展、高可用服务网络设计方案
查看>>
如何构建高扩展性网站
查看>>