String - 蓝蓝设计每日一贴

首页

082019-8

char[] 和 String 类型占用字节大小问题

如果您想订阅本博客内容，每天自动发到您的邮箱中， 请点这里

在 C 语言中
1、char a[10] = {"China"} 中，这个 a 占用多少字节？

答：占用 10 个字节。

解析：上面代码对 a 做了赋值的操作，

a[0]='C' ，a[1]='h' ，a[2]='i' ，a[3]='n' ，a[4]='a' ，a[5]='\0'，a[6]='\0'，a[7]='\0'，a[8]='\0'，a[9]='\0'

所以，它占用的是 10 个字节。

2、如果单指 ”China“ ?

答：共 6 个字节。China 占 5 个字节，最后以 '\0' 结束，占 1 个字节。

在 Java 语言中
1、String s = "China"; 占多少字节？

答：占 5 个字节。

System.out.println(Charset.defaultCharset());//获取ide默认编码类型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);
以上代码，可以输出 "China" 所占的字节长度为 5

2、String s = "中国"; 占多少字节？

答：如果是汉字的情况需要考虑编码。

（1）GBK 编码（ide默认）时，每一个汉字占用 2 个字节，那么中国占 4 个字节。

（2）UTF-8 编码时，每一个汉字占用 3 个字节，那么中国占用 6 个字节。

3、转码问题，GBK 转 UTF-8 时，字节占用会变大吗？反过来呢？

//获取的是 UTF-8编码
System.out.println(Charset.defaultCharset());
String s;
try {
s = new String("中国".getBytes(),"GBK");
byte[] b = s.getBytes();
System.out.println("" + b.length);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
如上代码是：UTF-8 转 GBK 编码格式，s 长度从 6 字节变为 9 字节。
s 内容变化：中国 —> 涓浗
因为当前编码是 UTF-8，转码之后变成了 3 个文字，占用 9 个字节。然而，反过来的情况是这样的：

中国 (gbk) —> ?й? (utf-8)
s 长度从 4字节变成了 4字节，虽然长度没发生改变，但是文字已经改变。这里的？占用 1 个字节。

蓝蓝设计( www.lanlanwork.com )是一家专注而深入的界面设计公司，为期望卓越的国内外企业提供卓越的UI界面设计、BS界面设计 、 cs界面设计 、 ipad界面设计 、 包装设计 、 图标定制 、 用户体验、交互设计、 网站建设 、平面设计服务。

首页

char[] 和 String 类型占用字节大小问题

分类

日历

链接

blogger

存档