![具体字符使用UTF-8编码集存储的举例 [Java],第1张 具体字符使用UTF-8编码集存储的举例 [Java],第1张](/aiimages/%E5%85%B7%E4%BD%93%E5%AD%97%E7%AC%A6%E4%BD%BF%E7%94%A8UTF-8%E7%BC%96%E7%A0%81%E9%9B%86%E5%AD%98%E5%82%A8%E7%9A%84%E4%B8%BE%E4%BE%8B+%5BJava%5D.png)
-
首先我们要知道"尚"字的Unicode编码值为 : 23578(十进制)
-
对应为二进制: 0101 1100 0001 1010
-
那么具体到UTF -8中的编码是怎样的?
-
我们要明白 – 这个时候的"尚"是一个中文字符 – 而中文字符在UTF-8中是通过三个字节进行存储的
-
UTF-8编码集中的三个字节的存储格式为: 1110xxxx 10xxxxxx 10xxxxxx
- 我们可以发现这个时候x一共有16个,刚刚够填充我们的"尚"字在Unicode中的编码的二进制(也是16位)
-
那么我们将"尚"字在Unicode中存储的二进制的16位数据填充到UTF-8编码集中三个字节的存储格式中,就得到了"尚"字在UTF-8中的存储编码 : 11100101 10110000 10011010
- 1110xxxx 10xxxxxx 10xxxxxx
- +
- 0101 110000 011010
- =
- 结果为: 11100101 1011000 10011010
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)