数据库编码格式(查看数据库编码格式)

数据库编码格式(查看数据库编码格式),第1张

1ASCII

用途:用来映射简单的单字节字符,比如大小写英文字母、阿拉伯数字、常用的标点符、运算符、控制字符等。

编码范围:U0000-U007F

注意:对于用这类字符的场景够用了,但是却无法表达比如汉字,日文等编码。

2UNICODE

用途:用来映射包含ASCII以内的其他的所有字符。

编码范围:U0000-U10FFFF

注意:ASCII是UNICODE的子集,ASCII编码的字符可以无损转换为UNICODE编码的字符。

MySQL常用字符集

1Latin1

Latin1是cp1252或者ISO-8859-1的别名。ISO-8859-1编码是单字节编码,向下兼容ASCII。

编码范围:U0000-U00FF

ISO-8859-1收录的字符除ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。

单字节内的空间都被ISO-8859-1编码占用,所以能够用ISO-8859-1编码存储、传输其他任何编码的字节流。

比如把一个Utf8mb4的编码或者GBK的编码存入Latin1,不会有任何问题。因为Latin1保留了原始的字节流,这也就是MySQL长期以来把Latin1做默认字符集的原因。

但是由于Latin1对任何字符都存放字节流,造成了字符个数的浪费。

比如:

CHAR(10)CHARACTERSETLATIN1;CHAR(10)CHARACTERSETUTF8;

该字段中存储字符个数UTF8是Latin1的三倍!!!

2GB18030

GB18030是中国官方标准字符集,向前兼容GBK、GB2312,是这两个的超集。用1、2、4个字节分别表示一个符号。比如对一般中文字符,默认是用两个字节编码存储。Windows系统,默认用的就是GB18030。

若只是存储中文字符,那GB18030最佳。

原因有两点:

1)占用空间小,比如比UTF8小。

2)存储的汉字根据拼音来排序,检索快。

3UTF8

UTF8是Unicode的编码实现,可以存储UNICODE编码对应的任何字符,这也是使用最多的一种编码。最大的特点就是变长的编码方式,用1到4个字节表示一个符号,可以根据不同的符号编码字节长度。

字母或数字用1字节,汉字用3字节,emoji表情符号用4字节。UTF8字符集目前是使用最广泛的。

注意!MySQL里常说的UTF8是UTF8MB3的别名,UTF8MB3是UTF8MB4的子集,UTF8MB4才是真正的4字节UTF8字符集!

UTF8MB3表示最大支持3个字节存储字符,UTF8MB4表示最大4个字节存储字符。根据实际需要和未来展望,MySQL80已经默认用UTF8MB4基础字符集。

ASCII码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。“A”的ASCII码值为65;“a”的ASCII码值为97;“0”的ASCII码值为 48。

ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符 。

扩展资料:

常见ASCII码的大小规则为0~9<A~Z<a~z。

1、数字比字母要小。如 “7”<“F”;

2、数字0比数字9要小,并按0到9顺序递增。如 “3”<“8” ;

3、字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” ;

4、同个字母的大写字母比小写字母要小32。如“A”<“a” 。

参考资料来源:百度百科-ascii码

常见ASCII码的大小规则:0~9<A~Z<a~z。数字比字母要小。如“7”<“F”;数字0比数字9要小,并按0到9顺序递增。如“3”<“8”。字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z”;同个字母的大写字母比小写字母要小32。

ASCII是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。

相关信息

在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示。

而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示 。

获取内页内容最直接的办法就是选择要复制的内容,右击鼠标复制,或者CTRL+C复制,ctrl+v粘贴即可。

对于此方法无法复制的网页内容可以通过在浏览器右上角的工具-查看源代码,

把该文字的第一句用CTRL+F查找这段文字,

把记住你要复制文字的开头和结尾,选择后网页文字和代码一起复制,

再通过一个HTML编程器进行转换,像这里就是HTML的编辑器,或者在网站后台发布文章的位置点击源码,

这时候其他图标都变成灰色。

复制刚刚的文字,然后再粘贴,

这时候有代码,请再点击一下源码,切换回来刚刚的状态

文字变成正常网页显示的内容,再复制粘贴即可。

QByteArray QString::toLatin1() const

Returns a Latin-1 representation of the string as a QByteArray

The returned byte array is undefined if the string contains non-Latin1 characters Those characters may be suppressed or replaced with a question mark

Latin1是ISO-8859-1的别名,有些环境下写作Latin-1。

ISO-8859-1

ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。

ISO-8859-1收录的字符除ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。欧元符号出现的比较晚,没有被收录在ISO-8859-1当中。

因为ISO-8859-1编码范围使用了单字节内的所有空间,在支持ISO-8859-1的系统中传输和存储其他任何编码的字节流都不会被抛弃。换言之,把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题。这是个很重要的特性,MySQL数据库默认编码是Latin1就是利用了这个特性。ASCII编码是一个7位的容器,ISO-8859-1编码是一个8位的容器。

以上就是关于数据库编码格式(查看数据库编码格式)全部的内容,包括:数据库编码格式(查看数据库编码格式)、什么是ASCII码字符“A”、“a”、数字“0”的空格的ASCII码值是多少、ASCII码是如何编制的等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://www.54852.com/web/9585137.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-29
下一篇2023-04-29

发表评论

登录后才能评论

评论列表(0条)

    保存