
1ASCII
用途:用来映射简单的单字节字符,比如大小写英文字母、阿拉伯数字、常用的标点符、运算符、控制字符等。
编码范围:U0000-U007F
注意:对于用这类字符的场景够用了,但是却无法表达比如汉字,日文等编码。
2UNICODE
用途:用来映射包含ASCII以内的其他的所有字符。
编码范围:U0000-U10FFFF
注意:ASCII是UNICODE的子集,ASCII编码的字符可以无损转换为UNICODE编码的字符。
MySQL常用字符集
1Latin1
Latin1是cp1252或者ISO-8859-1的别名。ISO-8859-1编码是单字节编码,向下兼容ASCII。
编码范围:U0000-U00FF
ISO-8859-1收录的字符除ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。
单字节内的空间都被ISO-8859-1编码占用,所以能够用ISO-8859-1编码存储、传输其他任何编码的字节流。
比如把一个Utf8mb4的编码或者GBK的编码存入Latin1,不会有任何问题。因为Latin1保留了原始的字节流,这也就是MySQL长期以来把Latin1做默认字符集的原因。
但是由于Latin1对任何字符都存放字节流,造成了字符个数的浪费。
比如:
CHAR(10)CHARACTERSETLATIN1;CHAR(10)CHARACTERSETUTF8;
该字段中存储字符个数UTF8是Latin1的三倍!!!
2GB18030
GB18030是中国官方标准字符集,向前兼容GBK、GB2312,是这两个的超集。用1、2、4个字节分别表示一个符号。比如对一般中文字符,默认是用两个字节编码存储。Windows系统,默认用的就是GB18030。
若只是存储中文字符,那GB18030最佳。
原因有两点:
1)占用空间小,比如比UTF8小。
2)存储的汉字根据拼音来排序,检索快。
3UTF8
UTF8是Unicode的编码实现,可以存储UNICODE编码对应的任何字符,这也是使用最多的一种编码。最大的特点就是变长的编码方式,用1到4个字节表示一个符号,可以根据不同的符号编码字节长度。
字母或数字用1字节,汉字用3字节,emoji表情符号用4字节。UTF8字符集目前是使用最广泛的。
注意!MySQL里常说的UTF8是UTF8MB3的别名,UTF8MB3是UTF8MB4的子集,UTF8MB4才是真正的4字节UTF8字符集!
UTF8MB3表示最大支持3个字节存储字符,UTF8MB4表示最大4个字节存储字符。根据实际需要和未来展望,MySQL80已经默认用UTF8MB4基础字符集。
ASCII码是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。“A”的ASCII码值为65;“a”的ASCII码值为97;“0”的ASCII码值为 48。
ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。标准ASCII 码也叫基础ASCII码,使用7 位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0 到9、标点符号,以及在美式英语中使用的特殊控制字符 。
扩展资料:
常见ASCII码的大小规则为0~9<A~Z<a~z。
1、数字比字母要小。如 “7”<“F”;
2、数字0比数字9要小,并按0到9顺序递增。如 “3”<“8” ;
3、字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z” ;
4、同个字母的大写字母比小写字母要小32。如“A”<“a” 。
参考资料来源:百度百科-ascii码
常见ASCII码的大小规则:0~9<A~Z<a~z。数字比字母要小。如“7”<“F”;数字0比数字9要小,并按0到9顺序递增。如“3”<“8”。字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z”;同个字母的大写字母比小写字母要小32。
ASCII是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符。
相关信息
在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机用高电平和低电平分别表示1和0),例如,像a、b、c、d这样的52个字母(包括大写)以及0、1等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示。
而具体用哪些二进制数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通信而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了ASCII编码,统一规定了上述常用符号用哪些二进制数来表示 。
获取内页内容最直接的办法就是选择要复制的内容,右击鼠标复制,或者CTRL+C复制,ctrl+v粘贴即可。
对于此方法无法复制的网页内容可以通过在浏览器右上角的工具-查看源代码,
把该文字的第一句用CTRL+F查找这段文字,
把记住你要复制文字的开头和结尾,选择后网页文字和代码一起复制,
再通过一个HTML编程器进行转换,像这里就是HTML的编辑器,或者在网站后台发布文章的位置点击源码,
这时候其他图标都变成灰色。
复制刚刚的文字,然后再粘贴,
这时候有代码,请再点击一下源码,切换回来刚刚的状态
文字变成正常网页显示的内容,再复制粘贴即可。
QByteArray QString::toLatin1() const
Returns a Latin-1 representation of the string as a QByteArray
The returned byte array is undefined if the string contains non-Latin1 characters Those characters may be suppressed or replaced with a question mark
Latin1是ISO-8859-1的别名,有些环境下写作Latin-1。
ISO-8859-1
ISO-8859-1编码是单字节编码,向下兼容ASCII,其编码范围是0x00-0xFF,0x00-0x7F之间完全和ASCII一致,0x80-0x9F之间是控制字符,0xA0-0xFF之间是文字符号。
ISO-8859-1收录的字符除ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。欧元符号出现的比较晚,没有被收录在ISO-8859-1当中。
因为ISO-8859-1编码范围使用了单字节内的所有空间,在支持ISO-8859-1的系统中传输和存储其他任何编码的字节流都不会被抛弃。换言之,把其他任何编码的字节流当作ISO-8859-1编码看待都没有问题。这是个很重要的特性,MySQL数据库默认编码是Latin1就是利用了这个特性。ASCII编码是一个7位的容器,ISO-8859-1编码是一个8位的容器。
以上就是关于数据库编码格式(查看数据库编码格式)全部的内容,包括:数据库编码格式(查看数据库编码格式)、什么是ASCII码字符“A”、“a”、数字“0”的空格的ASCII码值是多少、ASCII码是如何编制的等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)