字符
字符(character)
简介
时间轴
字符集
字符集(character set),是多个字符的集合。
字符编码
概览
字符编码(character encoding),是对字符集中的字符进行编码,转为二进制模式或电磁波,方便信息的存储、传输和转换。
字符编码在不同的软件或社区可能使用不同单词表示,如:
名称 | 描述 |
---|---|
charset | MySQL,使用SHOW CHARACTER SET; 语句可以查看支持的字符编码。 HTML,HTTP header中可以定义文档的字符编码如 Content-Type: text/html; charset=UTF-8 。CSS,可以使用@charset指定字符编码,如 @charset "UTF-8";
|
character encoding | 维基百科,使用 character encoding。 gedit,linux下的文本编辑器,文本另存为时可以选择character encoding。 |
了解更多 >> W3C:字符编码 - 基本概念 MySQL 文档:Chapter 10 Character Sets, Collations, Unicode MDN:CSS - @charset stackoverflow:What's the difference between encoding and charset?
常见字符编码
字符编码 | 字符集 | 字符占用空间(字节) | 描述 |
---|---|---|---|
ASCII | ASCII | 1 | |
UTF-8 | Unicode | 1~6 | |
UTF-16 | Unicode | ||
UCS-2 | Unicode | 2 |
资源
标准
- IETF:rfc2279:https://datatracker.ietf.org/doc/html/rfc2279