三江航天江河硕士待遇:utf-8是什么意思

来源:百度文库 编辑:杭州交通信息网 时间:2024/05/01 11:59:34
utf-8是什么意思

编码格式的一种,
可以对应几乎所有文字
将来Linux的默认编码,
目前的Redhat系列最新版操作系统默认Unicode(UTF-8)编码

而且,目前比较先进的CMS,Forum,blog都已经推出或默认UTF-8语言包

所有的字符都是对应一个数值的, 但是不同的编码方式同样的数值对应的字符可能不同.

比如gb_2132中某个字对应于12345, 而法语编码中对应12345的则是另外一个字符. 所以只给数值的话就会搞混应该显示哪个字符.

UTF系列的编码, 试图包括世界上所有语言的所有字符, 并给没一个字符一个唯一的对应值, 这样在这个规则下, 就可以轻易判断应该显示哪个字符了.

问题是有的情况下 我们并不需要知道世界上都有什么字符, 因为我们根本不会用到, 所以每种语言有自己的编码系统. 不是那么浪费资源.

简单来说,UTF-8编码可以看作是更大的字符集,它包含GB、BIG5和Shift_JS等大部分文字的编码。使用UTF-8编码主要是为了让不同语言用户在使用软件时不用安装其它编码即可正常显示信息,使软件国际化更容易。所以UTF-8编码是发展的趋势。

UTF-8 是一种用于将宽字符值转换为字节流的 Unicode 的标准机制。UTF-8 对于纯 ASCII 字符来说是透明的,且是自同步的(也就是说这使得程序能够得知字符从字节流的何处开始),并可被普通字符串比较函数用以比较等操作。PHP 可将 UTF-8 编码为多达四个字节的字符,如:

UTF-8 编码

字节(bytes) 位(bits) 表 示
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb

每个 UTF-8 表示一个能被用以储存字符数据的位。