ASCII ASCII(American Standard Code for Information Interchange),美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本EASCII则可以勉强显示其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。至今为止ASCII共定义了128个字符,其中33个控制字符,主要是用来操控已经处理过的文字;95个可显示的字符,包含用键盘敲下空白键所产生的空白字符(显示为空白)。
Unicode Unicode(统一码)是对世界上大部分的文字系统进行了整理、编码,使得电脑可以用更为简化地方式来呈现和处理文字。统一码的编码方式与ISO 10646的通用字符集(Universal Character Set,UCS)概念相对应。 Unicode 的实现方式不同于编码方式。一个字符的Unicode编码是确定的,但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。Unicode的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF)。目前实际应用的统一码版本对应于UCS-2(UTF-16),使用16位的编码空间。也就是每个字符占用2个字节。而字节序是指存放多字节数据的字节(byte)的顺序。这里的Unicode指的是UTF-16(Little-Endian),字节序采用小端模式,最低位地址存放低位字节。