GBK / IBM1388字符集转换
GBK是PC上使用的主要简体中文字符集,而IBM1388在大型机上。 这两个字符集不能通过像Unicode在UTF-8和UTF-16之间所做的操作来直接互换。 它们基于具有不同汉字顺序的不同编码(ASCII / EBCDIC)。 ICU( )支持两种字符集,但占用空间很大。 这是一种占地面积小,快速的解决方案,消除了对ICU的依赖性。
GBK编码
1个字节0xxx xxxx - 0x00 ~ 0x7f与ASCII兼容
2个字节1xxx xxxx 1xxx xxxx中文
最高有效位用于标识1或2字节编码。
IBM1388编码
1个字节-与EBCDIC兼容
2个字节-中文
SO( 0x0E )/ 0x0E和SI( 0x0E )/ 0x0F用于标识2字节编码的开始和结束。
执照
映射文件由ICU生成。 因此,您可能必须遵守ICU许可( )
2021-08-21 18:08:25
83KB
C
1