赞
踩
- // #c---
- static const unsigned short tab_GBK_to_UCS2[][2] =
- {
- /* GBK Unicode 字 */
-
- {0x8140, 0x4E02}, // 丂
- {0x8141, 0x4E04}, // 丄
- {0x8142, 0x4E05}, // 丅
- {0x8143, 0x4E06}, // 丆
- {0x8144, 0x4E0F}, // 丏
- ... ...
- {0x817F, 0x0001}, // XXXXX
- ... ...
- };
- // #c---end
- // #c---
- /*****************************************************************************
- * 将一个字符的GBK编码转换成Unicode(UCS-2和UCS-4)编码.
- *
- * 参数:
- * gbk 字符的GBK编码值
- * ucs 指向输出缓冲区, 其保存的数据即是Unicode编码值,
- * 类型为unsigned long .
- *
- * 返回值:
- * 1. 成功则返回该字符的GBK编码所占用的字节数;
- * 对于ASCII字符返回1, 对于非ASCII中文字符返回2.
- * 2. 失败则返回0.
- *
- * 注意:
- * 1. GBK 和 Unicode 都有字节序要求;
- * 字节序分为大端(Big Endian)和小端(Little Endian)两种;
- * 在Intel处理器中采用小端法表示, 在此采用小端法表示. (低地址存低位)
- ****************************************************************************/
- int enc_GBK_to_unicode_one(unsigned short gbk,
- unsigned long *ucs)
- {
- assert(ucs != NULL);
-
- unsigned char *p = (unsigned char *) &gbk;
- unsigned char *phibyte = p + 1;
-
- if ( *phibyte < 0x80 )
- {
- *ucs = *phibyte;
- return 1;
- }
- else
- {
- if ( gbk < tab_GBK_to_UCS2[0][0] ||
- gbk > tab_GBK_to_UCS2[NUMOF_TAB_GBK_TO_UCS2 - 1][0] )
- {
- return 0;
- }
-
- *ucs = tab_GBK_to_UCS2[gbk - tab_GBK_to_UCS2[0][0]][1];
- }
-
- return 2;
- }
-
- // #c---end
-
-
- // #c---
- /*==========================================================================*
- * @Description:
- * 初始化unicode(key)与GBK(value)的映射表tab_UCS2_to_GBK
- *
- * @Returns:
- * 成功, 返回1;
- * 失败, 返回0.
- *
- *==========================================================================*/
- static int enc_stc_unicode_to_GBK_init()
- {
- assert(tab_UCS2_to_GBK == NULL);
-
- int i;
- void *ret;
-
- tab_UCS2_to_GBK = Table_new(21791, enc_stc_unicode_to_GBK_cmp,
- enc_stc_unicode_to_GBK_hash);
- if ( tab_UCS2_to_GBK == TABLE_ERROR )
- return 0;
-
- for ( i = 0; i < NUMOF_TAB_GBK_TO_UCS2; i++ )
- {
- if ( tab_GBK_to_UCS2[i][1] == 0x0001 )
- continue;
-
- unsigned long k = (unsigned long)tab_GBK_to_UCS2[i][1];
- unsigned long v = (unsigned long)tab_GBK_to_UCS2[i][0];
- ret = Table_put(tab_UCS2_to_GBK, (void*)k, (void*)v);
- if ( ret != TABLE_OK )
- return 0;
- }
-
- return 1;
- }
-
- /*****************************************************************************
- * 将一个字符的Unicode(UCS-2和UCS-4)编码转换成GBK编码.
- *
- * 参数:
- * ucs 字符的Unicode编码值
- * gbk 指向输出的用于存储GBK编码值的缓冲区的指针
- *
- * 返回值:
- * 1. 成功则返回该字符的GBK编码所占用的字节数;
- * 对于ASCII字符返回1, 对于非ASCII中文字符返回2.
- * 2. 失败则返回0.
- *
- * 注意:
- * 1. GKB和Unicode都有字节序要求;
- * 字节序分为大端(Big Endian)和小端(Little Endian)两种;
- * 在Intel处理器中采用小端法表示, 在此采用小端法表示. (低地址存低位)
- ****************************************************************************/
- int enc_unicode_to_GBK_one(unsigned long ucs, unsigned short *gbk)
- {
- assert(gbk != NULL);
-
- if ( ucs < 0x80 )
- {
- *gbk = ucs;
- return 1;
- }
-
- if ( tab_UCS2_to_GBK == NULL )
- if ( enc_stc_unicode_to_GBK_init() == 0 )
- return 0;
-
- void *pvalue;
-
- pvalue = Table_get(tab_UCS2_to_GBK, (void*)ucs);
- if ( pvalue == TABLE_NO_KEY )
- return 0;
-
- *gbk = (unsigned long)pvalue;
-
- return 2;
- }
-
- // #c---end
-
-
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。