作业帮 > 综合 > 作业

c# 处理某些占4个字节的汉字问题

来源:学生作业帮 编辑:拍题作业网作业帮 分类:综合作业 时间:2024/03/29 23:56:48
c# 处理某些占4个字节的汉字问题
今天才知道原来有占4个字节的汉字
假设 有一个字符串 是3个汉字 第2个汉字占了4个字节,这时返回的长度是8,而我需要循环对所有单个汉字进行处理,当处理到第2个字的时候 我必须 要substring(1,2) 才能取出这个字,
所以我的问题是 我怎么才能知道 到第2个字的时候 要取两位长度才可以呢
字符集 统统使用的是 Unicode
当我String.SubString(1,1) 的时候 只取出了这个字的一半,能不能有什么方法 在取出一半的时候能判断出来这是一半,如果是一半,我再去String.SubString(1,2)取出全部
占多少个字节得看你用的是什么编码集.
如果是GBK和GB2312的话,确实是两个字节,在Windows平台上会是你预期的两个字节.
utf8, 它是变字节的2个3个4个可能都有的.
再问: 是用的 Unicode字符集
再答: http://bbs.csdn.net/topics/330107389
其中第一个字的范围是:d800-dbff,第二个字的范围是:dc00-dfff.

这个链接,你可以去看一下。是否能帮你处理。
再问: 非常感谢 但是用什么方法能得到字的范围呢 我是用c#写的程序
再答: 具体的我也不清楚,我对你这个问题比较感兴趣。有答案后,顺便告诉我一份。