Xupeng's blog

Jun 21, 2006 - 1 minute read - Comments

原来简繁转换并非那么简单

刚刚在list看到了limodou和swordsp的回复,才明白简繁转换远没有我想象的那么简单。

limodou的回复:
还不是这么简单。你所写的转换只是把big5<->gbk之间互转。但因为gbk汉字有繁体和简体字的区别,因此都是gbk,但却有繁体与简体之分。而big5则只有繁体字。因此,gbk->big5结果应该是一样的。而big5->gbk可能有不同的结果。我当时是从哪里找的对照表我也记不清了,反正是别人做好的,但因为不是python的程序,所以我写了一个转换程序。
unicode是可以转,但没有研究过转出来是哪种结果。

swordsp的回复:
你的程序只能在gb和big码的交集范围内工作,比如把"中文"换成"简体"就出错了。如果要把"简体"转成"簡体",就需要根据专门的转换码表查表,也就是limodou的程序的做法。