我们有一些包含德语元音的文本,例如使用'a‘+组合分音($cc $88)。
你知道如何将这样的文本正确地转换为utf8吗?
发布于 2011-04-22 02:07:09
首先,如果它还不是一个unicode,那么就解码它。第二,unicodedata.normalize()。第三,编码。
unicode
unicodedata.normalize()
https://stackoverflow.com/questions/5748010
相似问题