我想用minidom解析一个文件:
with codecs.open(fname, encoding="utf-8") as xml:
dom = parse(xml)返回UnicodeEncodeError。XML文件采用UTF-8格式,没有BOM格式,并且具有
<?xml version="1.0" encoding="utf-8"?>在第一行。
如果我第一次读取该文件,对其执行.encode("utf-8")并将其传递给parseString,它就可以正常工作。有没有一种方法可以直接用minidom.parse解析UTF-8XML文件?
发布于 2013-07-16 21:05:31
将解码留给XML解析器;它将检测要使用的编解码器。打开文件而不转换为unicode:
with open(fname) as xml:
dom = parse(xml)请注意,使用的是标准函数open()而不是codecs.open()。
这适用于任何XML解析器;解析器的工作是从XML前言中确定要使用哪个编解码器来解析文档。如果不存在前言,则默认使用UTF-8。
https://stackoverflow.com/questions/17677227
复制相似问题