我想编写一个小程序来读取XML文件中的数据并将其写入CSV。我通常使用元素树。
XML文件在移动电话的应用程序中有其来源,通常如下所示:
<waypoint><name><![CDATA[POI 2017-07-03 09:37:11nass]]></name>
<coord lat="47.220430" lon="8.951071"/></waypoint>我没有任何问题来访问coord及其内容(经度和纬度)。但是,我如何访问名称的信息:[CDATA[POI 2017-07-03 09:37:11nass]]?
到目前为止,我的代码如下所示:
for poi in POIS:
tree = etree.parse(rootwayp + poi)
root = tree.getroot()
for child in root:
for childchild in child:
print(childchild.tag, ':', childchild.attrib)我认为我需要为名称内容实现另一种读取方法,因为括号不包括那里的信息。我试图访问的信息作为一个子的名字,这是不工作的(可能是因为!在括号里?)到底是什么!<!...>的意思是?
发布于 2017-08-20 08:32:46
<![CDATA[...]]>是一种特殊的标记截面
您可以使用下列选择器提取所需的详细信息:
root = tree.getroot()
print(root.find('name').text)
print(root.find('coord').attrib.get('lat','n/a'))
print(root.find('coord').attrib.get('lon','n/a'))
# Output
POI 2017-07-03 09:37:11nass
47.220430
8.951071使用lxml,您可以提取整个CDATA部分,这是一些医生关于。。
https://stackoverflow.com/questions/45779924
复制相似问题