现在,我想从DataFrame中的文件列表中提取压缩文件夹。DataFrame
file_1.pdf file_1 pdf C:\\temp\documents\file_1.pdf \file_1.pdf
file_2.zip file_2 zip C:\\temp\documents\file_2.zip
我在文档的表格中有一个报告一个州的县的新冠肺炎数字的PDF文档。我使用camelot将表读入到pandas数据帧中,并根据第一列中的值提取各行中的值。为此,我使用布尔索引,如下所述:
我正在使用提取的数据来报告报告中列出的我的组织感兴趣的一些县的新冠肺炎统计数据。我还提取了州的总数,但是PDF的生产者不能决定是否要将该行数据称为"Gesamt“(" total ")或"Gesamtergebnis”("Total result")。在camelo