我在2pdf比较工作,在那里我提取的第一个pdf,以获得的PDF格式的样式,.PDF样式被提取和转换为html。最后,我比较了两个HTML文本。
对于PDF提取,我使用itextsharp。
以下是代码
this.result.AppendFormat(
"<tr><td>{0}</td><td>{1}</td><td>{2}pt</td><td>{3}</td><td>{4}</td><td>",
Form1.j, curFont, font_size_client, fontweight, fontstyle);
}
this.result.Append(renderInfo.GetText());
}
public string GetResultantText()
{
if (result.Length > 0)
{
result.Append("<tr><td></td><td></td>");
}
return result.ToString();
}这是我用来进行转换的代码。我的问题是一个样例PDF我使用超文本标记语言课本本身来比较文本.in HTMLbook有一些样式,如背景颜色,字体大小被附加到文本。它不是文本,而是风格。你能告诉我如何提取风格吗?是我选择的比较2个PDF的方法是错误的。或任何其他方法。
发布于 2014-04-28 20:29:07
https://stackoverflow.com/questions/16910208
复制相似问题