我正在开发一个应用程序,这将有一些网站的网络爬虫。
应用程序将通过URL触发Azure函数,爬虫将从该URL开始工作。
到目前为止,一切顺利,但是,我们必须保存一些爬虫通过该站点的证据。我们正在考虑用爬虫经过的屏幕保存一个PDF文件,但是,由于Azure函数没有GDI+,它不能与Selenium或PhantomJS一起工作。
一种不同的方法是下载HTML内容并以某种方式将此HTML字符串(带有所有JS和CSS依赖项)保存到PDF文件中。
我想要一些库,它可以与Azure函数一起工作,以制作一些URL (或HTML字符串)的屏幕截图,并保存为PDF。
谢谢。
https://stackoverflow.com/questions/51363799
复制相似问题