我正在尝试用Python3.5.3从web服务下载一个CSV文件。但我总是会犯错误。
示例
我有这个网址
http://www.imdb.com/list/export?list_id=watchlist&author_id=ur72234145如果我用浏览器打开它,它就开始下载一个watchlist.csv文件。我编写了以下Phython代码:
import urllib
url = 'http://www.imdb.com/list/export?list_id=watchlist&author_id=ur72234145'
response = urllib.request.Request(url)
html = response.read()
with open('output.csv', 'wb') as f:
f.write(html)但我知道错误是:
追踪(最近一次调用):File "",第1行,html = response.read() AttributeError:'Request‘object没有属性'read’
怎么了?如果我对静态文件路径使用相同的代码,那么它可以工作,但它不适用于web服务。
我不认为这是一个重复的问题,因为这是关于PDF和如何管理PDF,而不是关于CSV和如何下载。
发布于 2017-02-02 20:12:02
您可以使用urlretrieve
import urllib
import urllib.request
url = 'http://www.imdb.com/list/export?list_id=watchlist&author_id=ur72234145'
urllib.request.urlretrieve(url, 'output.csv')因为您的url给了我ERROR 404,所以使用try/except更安全
import urllib
import urllib.request
import urllib.error
url = 'http://www.imdb.com/list/export?list_id=watchlist&author_id=ur72234145'
try:
urllib.request.urlretrieve(url, 'output.csv')
except urllib.error.HTTPError as ex:
print('Problem:', ex)发布于 2017-02-02 18:10:30
我不是urllib包的常客,我倾向于使用requests,也就是人类的HTTP。但是,只有通过阅读这个关于何图的urllib,我才能看到您正在尝试从Request的一个实例中获取read,这给出了您正在看到的错误。相反,您应该从一个response中读取,后者依次从获得打开一个请求的。
下面的片段是我提供的链接中官方示例的一个简单修改,也就是说,我没有尝试它,它只是为了说明我的观点。我认为它应该给你一些工作上的帮助。
url = 'http://www.imdb.com/list/export'
values = {'list_id' : 'watchlist',
'author_id' : 'ur72234145'}
data = urllib.parse.urlencode(values)
data = data.encode('ascii') # data should be bytes
req = urllib.request.Request(url, data) # NOTE: you try to read from req
with urllib.request.urlopen(req) as response:
the_csv = response.read() # NOTE: you should read from the response,
# which is the result of opening reqhttps://stackoverflow.com/questions/41992223
复制相似问题