我试图用以下代码刮一个波斯语网站:
import urlparse, urllib
parts = urlparse.urlsplit(u'http://fa.wikipedia.org/wiki/صفحهٔ_اصلی')
parts = parts._replace(path=urllib.quote(parts.path.encode('utf8')))
encoded_url = parts.geturl().encode('ascii')
'https://fa.wikipedia.org/wiki/%D8%B5%D9%81%D8%AD%D9%87%D9%94_%D8%A7%D8%B5%D9%84%DB%8C'当我运行我的爬虫时,我会在提示符中得到这个错误消息:
ModuleNotFoundError:没有名为urlparse的模块
在VS代码中有三个划线词。当我单击它们时,会显示以下错误消息:
我的密码怎么了?
发布于 2020-05-16 15:37:08
import urllib.parse
parts = urllib.parse.urlsplit(u'http://fa.wikipedia.org/wiki/صفحهٔ_اصلی')
parts = parts._replace(path=urllib.parse.quote(parts.path.encode('utf8')))
encoded_url = parts.geturl().encode('ascii')
'https://fa.wikipedia.org/wiki/%D8%B5%D9%81%D8%AD%D9%87%D9%94_%D8%A7%D8%B5%D9%84%DB%8C'
print(encoded_url)这段代码在python3.*环境中运行,因为urlparse库被urllib.parse所取代。
发布于 2020-05-16 15:36:56
发布于 2022-05-05 15:25:36
您应该只使用这个:
FEED_EXPORT_ENCODING='UTF-8'
在settings.py文件中。
https://stackoverflow.com/questions/61839081
复制相似问题