首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将Unicode转换为ASCII等价物(SCRAPY)

将Unicode转换为ASCII等价物(SCRAPY)
EN

Stack Overflow用户
提问于 2019-05-03 10:20:57
回答 1查看 199关注 0票数 1

我使用Scrapy从新闻网站抓取文章,并将其添加到mongoDB。但是在插入时,我在MongoDb中得到了如下的unicode字符

“文章”:“微软云与企业执行副总裁萨蒂亚·纳德拉(Satya Nadella )刚刚被任命为微软下一任首席执行官。

我试过了

代码语言:javascript
复制
FEED_EXPORT_ENCODING = "utf-8"

但是它只在我以JSON的形式运行爬虫和导出数据时起作用,而不是在MongoDB中存储数据时起作用。

在spider.py文件中,我编写了这一行代码以获取文章

代码语言:javascript
复制
item["article"]=response.xpath('//p/text()').getall()

item["article"] =' '.join(item['article'])

如何将这些字符替换为它们的ASCII等价物?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-03 11:42:34

这个解决方案对我有效(Character encoding in python to replace 'u2019' with ')

代码语言:javascript
复制
import unidecode 

a=unidecode.unidecode( "Satya Nadella, Microsoft\u2019s executive vice president of cloud and enterprise, has just been named the company\u2019s next CEO.")
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55967845

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档