首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何获取json文件的字符编码类型?

如何获取json文件的字符编码类型?
EN

Stack Overflow用户
提问于 2017-01-18 10:48:03
回答 2查看 415关注 0票数 0

我想从jsoncpp获取json字符串的字符编码类型: UTF-8、ANSI还是UNICODE?如何获取json::value的字符编码类型?感谢advance!

EN

回答 2

Stack Overflow用户

发布于 2017-01-18 11:02:39

任何字符串都只是一个字节序列,可能符合一些基本规则(null终止符、json的禁止符号等)。没有神奇的方法来确定使用了哪种编码来形成字符串,因为编码只是表示字符串二进制数据的一种方式。因此,json字符串编码应该由json颁发者指定(可能在文档中),或者关于它的信息应该是json的一部分(如果由于某种原因不同的字符串具有不同的编码)。

票数 0
EN

Stack Overflow用户

发布于 2017-01-18 11:18:55

确定字符串的字符编码是相当复杂的。有关选择正确应用程序的信息,请参阅this SO answer

根据下面的引述,Apache Tika - the content analysis toolkit可能是最先进的之一:

Apache Tika™工具包可以从一千多种不同的文件类型(如PPT、XLS和

)中检测和提取元数据和文本。所有这些文件类型都可以通过一个界面进行解析,这使得Tika对于搜索引擎索引、内容分析、翻译等非常有用。您可以在下载页面上找到最新版本。

可以使用这些库中的每个库来分析JSON字符串,从而得到(可能的)可用于进一步处理的CharSet。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41710573

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档