我想从jsoncpp获取json字符串的字符编码类型: UTF-8、ANSI还是UNICODE?如何获取json::value的字符编码类型?感谢advance!
发布于 2017-01-18 11:02:39
任何字符串都只是一个字节序列,可能符合一些基本规则(null终止符、json的禁止符号等)。没有神奇的方法来确定使用了哪种编码来形成字符串,因为编码只是表示字符串二进制数据的一种方式。因此,json字符串编码应该由json颁发者指定(可能在文档中),或者关于它的信息应该是json的一部分(如果由于某种原因不同的字符串具有不同的编码)。
发布于 2017-01-18 11:18:55
确定字符串的字符编码是相当复杂的。有关选择正确应用程序的信息,请参阅this SO answer。
根据下面的引述,Apache Tika - the content analysis toolkit可能是最先进的之一:
Apache Tika™工具包可以从一千多种不同的文件类型(如PPT、XLS和
)中检测和提取元数据和文本。所有这些文件类型都可以通过一个界面进行解析,这使得Tika对于搜索引擎索引、内容分析、翻译等非常有用。您可以在下载页面上找到最新版本。
可以使用这些库中的每个库来分析JSON字符串,从而得到(可能的)可用于进一步处理的CharSet。
https://stackoverflow.com/questions/41710573
复制相似问题