搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏微宝阁SCRM小程序商城
C# codepage转码BIG5
BIG5繁体遍历不同编码代码如下： static void savebig5() { StringBuilder sb = new StringBuilder()
1.3K30发布于 2019-07-23
来自专栏horstxu的博客
繁体中文大五码（Big5）编码详解
同GBK编码一样，Big5编码也是采用双字节编码，兼容ASCII码。也就是说每个繁体中文汉字在Big5下占据2bytes。因为Big5编码兼容ASCII，所以Big5的2bytes中，第一个byte不会和ASCII有重叠，即第一个Big5编码文字的第一个byte不会出现0x00至0x7F之间的值。这里需要注意的是Big5编码并没有充分考虑到简体中文，虽然最终的Big5编码中包含了一些简体中文的常见字，但是并不全，导致你书写简体中文如果用Big5编码的话，有些字是打不出来的，所以非常不建议在简体中文环境中使用 Big5。 “尴”字在Big5中没有收录，取而代之的是“尷” 另一点是，即使Big5和GBK中都有的文字，对同一个文字的具体编码也不一样，例如“港澳台”三个字在GBK和Big5中的值完全没有任何关系（当然
29.3K100发布于 2019-01-14
来自专栏oeasy教您玩转linux、python
[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化
中国台湾 BIG5 码是由 5 个公司联合制作的收录次序取决于频率然后是笔画数然后是康熙字典同时用 BIG5 编码和解码也是没有问题的但如果用BIG5编码却用gb2312解码就会有问题添加图片注释 140 字（可选）不过存储的内容在文件里系统不知道用什么解码时默认自动会用 gb2312 解码这就造成了自动乱码反之亦然我们用 gb2312 编码的文字用 gb2312 可以打开但是用 BIG5 Specification最初是微软搞的虽然不是国家标准却是事实上的技术规范添加图片注释，不超过 140 字（可选）共收入 21886 个汉字和图形符号 GB 2312 中的全部汉字、非汉字符号BIG5 ）GB也在不断进化从GB/T 1355-86 到GB/T 1355-2021 这是小麦粉标准的进化从GB2312-1986 再到GBK 这是中文字符标准的进化但是还是有问题GBK虽然兼容了BIG5 中的全部汉字但是无法兼容编码用GBK打开BIG5编码的文件还是乱码问题如果新GBK兼容了BIG5编码就无法向前兼容gb2312添加图片注释，不超过 140 字（可选）这无解了吗？
82520编辑于 2023-04-05
来自专栏全栈程序员必看
mysql数据库创建、删除数据库
| Description | Default collation | Maxlen | +———-+—————————–+———————+——–+ | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 | | dec8 | DEC West European | Default | Compiled | Sortlen | +————————–+———-+—–+———+———-+———+ | big5_chinese_ci | big5 | 1 | Yes | Yes | 1 | | big5_bin | big5 | 84 | |
6.9K20编辑于 2022-07-07
来自专栏全栈程序员必看
ANSI和ASCII、GBK和GB2312、Unicode和UTF-8的区别
在简体中文Windows操作系统中，ANSI 编码代表 GBK 编码；在英文Windows操作系统中，ANSI 编码代表 ASCII编码；在繁体中文Windows操作系统中，ANSI编码代表Big5；在日文与此对应的还有BIG5，是中华民国政府制定的，繁体汉字的编码规范，一般应用于海外计算机的繁体中文显示。所谓的繁体中文Windows，简体中文Windows，指的就是采用BIG5和GB2312编码格式的操作系统。这两种编码方式不兼容，如果使用一种编码的文本阅读器来读另一种编码的文本，就会出现乱码。比如在简体中文Windows上读BIG5编码的文件，就是乱码，反之亦然。使用简体浏览器浏览的时候，到了繁体中文网站，如果不改变码制，也是乱码。 GBK大字符集包含的汉字数量比GB2312和BIG5多，使得汉字兼容足够使用。
3.2K10编辑于 2022-07-01
来自专栏程序员的成长之路
MySQL从删库到跑路（二）——MySQL字符集与乱码解析
字符集(Character set)是多个字符的集合，字符集种类较多，每个字符集包含的字符个数不同，常见字符集名称：ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode 编码实例： select hex(convert('hello' using big5)); 字符串“hello”的BIG5编码：0x68656C6C6F 从以上实例可以看出，Latin1字符集兼容ASCII 字符集；UTF-8、GBK、GB2312、BIG5字符集都兼容Latin1字符集。中文“很屌”的BIG5编码实例： select hex(convert('很屌' using big5)); “很屌”的BIG5编码：0xABDCCE78 中文“很屌”的Latin1编码实例： select GB2312支持简体中文，BIG5支持繁体中文，GBK支持简体中文及繁体中文，UTF-8支持几乎所有字符。 GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。
1.3K20发布于 2019-03-19
来自专栏iSharkFly
网络编程常用的几种字符编码
GBK编码支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字，并包含了BIG5编码中的所有汉字。 BIG5这个简称就是繁体中文使用的，主要在台湾，香港地区使用。BIG5编码又称大五码，是繁体中文字符集编码标准，共收录13060个中文字，其中有二字为重复编码。 BIG5重复地收录了两个相同的字：“兀、兀”（A461及C94A)、“嗀、嗀”(DCD1及DDFC)。适用于台湾和香港地区的繁体中文系统软件等。 BIG5 目前已经不怎么使用了，我们在这里列出来就是想说明下曾经还有一个这样的编码而已。Unicode你的救星来了。
1.5K30编辑于 2022-07-02
来自专栏王小雷
Mysql设置UTF-8字符集
2.windows下设置mysql UTF-8字符集编辑my.ini增加 [mysqld] character-set-server=big5 [client] default-character-set =big5 [windows下安装mysql及设置字符集]http://blog.csdn.net/dream_an/article/details/51058710 3.官方设置文档
3.1K40发布于 2019-05-26
来自专栏黑泽君的专栏
使用 Notepad++ 编辑 .java 文件时的相关配置
不同的国家和地区制定了不同的标准，由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。在简体中文Windows操作系统中，ANSI 编码代表 GBK 编码；　　　　在繁体中文Windows操作系统中，ANSI编码代表 Big5 编码；　　　　在日文Windows操作系统中，ANSI
1.1K10发布于 2018-10-11
来自专栏黑泽君的专栏
ANSI是什么？
不同的国家和地区制定了不同的标准，由此产生了 GB2312、GBK、GB18030、Big5、Shift_JIS 等各自的编码标准。在简体中文Windows操作系统中，ANSI 编码代表 GBK 编码；在繁体中文Windows操作系统中，ANSI编码代表Big5；在日文Windows操作系统中，ANSI 编码代表 Shift_JIS
2.3K20发布于 2018-10-11
来自专栏C/C++基础
MySQL 排序规则
---------------------+----------+-----+---------+----------+---------+ | big5_chinese_ci | big5 | 1 | Yes | Yes | 1 | | big5_bin | big5 | 84 | | Yes MAXLEN | +--------------------+----------------------+---------------------------------+--------+ | big5 | big5_chinese_ci | Big5 Traditional Chinese | 2 | | dec8
2.7K20编辑于 2023-10-12
来自专栏学习与分享
字符集详解
字符集是多个字符的集合，字符集种类较多，每个字符集包含的字符个数不同，常见字符集名称：ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。 BIG5字符集 BIG5是中国台湾省使用的汉字字符集，总计有13053个汉字。BIG5也被广泛用于繁体中文的处理。 GB18030字符集 GB18030是中国国家标准的汉字字符集，是目前最新的版本。字符集的种类很多，包括ASCII、Latin、GBK、GB2312、Big5、UTF-8、UTF-16、UTF-32等。
1.1K10编辑于 2024-02-20
来自专栏即时通讯技术
字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8
常见字符集名称：ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。 11.2 BIG5字符集&编码 Big5，又称为大五码或五大码，是使用繁体中文（正体中文）社区中最常用的电脑汉字字符集标准，共收录13,060个汉字。中文码分为内码及交换码两类，Big5属中文内码，知名的中文交换码有CCCII、CNS11643。 Big5虽普及于中国台湾、中国香港与中国澳门等繁体中文通行区，但长期以来并非当地的国家标准，而只是业界标准。有关Big5的更多技术细节读者可单独深入研究，本文就不赘述了。
3.1K20发布于 2018-08-29
来自专栏Listenlii的生物信息笔记
R：qgraph初探
示例 >install.packages("qgraph") >library(qgraph) >data(big5) >data(big5groups) >big5Graph <- qgraph(cor (big5),minimum=0.25,groups=big5groups, legend=TRUE,borders=FALSE, title = "Big 5
5K32发布于 2020-05-29
来自专栏梁康的专栏
字符集与字符编码总结
常见的字符集除了ASCII字符集，还有GB2312字符集、BIG5字符集、Unicode字符集等等。字符编码：字符集仅仅是一个字符的集合，它并不知道也不关心字符集里的某个字符在计算机上是怎么存储的。 (3) BIG***字符集 & 字符编码常见的有BIG5字符集及编码。BIG5是使用繁体中文社区中最常用的电脑汉字字符集标准，普及于港澳台等繁体中文通行区。 BIG5仅仅是业界的一个常用标准，并非国家标准。BIG5字符编码属于上述MBCS的一种，使用两个字节来存储一个字符，并且拥有“造字区”供用户（这里的用户指的是计算机/操作系统的生产厂商）自定义字符。例如倚天中文系统、Windows等操作系统都支持BIG5字符集和字符编码，并且定义了自己的造字区，因此BIG5实际上有多个派生的版本。 (4) Unicode字符集及其字符编码像中文使用的GB2312、BIG5字符集和字符编码一样，很多其他非英文国家和地区，也创造了自己的一套字符集和字符编码。
1.8K11编辑于 2022-10-19
来自专栏架构师成长之路
字符编码详解及由来
因为Big5的字符编码范围同GB2312字符的存储码范围存在冲突，所以在同一正文不能对两种字符集的字符同时支持。 Big5编码的分布如表1－5所示，Big5字符主要部分集中在三个段内：标点符号、希腊字母及特殊符号；常用汉字；非常用汉字。其余部分保留给其他厂商支持。目前，Big5编码在中国台湾、中国香港、中国澳门及其他海外华人中普遍使用，成为了繁体中文编码的事实标准。在互联网中检索繁体中文网站，所打开的网页中，大多都是通过Big5编码产生的文档。对于英文文件是ASCII编码，对于简体中文文件是GB2312编码（只针对Windows简体中文版，如果是繁体中文版会采用Big5码）。
1.5K20编辑于 2022-04-14
来自专栏全栈程序员必看
Codecs模块[通俗易懂]
, sys # 用codecs提供的open方法来指定打开的文件的语言编码，它会在读取的时候自动转换为内部unicode bfile = codecs.open(“dddd.txt”, ‘r’, “big5 如果使用语言内建的open函数来打开文件，这里看到的必定是乱码 print ss, type(ss) 上面这个处理big5的，可以去找段big5编码的文件试试。
57820编辑于 2022-07-31
来自专栏全栈程序员必看
用ASP实现简单的繁简转换
用ASP实现简单的繁简转换国际化似乎是一个很流行的口号了，一个站点没有英文版至少也要弄个繁体版，毕竟都是汉字，翻译起来不会那么麻烦:P 一般的繁简转换是使用字典，通过GB的内码算出BIG5字符在字典中的位置这里介绍的方法思路更简单一些，用Dictionary对象，就是字典，呵呵，dicGb2Big5(gb)就是相应的BIG5。
2.6K10编辑于 2022-07-09
来自专栏全栈程序员必看
python中codecs模块_python自然语言编码转换模块codecs介绍
codecs, sys # 用codecs提供的open方法来指定打开的文件的语言编码，它会在读取的时候自动转换为内部unicode bfile = codecs.open(“dddd.txt”, ‘r’, “big5 如果使用语言内建的open函数来打开文件，这里看到的必定是乱码 print ss, type(ss) 上面这个处理big5的，可以去找段big5编码的文件试试。
56110编辑于 2022-07-28
来自专栏C语言
【LuckiBit】编码格式详解：字符、字符集与编码方式的系统全面解析
256 西欧语言 Latin-1，是 HTML 默认字符集之一 GB2312 1980s ~6,700 简体中文中国早期标准 GBK 1990s ~21,000 简体中文向下兼容 GB2312 BIG5 ASCII 1 字节否否英文最基本，最兼容 GB2312 GB2312 1~2 字节是否旧中文系统覆盖面小 GBK GBK 1~2 字节是否 Windows 系统常用，不是国际标准 BIG5 BIG5 2 字节否否台湾地区与 GBK 不兼容 UTF-8 Unicode 1~4 字节是是网络传输、跨平台为环境最推荐，兼容 ASCII UTF-16 LE/BE Unicode
38410编辑于 2025-07-10

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

C# codepage转码BIG5

繁体中文大五码（Big5）编码详解

[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化

mysql数据库创建、删除数据库

ANSI和ASCII、GBK和GB2312、Unicode和UTF-8的区别

MySQL从删库到跑路（二）——MySQL字符集与乱码解析

网络编程常用的几种字符编码

Mysql设置UTF-8字符集

使用 Notepad++ 编辑 .java 文件时的相关配置

ANSI是什么？

MySQL 排序规则

字符集详解

字符编码那点事：快速理解ASCII、Unicode、GBK和UTF-8

R：qgraph初探

字符集与字符编码总结

字符编码详解及由来

Codecs模块[通俗易懂]

用ASP实现简单的繁简转换

python中codecs模块_python自然语言编码转换模块codecs介绍

【LuckiBit】编码格式详解：字符、字符集与编码方式的系统全面解析

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐