当前位置: 首页 > 资讯

天天速读:[oeasy]python0127_中文系统_gbk_BIG5_南极星_内码转化

日期:2023-04-05 19:11:04 来源:哔哩哔哩

中文系统bgk

回忆上次内容

汉字字形通过

点阵式打字机

像素级寻址的屏幕


(资料图片仅供参考)

进入了计算机的世界

在海峡对岸的台湾同胞

也进入了汉字时代

他们会使用GB2312编码吗?

能互通吗?

中国台湾

BIG5 码

是由 5 个公司联合制作的

收录次序 取决于 频率

然后是 笔画数

然后是 康熙字典

同时用 BIG5 编码和解码也是没有问题的

但如果用BIG5编码

却用gb2312解码就会有问题

不过存储的内容在文件里

系统不知道用什么解码时

默认自动会用 gb2312 解码

这就造成了自动乱码

反之亦然

我们用 gb2312 编码的文字

用 gb2312 可以打开

但是用 BIG5 打开就是乱码

也需要转化

转化工具是有的

能解决问题但很麻烦

大量的输入输出编码解码的问题

令人头大

确实麻烦

解决办法

麻烦的地方正是机会所在

当时如果日文游戏或者台湾地区的游戏不能玩

可能是因为字符编码格式不一致

可以用南极星调整字符编码格式

把不同编码格式进行转化

把字节按照正确的方式进行解码

就可以玩啦

没有个标准整合一下吗?

GBK

GBK 即汉字内码扩展规范

在GB2312的基础上扩展了繁体字符集

K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母

英文全称 Chinese Internal Code Specification

最初是微软搞的

虽然不是国家标准

却是事实上的技术规范

共收入 21886 个汉字和图形符号

GB 2312 中的全部汉字、非汉字符号

BIG5 中的全部汉字(繁体兼容 GBK1)

将 汉字、日本汉字、朝鲜汉字融合了

合计 20902 个汉字

标准并不是一蹴而就的

标准的烟花

正如ASA X3.4-1963

最终到ascii

到 ASA X3.4-1965

GB也在不断进化

到GB/T 1355-2021

这是小麦粉标准的进化

从GB/T 1355-86

从GB2312-1986

这是中文字符标准的进化

再到GBK

但是还是有问题

GBK虽然兼容了BIG5 中的全部汉字

用GBK打开BIG5编码的文件还是乱码

但是无法兼容编码

问题

如果新GBK兼容了BIG5编码

就无法向前兼容gb2312

这无解了吗?

时间自会给我们答案

老天自有安排!

推荐一款 点阵字库

中文点阵

最小也需要 7x7 像素

这个风格很独特

字体辨识度

字体辨识度

字体样式

1994年的《魔兽争霸》

字体不但可以有衬线

而且可以有立体感

像素字体在RGB显卡的支持下

配色也很细腻

中文隶书

智冠公司出品的《三国演义》

使用隶书和车马符号

代表那个三国时代

终端时代的中文超文本编辑器

当时的wps系统

wps

当时还没有所见即所得

使用一些编辑标记

制作富文本

只有打印预览才能查看效果

中文之星

还可以做艺术字特效

总结

中国的简体和繁体汉字

字符数量都超级大

彼此还认对方为乱码

如果有一种编码 将所有的字符都能编进去就好了

中日韩(CJK)

简体繁体

欧洲各种拼音

梵文

阿拉伯文

等等等都包括进去

能有么?

我们下次再说!

蓝桥->https://www.lanqiao.cn/courses/3584

github->https://github.com/overmind1980/oeasy-python-tutorial

gitee->https://gitee.com/overmind1980/oeasypython

标签:

上一篇:

下一篇:

热门推荐

猜你喜欢

市场