今天才注意到,Unicode 17.0版标准在9.9已经发布,新增了不少新的汉字(称为CJK扩展字符集J),但 大部分是日常生活中用不到的字符,主要是古汉(日韩)文献中用到的罕用字。
贴一张官方的说明如下(用谷歌翻译的英文内容):
几个重点信息,1) 总CJK汉字超过了10万个 2)新增CJK EXT J区 3)新增了几个表情符号和沙特货币符号。 4)总字符数达到了159801个。
另外,想到了一个之前在抖音上看到的关于小学语文中一些字(比如“突”字)的字形变化,前后不一致,到底哪一个是标准字形的问题,我觉得可以参考Unicode标准中字形的来判断,它每个字符都有标准字符形状,也包括了主要变体的形状,最重要的是,它是国际标准,变动和调整字形时,远比现今国内教材的编辑要来得严谨与慎重,而且是广泛被认可,因此我认为更为权威和合理。具体你可以下载标准的字符集文件来看,PDF格式。
下载地址 Unicode 17.0 字符集