最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

Unicode汉字编码表

IT圈 admin 22浏览 0评论

2024年4月13日发(作者:但魄)

Unicode汉字编码表

1 unicode编码表

Unicode目前普遍采用的是UCS-2,它用两个字节来编码一

个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般

用十六进制来 表示,为了与十进制区分,十六进制以0x开

头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编

码字符,两个字节就是16位二进制, 2的16次方等于65536,

所以UCS-2最多能编码65536个字符。

编码从0到127的字符与ASCII编码的字符一样,比如字母

"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编

码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode

对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六

七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以

Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字

也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4

规范,就是用4个字节来编码字符,不过现在普遍采用的还是

UCS-2,只用两个字节来编码,看一下Unicode对汉字的编

码:

------------------------------------------------------------------------

2 汉字编码表

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F

-----------------------------------------------------

4e00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏

4e10 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟

4e20 丠 両 丢 丣 两 严 並 丧 丨 丩 个 丫 丬 中 丮 丯

4e30 丰 丱 串 丳 临 丵 丶 丷 丸 丹 为 主 丼 丽 举 丿

4e40 乀 乁 乂 乃 乄 久 乆 乇 么 义 乊 之 乌 乍 乎 乏

4e50 乐 乑 乒 乓 乔 乕 乖 乗 乘 乙 乚 乛 乜 九 乞 也

4e60 习 乡 乢 乣 乤 乥 书 乧 乨 乩 乪 乫 乬 乭 乮 乯

4e70 买 乱 乲 乳 乴 乵 乶 乷 乸 乹 乺 乻 乼 乽 乾 乿

4e80 亀 亁 亂 亃 亄 亅 了 亇 予 争 亊 事 二 亍 于 亏

4e90 亐 云 互 亓 五 井 亖 亗 亘 亙 亚 些 亜 亝 亞 亟

4ea0 亠 亡 亢 亣 交 亥 亦 产 亨 亩 亪 享 京 亭 亮 亯

4eb0 亰 亱 亲 亳 亴 亵 亶 亷 亸 亹 人 亻 亼 亽 亾 亿

4ec0 什 仁 仂 仃 仄 仅 仆 仇 仈 仉 今 介 仌 仍 从 仏

4ed0 仐 仑 仒 仓 仔 仕 他 仗 付 仙 仚 仛 仜 仝 仞 仟

4ee0 仠 仡 仢 代 令 以 仦 仧 仨 仩 仪 仫 们 仭 仮 仯

4ef0 仰 仱 仲 仳 仴 仵 件 价 仸 仹 仺 任 仼 份 仾 仿

4f00 伀 企 伂 伃 伄 伅 伆 伇 伈 伉 伊 伋 伌 伍 伎 伏

4f10 伐 休 伒 伓 伔 伕 伖 众 优 伙 会 伛 伜 伝 伞 伟

4f20 传 伡 伢 伣 伤 伥 伦 伧 伨 伩 伪 伫 伬 伭 伮 伯

------------------------------------------------------

3 汉字编码表

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F

-----------------------------------------------------

4f30 估 伱 伲 伳 伴 伵 伶 伷 伸 伹 伺 伻 似 伽 伾 伿

4f40 佀 佁 佂 佃 佄 佅 但 佇 佈 佉 佊 佋 佌 位 低 住

4f50 佐 佑 佒 体 佔 何 佖 佗 佘 余 佚 佛 作 佝 佞 佟

4f60 你 佡 佢 佣 佤 佥 佦 佧 佨 佩 佪 佫 佬 佭 佮 佯

2024年4月13日发(作者:但魄)

Unicode汉字编码表

1 unicode编码表

Unicode目前普遍采用的是UCS-2,它用两个字节来编码一

个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般

用十六进制来 表示,为了与十进制区分,十六进制以0x开

头,0x7ECF转换成十进制就是32463,UCS-2用两个字节来编

码字符,两个字节就是16位二进制, 2的16次方等于65536,

所以UCS-2最多能编码65536个字符。

编码从0到127的字符与ASCII编码的字符一样,比如字母

"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编

码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode

对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六

七万个汉字,而UCS-2最多能表示65536个,才六万多个,所以

Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字

也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4

规范,就是用4个字节来编码字符,不过现在普遍采用的还是

UCS-2,只用两个字节来编码,看一下Unicode对汉字的编

码:

------------------------------------------------------------------------

2 汉字编码表

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F

-----------------------------------------------------

4e00 一 丁 丂 七 丄 丅 丆 万 丈 三 上 下 丌 不 与 丏

4e10 丐 丑 丒 专 且 丕 世 丗 丘 丙 业 丛 东 丝 丞 丟

4e20 丠 両 丢 丣 两 严 並 丧 丨 丩 个 丫 丬 中 丮 丯

4e30 丰 丱 串 丳 临 丵 丶 丷 丸 丹 为 主 丼 丽 举 丿

4e40 乀 乁 乂 乃 乄 久 乆 乇 么 义 乊 之 乌 乍 乎 乏

4e50 乐 乑 乒 乓 乔 乕 乖 乗 乘 乙 乚 乛 乜 九 乞 也

4e60 习 乡 乢 乣 乤 乥 书 乧 乨 乩 乪 乫 乬 乭 乮 乯

4e70 买 乱 乲 乳 乴 乵 乶 乷 乸 乹 乺 乻 乼 乽 乾 乿

4e80 亀 亁 亂 亃 亄 亅 了 亇 予 争 亊 事 二 亍 于 亏

4e90 亐 云 互 亓 五 井 亖 亗 亘 亙 亚 些 亜 亝 亞 亟

4ea0 亠 亡 亢 亣 交 亥 亦 产 亨 亩 亪 享 京 亭 亮 亯

4eb0 亰 亱 亲 亳 亴 亵 亶 亷 亸 亹 人 亻 亼 亽 亾 亿

4ec0 什 仁 仂 仃 仄 仅 仆 仇 仈 仉 今 介 仌 仍 从 仏

4ed0 仐 仑 仒 仓 仔 仕 他 仗 付 仙 仚 仛 仜 仝 仞 仟

4ee0 仠 仡 仢 代 令 以 仦 仧 仨 仩 仪 仫 们 仭 仮 仯

4ef0 仰 仱 仲 仳 仴 仵 件 价 仸 仹 仺 任 仼 份 仾 仿

4f00 伀 企 伂 伃 伄 伅 伆 伇 伈 伉 伊 伋 伌 伍 伎 伏

4f10 伐 休 伒 伓 伔 伕 伖 众 优 伙 会 伛 伜 伝 伞 伟

4f20 传 伡 伢 伣 伤 伥 伦 伧 伨 伩 伪 伫 伬 伭 伮 伯

------------------------------------------------------

3 汉字编码表

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F

-----------------------------------------------------

4f30 估 伱 伲 伳 伴 伵 伶 伷 伸 伹 伺 伻 似 伽 伾 伿

4f40 佀 佁 佂 佃 佄 佅 但 佇 佈 佉 佊 佋 佌 位 低 住

4f50 佐 佑 佒 体 佔 何 佖 佗 佘 余 佚 佛 作 佝 佞 佟

4f60 你 佡 佢 佣 佤 佥 佦 佧 佨 佩 佪 佫 佬 佭 佮 佯

发布评论

评论列表 (0)

  1. 暂无评论