Page 271 - 中英科学技术常用词(频率)词典
P. 271
附录
计算各词序号与总序号(词总数)的百分比,命名为 B。
当 A+B 最接近于 100% 的点的词序号。就是分界点,简称界点。
界点的图示,参见图 1。
图 1 长尾模型分界点示意图
我们编写了计算软件,使用核心术语集和的软件工具可以方便地计算出核心
术语,核心汉字,核心部首,以及各国语言中的核心单词等。
全部计算过程见表 1,Unicode10.0 汉字数(按部首分类统计):87849 部首
采用《康熙字典》部首,汉字编码由国际标准化组织和 UNICODE 决定。
表 1 87849 个汉字(按部首)分类统计表
占总数 字数累计百 序号累计百
序号 部首字 部首号 汉字数量 A+B 的和
百分比 分比(A) 分比(B)
⾉ ⾽ ⼻ ⽁ ⼧ ⽧ 1 ⾡ ⽷ ⾋ 140 3641 4.1446% 4.1446% 4.6119% 0.4672%
⿋ 2 口 30 3274 3.7268% 7.8714% 8.8060% 0.9345%
3 水 85 3206 3.6494% 11.520% 12.922% 1.4018%
⽞
4 木 75 3087 3.5139% 15.034% 16.904% 1.8691%
5 手 64 2481 2.8241% 17.859% 20.195% 2.3364%
6 金 167 2344 2.6682% 20.527% 23.331% 2.8037%
7 心 61 2219 2.5259% 23.053% 26.324% 3.2710%
8 人 9 1892 2.1536% 25.206% 28.945% 3.7383%
9 火 86 1850 2.1058% 27.312% 31.518% 4.2056%
10 虫 142 1741 1.9818% 29.294% 33.967% 4.6728%
⾉ ⾽ ⼻ ⽁ ⼧ 11 ⽧ ⾡ ⽷ ⾋ 120 1735 1.9749% 31.269% 36.409% 5.1401%
⿋ 12 竹 118 1681 1.9135% 33.183% 38.790% 5.6074%
13 土 32 1679 1.9112% 35.094% 41.169% 6.0747%
⽞
·235·

