Page 271 - 中英科学技术常用词(频率)词典
P. 271

附录



                 计算各词序号与总序号(词总数)的百分比,命名为 B。
                 当 A+B 最接近于 100% 的点的词序号。就是分界点,简称界点。
                 界点的图示,参见图 1。


















                                     图 1 长尾模型分界点示意图

                 我们编写了计算软件,使用核心术语集和的软件工具可以方便地计算出核心

             术语,核心汉字,核心部首,以及各国语言中的核心单词等。
                 全部计算过程见表 1,Unicode10.0 汉字数(按部首分类统计):87849 部首
             采用《康熙字典》部首,汉字编码由国际标准化组织和 UNICODE 决定。

                               表 1 87849 个汉字(按部首)分类统计表

                                              占总数      字数累计百                 序号累计百
               序号    部首字     部首号 汉字数量                              A+B 的和
                                              百分比      分比(A)                 分比(B)
 ⾉  ⾽ ⼻ ⽁ ⼧ ⽧   1 ⾡ ⽷ ⾋       140    3641     4.1446%   4.1446%    4.6119%    0.4672%
 ⿋              2      口      30     3274     3.7268%   7.8714%    8.8060%    0.9345%
                3      水      85     3206     3.6494%    11.520%   12.922%    1.4018%
 ⽞
                4      木      75     3087     3.5139%   15.034%    16.904%    1.8691%
                5      手      64     2481     2.8241%   17.859%    20.195%    2.3364%
                6      金      167    2344     2.6682%   20.527%    23.331%    2.8037%
                7      心      61     2219     2.5259%   23.053%    26.324%    3.2710%
                8      人       9     1892     2.1536%   25.206%    28.945%    3.7383%
                9      火      86     1850     2.1058%   27.312%    31.518%    4.2056%
                10     虫      142    1741     1.9818%   29.294%    33.967%    4.6728%
 ⾉  ⾽  ⼻  ⽁  ⼧  11 ⽧  ⾡  ⽷  ⾋ 120    1735     1.9749%   31.269%    36.409%    5.1401%

 ⿋              12     竹      118    1681     1.9135%   33.183%    38.790%    5.6074%
                13     土      32     1679     1.9112%   35.094%    41.169%    6.0747%
 ⽞


                                                                                 ·235·
   266   267   268   269   270   271   272   273   274   275   276