Page 11 - 中英科学技术常用词(频率)词典
P. 11

preface





             为核心的词汇的词群,从而给予人们一个整体的概念体系,通过核心概念的词群,
             以至于核心概念词群和词群的相互联系,可以构成词汇群体,这个集合也可以叫
             做术语云团,云团和云团的关系构成知识链接网络,构成大型科技术语云。

                 随着历史的发展,随着新时代新技术新工具的应用,知识云团也在发生着变
             化。科技术语云、知识云团和云团的交汇,组成了更大的云团,形成更大的知识
             网络和知识群体。这也就是大数据时代知识的存储、表示、查询、知识检索而服
             务于社会所必需的要素。

                 这也是知识理论和知识技术所追求的方向。从词典学的研究来说,简单和复
             杂具有一定的关系。在纷繁复杂的事物中,人们追求简单快捷的知识表达方法。
             简单快捷掌握的科技知识大门的钥匙。这本科学技术常用频率词典编辑的宗旨,
             希望在世界各国的术语交流中,科学技术名词的交流中,得到一个为全球科学普

             及接近统一的科学技术概念体系。从而为世界范围内的科学技术交流与深入研究
             提供工具即常用科学技术频率词典。
                 当然,这部词典的诞生,是多年的研究所得到的结果。并且把术语学知识和
             构词理念带给青年科技工作者,进一步研究汉语术语学的核心部件以及开展汉字

             学科学研究工程。根据这两次学术交流会论文和多年以来的对著名语言学家冯志
             伟导师的术语经济率、词汇分布率计算,自然语言计算机形式的处理的理论学习,
             用人工智能和大数据的方法进行词典编辑,也是一个首次的尝试。感谢国际出版
             社的总编对这部词典的肯定,也希望这部词典能为世界各国的科学技术的基本词

             汇 - 根词的交流提供一个抛砖引玉的参考。这部词典虽然经过长期的探索、研究
             和试验,但是仍感不够完整。它所依据的最基础的数据资源是全国科学技术名词
             委员会发布的 20 万条含 58 门专业的科学技术名词。通过积累的资料使用冯志伟
             的中文 MMT 模型进行分析解读,当中进行切分词汇、分解、萃取。得到了由科

             技术语部件库的 10 万条词汇,进行数理统计排序后得到将近 2 万词的词表,对
             这个词表进一步提取加工,成为现在的科学技术名词常用词频率词典。很遗憾,
             由于篇幅的限制和国际传播的需要,不可能对每一个词目进行更详细的解析。
                 也就是说,在科学技术名词中,有 10% 的最基本的常用科学技术名词。掌

             握这些最基本的科学技术名词,是科学普及的需要,是交叉科学研究和了解相邻




                                                                                  ·iii·
   6   7   8   9   10   11   12   13   14   15   16