Page 177 - 计算机应用软件开发技术研究
P. 177

第五章  基于数据挖掘技术的智能信息处理



             撑;智能信息分析则需主观介入,适用弱人工智能技术支持。
                 依照 DIKW 概念链量化模型,客观数据 D 经输入传递系统成为物理信息 i;
             物理信息 i 经社会传递,转化为可接收的客观信息 I;可接收的客观信息 I 经主

             体吸收,转化为带有主体价值判断的主观信息 J 即情报;情报 J 经结构化体系
             化而成为知识 K;矩阵化个性化知识则构成智慧 W。从客观信息 I 到情报 J 间
             的转化是一个关键环节。根据对数透视原理,从客观到主观需经对数转换,同
             时,为描述主体价值判断,引进价值系数 v∈[0,1](匹配 Rescher 模型),

             可得如下关系式: =J         log I    v  =    v log  I   ,在该关系式中确定了信息 I 和情报 J 的关
             系,即情报是信息的对数与价值系数的乘积。
                 在情报 J 进一步转化为知识 K 的过程中,采用分析信息学的合理假说:有价
             值的信息才会使知识增加,单位信息增量产生的单位知识增量应与有价值信息量

             (情报量)成正比,即:




                 其中,k 是信息的知识转化系数。于是,知识 K 是情报 J 对信息 I 的积分:



                 其中,K 0  是积分常数,代表原有的知识;而 ΔK 代表了新增加的知识。这
             正是著名的布鲁克斯基本方程,该推导过程的优势是给出了机理解释。
                 以上内容可作为智能信息处理和智能信息分析的理论基础。


                 三、智能信息处理和智能信息分析的应用

                 作为智能信息处理的先驱,Luhn 和 Salton 等已对智能分类、智能标引、智

             能文摘等进行过开拓性研究,智能检索也在计算机科技的推动下走向成熟,这些
             领域的智能化技术逐渐日趋完善。未来的发展预期将是智能分析、机器翻译和自
             动简报。
                 (一)智能分析
                 智能分析面临的很多问题需要自然语言理解支撑,尤其是中文信息的智能分

             析至少涉及:①词切分和词性标注;②概念标注与分析;③语义知识表示;④词
             典与知识库;⑤句法及语义分析等。因此,智能分析的前景是在自然语言理解基
             础上,融合已有的智能分类、智能标引等技术,发展出结合算法分析与计算智能



                                                                                 ·165·
   172   173   174   175   176   177   178   179   180   181   182