Page 177 - 计算机应用软件开发技术研究
P. 177
第五章 基于数据挖掘技术的智能信息处理
撑;智能信息分析则需主观介入,适用弱人工智能技术支持。
依照 DIKW 概念链量化模型,客观数据 D 经输入传递系统成为物理信息 i;
物理信息 i 经社会传递,转化为可接收的客观信息 I;可接收的客观信息 I 经主
体吸收,转化为带有主体价值判断的主观信息 J 即情报;情报 J 经结构化体系
化而成为知识 K;矩阵化个性化知识则构成智慧 W。从客观信息 I 到情报 J 间
的转化是一个关键环节。根据对数透视原理,从客观到主观需经对数转换,同
时,为描述主体价值判断,引进价值系数 v∈[0,1](匹配 Rescher 模型),
可得如下关系式: =J log I v = v log I ,在该关系式中确定了信息 I 和情报 J 的关
系,即情报是信息的对数与价值系数的乘积。
在情报 J 进一步转化为知识 K 的过程中,采用分析信息学的合理假说:有价
值的信息才会使知识增加,单位信息增量产生的单位知识增量应与有价值信息量
(情报量)成正比,即:
其中,k 是信息的知识转化系数。于是,知识 K 是情报 J 对信息 I 的积分:
其中,K 0 是积分常数,代表原有的知识;而 ΔK 代表了新增加的知识。这
正是著名的布鲁克斯基本方程,该推导过程的优势是给出了机理解释。
以上内容可作为智能信息处理和智能信息分析的理论基础。
三、智能信息处理和智能信息分析的应用
作为智能信息处理的先驱,Luhn 和 Salton 等已对智能分类、智能标引、智
能文摘等进行过开拓性研究,智能检索也在计算机科技的推动下走向成熟,这些
领域的智能化技术逐渐日趋完善。未来的发展预期将是智能分析、机器翻译和自
动简报。
(一)智能分析
智能分析面临的很多问题需要自然语言理解支撑,尤其是中文信息的智能分
析至少涉及:①词切分和词性标注;②概念标注与分析;③语义知识表示;④词
典与知识库;⑤句法及语义分析等。因此,智能分析的前景是在自然语言理解基
础上,融合已有的智能分类、智能标引等技术,发展出结合算法分析与计算智能
·165·

