Page 224 - 现代财务管理与审计
P. 224
Modern Financial Management and Auditing
现代财务管理与审计
库的结构中,图由顶点、边和属性三个部分组成,顶点也称作节点,边也称作关
系,节点可以带标签,节点和关系也都可以设置属性。
图形数据库是专门为处理复杂关系而创建出来的,擅长处理大量的、复杂的、
互联的、多变的网状数据,且处理效率远远高于传统的关系型数据库。因此,它
特别适用于社会网络、实时推荐、金融征信系统领域的大数据分析。大数据环境
下,可以借助图形数据库技术开展大数据审计,发现审计线索。
(二)自然语言处理技术与工具
自然语言处理技术(简称 NLP)是语言学、逻辑学、计算机科学、人工智
能等计算机和人类(自然)语言交叉的研究与应用领域,它主要研究如何实现人
与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理研究与
应用涉及的内容很广,各种技术及分类层出不穷。
第一,词性标注(简称 POS)。词性标注又称词类标注或者简称标注,即确
定句子中每个词的词性,如名词、动词、形容词、副词等。
第二,词干提取。词干提取就是将词语去除变化或衍生形式,转换为词干或
原形形式的过程。
第三,词形还原。词形还原就是将一组词语还原为词源或词典的词目形式的
过程。
第四,句法分析。句法分析的主要任务是自动识别句子中包含的句法单位,
以及这些句法单位相互之间的关系,即句子的结构。
第五,命名实体消歧。命名实体消歧就是对句子中提到的实体进行识别的过
程。一般而言,命名实体要求有一个实体知识库,能够将句子中提到的实体知识
库联系起来。
第六,命名实体识别。命名实体识别就是识别一个句子中有特定意义的实体
并将其区分为人名、机构名、日期、地名、时间等类别的任务。
第七,语义文本相似度分析。语义文本相似度分析是对两段文本的意义和本
质之间的相似度进行分析的过程。
第八,文本摘要。文本摘要就是通过识别文本的重点并使用这些重点创建摘
要来缩短文本的过程。文本摘要的目的是在不改变文本含义的前提下最大限度地
缩短文本。
第九,情感分析。情感分析就是使用自然语言处理技术来识别客户评论的语
212

