Page 55 - 大数据云计算技术与通信安全研究
P. 55
第二章 大数据技术在中国医疗保险基金审计中的应用
报销费用较高的诊治项目等。
2. 审计实施阶段
审计人员从各个机构的信息系统和 AO 办公软件采集到所需数据后,先进行
预处理,再导入统一的数据库中,方便下一步的数据分析。在进行该步骤时,要
具体结合现场审计和非现场审计的特点和差异,发现审计线索并进行验证。具体
流程包括数据收集、数据转换、数据存储、数据分析、现场审计等步骤。
(1)数据收集
Y 市审计人员采集的目标审计数据主要包括业务数据、财务数据和外部数据。
业务数据主要是指管理部门在医疗保险基金的征收、管理和使用环节产生的数据;
财务数据主要是指医疗机构进行报销、汇算清缴时产生的数据,包括凭证、报表
和记录等。二者统称为内部数据,因此可以通过内部的专网进行传送。外部数据
是指审计人员通过其他渠道,如新闻、媒体和官网获取的数据。审计人员既可以
向被审计单位下发数据采集申请书,也可以亲自到被审计单位进行实地采集。按
审计署的要求采集单位基础信息、单位参保信息、人员基础信息、人员参保信息
等,对数据进行清洗、规则验证、整合,完成后由专人送至 Y 市医疗保障局。Y
市异地就医管理系统以业务专网为基础,进行实时的数据交换,以支持参保人实
时刷卡异地就医的数据传输要求。异地定点医疗机构通过市业务专网直接访问市
实时结算交易系统,由市实时结算交易系统根据社保卡的归属地到参保地进行交
易验证和结算。
(2)数据清洗
数据清洗是将大数据技术应用于医疗保险基金审计的一个必要环节。因为数
据的来源不尽相同,造成数据的格式和字段也不尽统一。在从Y市人社局、医保局、
财政局采集了数据之后,数据专员首先对数据进行初步的整理,统一格式并剔除
一些无用的域值,在一定程度上减小了数据量。然后将数据压缩打包并根据类别
命名数据包,利用 OA 办公系统的模板进行导入。下一步对数据的时间戳、电子
签名、数字摘要等属性进行验证。同时,将工商局、医疗机构等部门提供的外部
数据导入 OA 办公系统进行数据审查与分析。
本规范的接口发布及调用均采用 Web Service 标准方式,并由交换平台以接
口注册方式提供接口调用和进行权限控制。根据接口的发布及调用对象,本规范
接口可分为两类:平台接口、回调接口。平台接口由交换平台实现,并由发送方
41

