Page 58 - 大数据云计算技术与通信安全研究
P. 58
Research on Big Data Cloud Computing Technology and Communication Security
大数据云计算技术与通信安全研究
③ SQL 查询
SQL 查询语句也被广泛应用于大数据技术中,得益于它能够完成多个表格
之间的交互查询和模糊检索。类似于多维分析技术,SQL 查询语句主要是对结构
化数据进行分析。首先对各个表格进行关联分析,在此基础上建立中间表,再完
成交互查询和模糊检索。审计人员得以迅速发现业务流程中可能存在的问题,确
定审计疑点。
为了提高数据分析的处理效率,数据人员往往采用多方面的方法:一是在
各表格间建立索引。由于医疗保险基金审计数据量庞大,加上数据人员在数据分
析过程中需要根据身份信息或医院名称等关键词进行检索,工作量十分繁重。因
此,审计人员对各种表格的关键字段建立索引,以此来加快查询速度。二是建
立中间表。由于数据人命名情况:人员参保情况表为 a,实际报销流水表为 b,
人员参保情况的审核通过 select 编码 from a where 主体 notin(‘l’,‘0’)语
句,验证人员参保情况表中是否存在参保状态不在参保与不参保两者的人员。
通过 select count(编码),count(distinct 编码)from a 语句,审核人员参保表
中应保人数是否存在人员编码重复现象。通过 select 编码 from a group by 编码
having count(编码)> 1 语句,检查人员编码是否重复。通过 select*into tablel
from a where 编码 in(select 编码 from a group by 编码 having count(编码)> 1)
语句,创建人员编码重复信息表 table1,并进行验证。通过 select count(编码),
count(distinct 编码)from a where 主体 =‘l’语句,审核人员参保表中实际参保
人数,并验证是否存在实际参保人员编码重复现象。通过 select*from a where 主
体 =‘1’and 报销额> 0and 编码 in(select 编码 from a where 身份证号 in(select
身份证号 from a where 主体 =‘l’group by 身份证号 having count(身份证号)>
land count(姓名)> 1))order by 姓名语句,进一步验证实际参保人数,查找实
际报销额大于 0 且身份证重复的参保人员,查找有无身份证号重复记录。
(5)实际报销审核
①验证实际报销记录的人员是否属非实际参保人员。主要通过 select*from b
where 个人编号 not in(select 编码 from a where=‘1’)语句审核。
②核对分地区应保、实际参保人数。通过 select left(区域,4)地区,count
(distinct 编码)应保人数 into table2 from a group by left(区域,4)order by left
(区域,4)语句,新建分地区应保人数统计表 table2,来审查资料库人员信息
44

