Page 117 - 大数据背景下计算机信息安全及防护
P. 117

第四章 大数据安全防护技术



              由于大数据类型比较多元化,在存储安全方面存在问题。比如代码漏洞多、安全
              机制的缺失等。而且数据安全未建立严密访问控制与隐私保护,需要一定时间来
              验证这些措施安全性。NoSQL 作为服务器软体没有足够安全性,所以客户机应
              用程式必须自建安全性,因此会出现诸如授权流程认证及输入确认等安全性问题。

              至今,NoSQL 还没有形成行业标准,尽管出现许多不同产品,但由于其各自独立、
              自成体系,难以采用统一安全策略来保护内部信息。
                  (三)使用阶段存在的问题
                  大数据隐私权保护主要关注个人隐私权保护,并采取措施在存储、传输与使

              用中进行隐私权防范。其中,非授权访问与数据的非常规使用是需要防范的情况。
              在数据分析和挖掘过程中,可能会出现未经许可的数据访问,造成数据丢失。此
              外,在数据传输过程中,可能存在数据非规范发布、数据泄露、缺少应急预案、
              无法追溯和取证等问题,这些问题若长期存在会造成严重后果。


                  三、数据安全开发利用技术现状

                  数据生命周期主要有采集、传输、存储、处理、交换、销毁等 6 个阶段,在
              传统的安全手段中,针对静态数据主要以加密和认证为主,针对动态数据主要以

              边界式防护为主。
                  (一)安全存储
                  在安全存储方面,数据的完整性、可用性、可靠性亟需保障。Bellare 等人
              (2013 年)、Li 等人(2016 年)、Ren 等人(2021 年)提出的轻量级加密存储

              方案,Dijk 等人(2012 年)、Fisch 等人(2019 年)、Cecchetti 等人(2019 年)
              提出的多副本编码协议,以及 Ateniese 等人(2007 年)、Bowers 等人(2009 年)
              提出的数据完整性验证技术,推动了分布式安全存储应用。谷歌 GFS(2003 年)、
              亚马逊 Snowball(2006 年)、微软 OneDrive(2014 年)、华为 GaussDB(2020

              年)等云存储方案的安全性逐渐增强,但都是针对中心化环境而设计,不适用
              于跨中心或去中心化的分布式存储。2020 年,主网上线的星际文件系统(Inter
              Planetary File System,IPFS)采用无中心组网,将加密文件切割成多个碎片,采
              用基于 zk-SNARK 的副本证明机制,实现安全存储,周数据增量为 PB 级,且能

              提供 100Gbps 以上的吞吐量,解决了单点故障等缺陷,但仍存在存储空间浪费严
              重、数据完整性无保障、数据滥用难控制等问题。收敛加密、数据完整性验证、


                                                                                  ·107·
   112   113   114   115   116   117   118   119   120   121   122