Page 130 - 大数据背景下计算机信息安全及防护
P. 130

大数据背景下计算机信息安全及防护
             Computer Information Security and Protection in the Context of Big Data



                 传统的分类分级方法通常采用静态的分类体系,如机密性等级分类、重要性
             等级分类、风险等级分类等。大规模数据存在动态性和多样性,数据的价值和敏
             感程度可能会随着时间、上下文和使用目的的变化而变化,静态分类体系无法灵
             活地应对这种变化。此外,大规模数据存在着交叉和关联的情况,不同数据之间

             可能存在复杂的关系,传统的分类分级方法往往只考虑单个数据项的分类,而忽
             略了数据之间的关联性,这导致其无法全面地评估和管理数据的安全风险。因此,
             新兴的数据分类分级方法应运而生。
                 Zhao 等提出基于全局和局部颗粒化的知识粒度方法,在不改变原始数据的

             情况下实现长尾数据的层次分类。首先,提出者考虑到 WordNet 知识组织的层
             次结构,于是采用了全局粒化构造由粗到细的分类器,同时使用层次结构将一个
             大的分类任务从粗粒度到细粒度划分为几个子分类任务。其次,利用由细到粗的
             谱聚类造粒,根据尾类样本特征之间的相似性,构建尾类局部分类器。最后,全

             局分类器可以对输出概率高于阈值的测试样本进行初步分类。当测试样本的概率
             小于阈值时,使用尾部局部分类器进行进一步分类。但此方法在多视图特征融合
             策略的自适应阈值和局部优化成分方面有待提高和优化。为解决上述问题,Zhu
             等提出了传统卷积神经网络模型的一种变体,称为分支卷积神经网络(Branch

             Convolutional Neural Network,B-CNN)。沿着目标类的层次结构所对应的级联
             卷积层,B-CNN 模型输出从粗粒度到细粒度的多个预测。同时引入了一种新的
             训练策略,称为分支训练策略,它以最小化损失平衡了先验知识的严格性和输出
             层上调整参数的自由性,拥有恰当的阈值和优化策略,其分类性能得到了明显的

             提升。
                 由于云中的数据具有不同的敏感级别,使用相同的算法对这些不同类型的数
             据进行加密可能会导致安全性或资源不足。因此,Sudarsa 等提出了一种提高云
             计算中数据安全性的新方法,即先对数据按不同分类方法进行分类,然后将分类

             后的数据提交到基于类别的加密系统进行加密。该方法可以实现数据的高安全性,
             并在保证数据保密性的同时,优化计算成本和资源消耗。Zhang 等研究了 GitHub
             存储库中关键字驱动的层次分类问题,提出者首先提出了一个以单词为中心的异
             构信息网络,通过学习其网络中的节点嵌入,获得了能够反映 GitHub 存储库数

             据集特有的多模态信号共现的单词,将结构化和非结构化数据联合建模。这个单
             一的关键单词可能反映了用户对类的部分知识,但无法很好地覆盖类分布。面对


             ·120·
   125   126   127   128   129   130   131   132   133   134   135