Page 373 - 大数据背景下网络安全问题研究
P. 373

» 第十二章  网络舆情安全



               情信息、舆情行为人具有聚类特性,部分舆情特征只需要在这些舆情中心内就能完成
               特征挖掘。
                   由于网络舆情内容敏感性有很大差别,对于一些危害性较高的舆情需要及时处
               理,以免给舆情管理带来风险。舆情信息在利用网络社区分区映射后,直接传给舆情
               特征挖掘中的Storm模块来实现舆情敏感性特征挖掘、舆情主题分类、网民行为检测

               等。对于敏感性要求不高的网络舆情信息通过映射处理后,通过专门的数据库数据接
               口定时批量传给特征挖掘层的基于Spark的网络特征分析模块,由于Spark是基于内存
               的云计算模式,在特征计算时不需要像Hadoop在不同系统之间进行硬盘读写,对于

               具有迭代特征的舆情信息挖掘可提高舆情计算效率。可利用Spark对网络舆情领袖特
               征、网络舆情传播路径、舆情衍生动力进行挖掘,有效把握舆情影响和演化的特定要
               素之间的内在关系。
                   在特定的舆情特征获取模式下,有时需要对舆情整体特征进行快速的统计查询。

               网络舆情有时信息量很大,但其对查询精度要求有时不是非常高。这时候可以利用
               BlinkDB的统计采样机制对部分大量历史舆情数据进行查询,可以在较高的置信度内
               快速对舆情总体特征进行统计分析,对热点舆情进行汇总、对网民行为概貌进行查

               询,从而快速把握网络舆情发展概貌,及时对舆情进行初步判断。
                   (二)大数据背景下基于复杂网络的网络舆情态势智能分析
                   大数据背景下网络舆情分析机制离不开大量的数据统计计算,建立良好的统计模
               型是舆情智能化处理的关键,本书在深度学习基础上将网络舆情信息挖掘和统计方法
               集合起来解决舆情分析精度和舆情统计效率问题,如图12-2所示。网络舆情空间基本

               可以划分为由网民构成的社会网络、舆情事件构成的事件网络、网民与舆情事件之间
               的二分交互网络构成。在构建的网民社会网络和舆情事件网络中利用统计方法进行链
               接预测,利用关联规则对网民关系进行挖掘,发现潜在的网民关系。在舆情基本特征

               信息有效挖掘基础上,利用聚类方法对舆情事件网络主题进行聚类分析,进而对网民
               在舆情事件演进中的交互作用进行初步分析。
                   舆情有效分析需要舆情智能化作为支持,如何从大量的舆情文本中发掘有效的舆
               情趋势和演化态势是舆情分析的核心问题。近年深度学习成功地在图像识别领域获得

               突破,诸如CNN,RNN等网络为舆情数据分析提供了新的思路。在舆情分析中,可利
               用深度学习方法对舆情文本信息进行学习,通过对舆情文本分词、相关性分析、上下
               文分析、情感分析等对文本挖掘方法进行智能化处理,让机器学习舆情相关规则。由
               于分析舆情主要不是仅仅对已经发生的舆情进行统计,更重要的是要对舆情未来发展

               态势进行预测,形成有效的预警机制。最近在深度学习领域针对小样本和图网络方法
               的深度学习为舆情预警问题提供了较新的研究思路,利用图网络可以利用网络边进行


                                                                                         • 361 •
   368   369   370   371   372   373   374   375   376   377   378