基于大数据的智能网络舆情系统

全媒体舆情监测平台:

主要是利用爬虫技术,根据预定的监控关键词实现全媒体一键搜索,保证信息搜集的全面性,同时为了丰富数据的多样性,除了采集文本信息之后,还对图像,视频等视觉信息进行采集。为保证其时效性,采用全栈式的响应机制,对于目标网站发布目标信息后,可以在分钟级内采集到本地数据库。

多媒体数据语义分析系统:

采用新颖的深度学习算法对搜集的数据进行语义分析,同时采用分布式主题模型强大的数据处理能力从多媒体表示学习和知识图谱构建两方面研究智能多媒体数据分析,进行多媒体数据的语义理解。采用多模态CNN来学习跨空间的舆情事件的特征表示,首先针对视觉模态,用预训练的用于图像分类的CNN模型得到每一个视觉图像的特征,并为此为输入构建一个深度卷积神经网络,来学习视频的视觉表观特征。

多媒体数据语义分析系统
热点事件发现和跟踪:

采用跨网络空间主题建模的社会事件发现方法,针对热点事件在不同媒体平台上,往往是相互依存、互为补充的,通过概率图模型与提升权重学习来实现社会事件的发现。在事件发现层次,以社会媒体的文本,图像,视频等不同模态的数据,构成不同特征空间,通过特征学习,将每个模态空间的元数据映射到统一空间。利用学习得到的统一空间,以事件文档作为监督信息引导学习过程,使得到文本和视觉主题特征更有表述性,进行热点事件发现和跟踪。

热点事件发现和跟踪
舆情全局态势分析:

采用协同主题模型的舆情演变与可视化方法,如下图所示,融合不同媒体空间的事件数据,分析社会热点事件的舆情传播,引入舆情相关的中层属性表示,充分挖掘社会事件在物理空间和网络空间中的协同表现形式,构建不同网络空间中的协同主题模型,实现信息共享,构建可靠、精确、覆盖完整的舆情特征集合,基于此集合构建高效的事件舆情分类器,并在网络空间数据流中进行快速的舆情监测和可视化,监测结果可进一步用于热点事件舆情预警。

舆情全局态势分析