人民公安报社大数据分析平台

项目概述

人民公安报社经过30多年的经营与发展以及信息化建设,已经积累了大量形式多样的数据,包括文本、图片、视频等非结构化数据,还包括财务数据,报刊发行数据、薪酬管理数据等结构化数据,数据总量超过50TB。但这些数据散落在众多信息化系统中,形成一个个数据孤岛,无法有效数据共享和充分利用数据。无法由数据驱动业务运营以及发掘数据的内在价值。此外,对舆论的监督引导也是公安报社的一个重要工作,需要对敏感话题进行监督、引导,必要时需要进行话题溯源,话题影响性预测等,但缺少科学有效的手段。

人民公安报社通过构建大数据中心来解决上述问题。其中“大数据分析平台”作为数据中心的核心系统,提供了数据整合、存储、交换、分析、挖掘的一体化IT解决方案,以数据再利用为基础,以经营分析和决策支持为目标的集成IT应用环境。平台建设的核心目标是提供一个统一的、一体化的、标准的架构,使得数据和业务应用可以进行一致地集成,以提供统一的企业级数据服务,并提供各种集成化数据应用,为领导进行科学决策提供快速、准确、精细化的数据支持。

应用情况

人民公安报社大数据分析平台依托我司数据挖掘系统、文本分析系统、全文检索系统、网络采集系统作为核心支撑,涵盖了大数据采集、大数据存储管理、大数据的分析服务,为报社办公室、审计室、财务处、总编室、研究室、采访部、图片部、网警公司各部门提供经营分析服务、数据检索服务、舆情分析服务等数据的共享、分析、挖掘服务。

本项目采用了大量的自然语言处理技术、文本挖掘技术、数据挖掘技术对报刊内容和用户行为数据进行深度挖掘,从而实现用户特征的准确画像,最终为新闻选题、报刊推送、广告投放、版权跟踪、舆情分析等提供更为科学、高效的决策支持手段。

针对文档资源库等非结构化数据提供数据管理工具和强大的全文检索工具,辅助用户快速方便地查到想要的任何信息。

资源库检索系统

对于负面话题,通过跟踪监控舆论报道的发展,分析舆情信息的传播途径,追溯危机舆情的根源,为及时防范处理负面舆情泛滥和扩散、积极引导事态发展的趋势、协助用户将危机消除在萌芽状态,提供高价值的参考决策及危机处理服务。

舆情监测