智库行业解决方案
方案概述
德尔塔智库行业解决方案,充分利用自然语言处理技术、精准推荐技术、分布式全文检索技术、网络信息采集技术等多种大数据关键技术,针对不同行业需求,汇聚专业特色鲜明、研究实力突出的智库和专家,打造行业优秀智囊团和思想库,为领导决策和产业发展提供优质咨询服务。方案涵盖智库动态、智库热点、智库机构、智库专家、研究成果、出版物、知识库、专家成果等专题模块,实现从数据采集、知识加工、知识检索、知识呈现、知识利用、知识价值评估的全链条智库行业解决方案,推动智库成果的高效利用。
方案详情
(1) 智库数据采集
利用网络信息爬取技术,根据设定的爬取关键字、目标网站地址,对目标网站中包含相关关键字的新闻进行爬取,从而实现智库信息的获取。系统支持从政府类、高校、科研院所等学术类网站、门户网站、社交媒体等各类互联网网站定期采集与本智库平台相关的文章和数据,为智库系统构建和内容扩展提供重要数据来源。
(2) 信息自动归类
为了对互联网采集的文章,以及各智库发布的文章和成果进行快速有效分类,系统利用文本自动分类技术,实现将相关文章和成果进行自动归类,有效降低人工工作量,提升智库知识加工效率。
(3) 关键词自动标注
为了准确标注某篇文章的关键信息,往往给文章标注几个核心关键字,对其进行表示,以便读者快速了解该文章是否是其关心的文章,同时提高信息检索效率。提供关键词自动标注功能,辅助智库文章发布人员快速设置关键字,提高文章发布效率。
(4) 个性化推荐
个性化推荐系统通过综合并利用用户的兴趣偏好、属性,文章的属性、内容、分类,以及用户之间的相似性等等,挖掘用户的喜好和需求,主动向用户推荐其感兴趣或者需要的文章。
(5) 智能检索
针对智库机构、文章、专家、成果等大量文本数据的检索需求,依托并行计算、动态缓存、倒排索引等分布式全文检索技术,以及全文检索、范围检索、通配符检索、组合条件检索等高级检索功能,提高检索效率和准确度,满足海量智库数据的高效灵活检索。