夯基础:搜索技术是舆情监测产业化基础

网络舆情纷繁复杂,如何判断哪是主流民意?如何保证地方网络舆情应对能力排行和分析报告科学有据?如何将系列产品打造成流水化作业而不是作坊式的人工分析?人民网舆情监测室秘书长祝华新认为,搜索引擎技术是舆情监测基础。目前,人民网舆情监测室初步形成了一套较完整的网络舆情监测理论体系、作业流程和应用技术。

1.以人民网舆情监测平台、中文报刊监测系统为依托对舆情进行定量分析。

人民网中文报刊监测系统可对传统媒体网络版(中央级媒体14家,地方级媒体33家,境外媒体4家,市场化媒体39家)进行定向抓取和全文数据检索,每日数次更新报纸文章,查看头条、评论。而其舆情监测技术可对传统媒体网络版、新闻网站、论坛、个人博客进行24小时监控,形成以日为周期的监测数据报告。

在此基础上,网络舆情抓取分析软件可以进行当日关键词统计、关键词累计统计、定向统计(包括媒体关注度、媒体转载率、用户关注度、地域统计、论坛帖子、博客文章统计)。此举大大节省了人力提高了效率,让舆情监测用数据说话,更加科学可信。

2.综合利用其他搜索引擎弥补不足。

因为现有的搜索还不算强大,人民网舆情监测室还需社会化搜索引擎进行补充搜索。如利用百度定点搜索新闻;利用Google阅读定制和搜索外媒消息;利用奇虎等引擎搜索论坛和博客;门户网站新闻排行、社区热帖推荐与排行选取关注度高的热点。

3.网络社区和语义分析靠人工,亦是搜索引擎突破重点。

目前搜索引擎擅长抓取网络新闻,但是网络社区、微博、BBS跟帖、QQ群等比较难抓,这也是人民搜索引擎要启动的事情。其次的难点是网友的跟帖语义分析难度较大,现在主要靠人工,还需依赖搜索引擎技术突破。较理想的状态是:高智能搜索引擎应该能识别赞成的有哪些,否定的有哪些,并由计算机自动识别、聚类、统计。

定机制:保证舆情产品鲜活有特色

1.关注高聚焦敏感话题、原生态反映网络舆论。

人民网舆情监测室产品的一个原则是严格做网络舆情,信息源全部源于公网,不做任何网下调查。选题标准为:敏感话题和事件,一般为各大媒体和网站首页、置顶帖、专题等,关注度高、点击多、回复多、人气高的新闻或帖文;时效性强,以最新事态发展为由头的新帖;观点独特、深刻、倾向性鲜明的言论等。分析某一舆情热点前,对其进行类型界定,如公共管理、经济民生、社会思潮等。

以《网络舆情》杂志为例,其时事版包括时事聚焦、一周舆情综述、一周微博、一周新闻跟帖、一周外媒、一周图片内参,以及热点人物、博客标签、BBS帖文、网站时评、搜索引擎热门词等系列排行榜等,均为原生态反映网络热点。“网言网语”“短信无忌”这两个收录讽喻时弊的辛辣小言论的特色栏目颇受欢迎。

2.借助外脑做智囊。

除了自己的舆情分析师外,人民网舆情监测室通过舆情频道聚集了一批一流研究社会问题的专家学者。当一些重大事件发生时,由专家把脉,分析。其指标排行榜体系,也用了一年多时间听取各方面专家意见。

3.密切与地方、中央政府的沟通,强调产品针对性。

通过与客户沟通及各种培训,人民网舆情监测室与处在舆情应对一线的党政部门和企业有密切联系,使得工作针对性比较强,也是舆情监测区别于学院派的一个特色。

(上一页 下一页)

©2007 《中国记者》杂志社    地址:北京市石景山区京原路8号   邮编:100040
编辑部信箱:zgjz@vip.sina.com  
网络互动平台:24687113@sina.com  发行:010-63073532