微博分析:外媒业务拓展新方向

近两年来,对微博等个人媒体对社会经济影响的研究不仅成为学术热点①,也成为彭博社、道琼斯和汤姆森-路透社等金融新闻服务机构创新的证券信息监测服务产品。面对微博时代媒体环境的演化,西方金融新闻界与时俱进的产品策略值得借鉴。

□ 侯琰霖

微博语义分析服务的价值

在信息泛滥的微博时代,网上社区巨大的数据量已经超出了人力分析的极限,传统的媒体剪报、邮件列表已经不足以反映媒体对某项产品或服务的反应,基于语义分析的新闻服务成为媒体业务创新的方向。

微博等社交网络中的文本一般都很琐碎,即所谓“非结构化信息”,通常具有以下特征:对特定对象非常有价值,但数据量很小而且非常分散;数据量庞大信息泛滥;在广度和深度上都非常复杂且缺少元数据,无法转换成可以使用的结构化格式。

媒体机构通过合作开展技术服务

一般说来,媒体核心竞争力在于提供高质量的新闻,而非研究开发创新的技术。因此,许多媒体机构采取与创新技术开发者合作的方式进军新闻语义分析业务领域。比如汤姆森-路透社同语义分析领域的顶尖公司之一Lexalytics公司合作开发市场,Lexalytics提供语义平台,汤姆森-路透社根据金融用户具体的业务领域和应用进行定制开发;英国《金融时报》同领先的语义分析平台厂商Endeca公司合作推出了语义搜索引擎Newssift,索引约4000家商业新闻源,包括网络版报纸、博客、新闻门户和调研机构网站等,每日新闻索引量达12万篇。

语义分析通常都先建立一个词典,对常用术语、概念和缩写进行描述。例如,道琼斯与哥伦比亚大学和圣母大学的学者联手编纂了一部约有3700个词汇的词典。这些词汇描述了市场的情绪特征,例如“独创性”(ingenuity)、“强度”(strength)和“赢家”(winner)等词汇可表明市场情绪良好,“与诉讼相关的”(litigious)、“串谋”(colludes)和“风险”(risk)等词汇则表明市场情绪不佳,计算机软件通过计量微博等新闻来源关键词来度量市场情绪的变化。汤姆森-路透社的合作伙伴Lexalytics公司的词典更是包括了网上信息的表情符号,例如表示笑脸的:)和表示心情不好的:\等,利用特定的算法从推特网信息中提取出市场情绪的指标。???

像原生的经济数据一样,新闻和社交媒体讨论等所谓的“非结构化数据”也都能使市场情绪发生从高潮到低谷的改变。希腊主权债务危机在2010年5月加深时,华尔街金融界的自动交易程序在新闻标题中发现“深渊”(abyss)一词,并据此抛售股票,导致了市场的大幅下挫。

社交网络中的情绪预测股票走势

近年来的一些研究发现,网上社区中的情绪居然能预测股票。美国《新科学家New Scientist》杂志2010年6月刊登了吉姆·吉列的文章《博客和推特能够预测未来》②,介绍了Gilbert等人对LiveJournal网站上发表的超过2000万的帖子中包含忧虑情绪的词组之频率的研究,发现当焦虑指数剧增时,标准普尔500指数将略微低于三日移动平均线。

金融界迅速对这一发现做出反应,英国投资设立了一支2500万英镑的对冲基金The Derwent Absolute Return Fund Ltd.,计划从2011年2月开始根据对社交网站上的关键词的变化进行证券投资交易。其交易模型是分析推特网上诸如“calm”这样的单词出现的频率高低进行投资决策。

金融新闻机构开始提供证券新闻监测服务

注重创新的华尔街金融机构相当看好微博所带来的投资机会。《纽约时报》著名财经记者格雷汉姆·包利在2010年12月发表了一篇被广为引用的文章《新闻分析帮助华尔街交易商捕捉市场情绪》③,文中指出,“华尔街证券交易商正在利用功能强大的计算机来快速浏览新闻报道、社论、公司网站、博客文章甚至是推特信息,程序会对这种新闻进行解读,然后据此进行自动股票交易。彭博社、道琼斯和汤姆森-路透社等新闻机构都已开始帮助华尔街客户自动筛选能有助于股票交易的新闻。”

国际一流的新闻服务机构已经开始提供针对推特网等社交网络的新闻监测服务,来帮助华尔街的金融客户自动筛选与交易趋势有关的新闻。

 

(下一页)

 

 

 

 

 

 

©2007 《中国记者》杂志社    地址:北京市石景山区京原路8号   邮编:100040
编辑部信箱:zgjz@vip.sina.com  
网络互动平台:24687113@sina.com  发行:010-63073532