“突发”文字可能揭示社会趋势

| 评论(1) | 暂无引用通告

在昨日的“新科学家”(New Scientist)在线杂志上,公布了康奈尔大学的一个新研究成果,引人注目,也许与Google 收购Pyra 的动机有所关联。

这所大学的计算机科学家 Jon Klenberg 开发了一个计算机算法,能够识别一篇文章中某些文字的“突发”增长,而且他发现,这些“突发”增长的文字可以用来快速识别最新的趋势和热点问题,因此能够更有效地筛选重要信息。过去很多搜索技术都采用了简单计算文字/词组出现频率的方法,却忽略了文字使用增加的速率。

Jon 特别指出,这种方法可以应用到大量Weblog上,以跟踪社会趋势,这对商业应用也很有潜力。例如,广告商可以从成千上万的个人Blog 中快速找到潜在的需求风尚。而且只要Blog 覆盖话题范围足够大(实际上发展趋势确实如此),这项技术对政治、社会、文化和经济等领域也都会有实际意义了。

虽然Google 新闻的内部算法至今没有公开,但是人们猜测这种完全由机器所搜集的头条新闻应当不是Google搜索引擎中惯用的鸽子算法,很可能与这种“突发”判断算法有关。如此说来,Google收购Blog工具供应商的举动确实还有更深层次的远见了。

- NewScientist.com news, Word 'bursts' may reveal online trends
- 还没有写完这些介绍,在 SlashDot 上也看到了很多有关这个发现的讨论

暂无引用通告

发送引用通告网址: http://blog.cnblog.org/cgi-bin/mt/cnblog-tb0801.cgi/938
如果您想引用这篇日记到您的Blog,请复制上面的链接,放置到您发表文章时的相应界面中。

评论(1)

你好,本人目前需要用该算法解决一些问题,但是由于本人的数据、计算机功底有限,所以很难看懂原文,而搜索国内关于该算法的介绍好久一直没有结果,不知作者对该算法有无研究,想请教一些问题,如能得到您的帮助,将不胜感激!

发表评论

关于此日记

此日记由 发表于 2003年2月19日 23:35

此Blog上的上一篇日记jedi 讲演的投影片初稿推荐

此Blog上的下一篇日记试讲后记

首页归档页可以看到最新的日记和所有日记。