资讯新闻

谷歌数据社会用途前景无限【独家】

2008-11-18 10:07:10作者: 互联网
       【艾瑞网消息】流感患者的典型症状除了疼痛、咳嗽、发热和喉咙疼外,又增加了一项。那就是在叫医生之前,先在谷歌搜索框输入“流感症状”关键词。这个简单的动作在全美数百万家庭中被复制,因而催生了一个新的针对传染性流感大暴发的预警系统,那就是“谷歌流感趋势”。

  在谷歌所推出的慈善站点 Google.org上的测试显示,谷歌搜索数据可以被用于侦测地域性的流感暴发,而且比国家疾病控制和预防中心的报告要早上1周到10天。

  举例来说,在二月份早期,疾控中心汇报说在亚特兰大中部发现流感病例急速增多。而谷歌的研究数据则在疾控中心报告披露的前两周,就显示出人们流感症状搜索的激增。谷歌的新服务“流感趋势”对这些搜索进行实时分析,绘制了图表和地图,所以能够很理想的呈现出流感的传播图景。

  疾控中心的报告比较慢,是因为它们依靠由数千家健康服务机构、实验室和其他资源所搜集及汇总的数据。一些公共健康专家说谷歌的数据有助于加速医生、医院和卫生官方机构在流感爆发季的反应,减轻疾病的传播,甚至挽救生命。

  疾控中心流感监测的领导人Lyn Finelli博士说:“警告发出的越早,预防和控制措施也就能越早到位。而这能够预防流感的爆发。每年染上流感的人中,会有5%-20%死亡,平均每年大概有 36,000例。”

  目前这一服务只局限在美国,但是谷歌期望,最终能将这个追踪流感和其他疾病的技术在世界范围内应用。谷歌的CEO Eric E. Schmidt说:“从技术角度讲,这只是开始”。

  “谷歌流感趋势”预示着群众行为与药业联姻后结出硕果。之前雅虎的数据也曾被用于做流感预防。曾对雅虎数据进行过研究的爱荷华大学的副教授Philip M. Polgreen说:“从理论上我们可以想见,这些信息也可用于对其它疾病进行研究。”

  关于“谷歌流感趋势”的方法探讨论文也将发布在《自然杂志》上。

  很久以来就有研究人员说网络上公布的材料在某种程度上是集体智慧,可以用于描述趋势和做预测。而通过搜索引擎获得的数据格外有力。因为人们所输入的关键词及短语代表了他们最迫切的意图。人们打算旅游的时候可能会输入“香格里拉酒店”。而在房贷出现问题时,可能会输入“断供”。这些短语反应了世界性的集体渴望和需要,世界性的缺乏和喜好。

  而在雅虎内部进行的研究显示,针对某些术语突然增长的搜索,可以帮助预测什么技术产品将成为热门。雅虎开始应用搜索流量来决定在站点上放置什么特色内容。

  两年前,谷歌通过“谷歌趋势”开放了自己的搜索数据。“谷歌趋势”是一种允许任何人跟踪比较流行的搜索术语的工具。谷歌也提供更为复杂的搜索流量工具,以方便营销者制定更精确的广告活动。而在公司内部,还在测试应用搜索数据做出经济、市场和娱乐趋势的结论。

  谷歌的首席经济师Hal Varian说:“大部分预测基本上都是趋势的推算。一般来说都表现得很好,但是容易错过转折点,也就是数据开始改变方向的时候。我们的希望就是谷歌数据能帮助解决这一问题。”

  雅虎实验室和公司搜索策略的负责人Prabhakar Raghavan说:“搜索数据对于预言家和科学家都是很有价值的。但是隐私担忧将限制把数据分享给外界学术机构。”

  “谷歌流感趋势”避免了隐私陷阱。其方法是只依赖于总量数据,这些数据不会指引到某个具体的搜索者。为了发展这项服务,谷歌的工程师设计了一箩筐与流感相关的关键字和术语,包括“热度,流感症状、肌肉疼痛、胸部感染”等等。

  之后,谷歌就深入到自己的数据中,提取了与这些搜索请求相关的长达5年的数据,并将其绘制成类似疾控中心的流感报告。谷歌发现自己的数据和疾控中心的报告之间有很强大相似性。而这更坚定了谷歌开发这一新服务的决心。

  Google.org的执行经理Larry Brilliant博士说:“我们知道它与去年流感的发展路径匹配得非常非常好。”谷歌还说它相信这一工具可以帮助人们在疾病发生地区采取预防措施。

  还有其他的人也试图从互联网用户那里搜集公共健康数据。举例来说,一个被叫做whoissick.org的站点邀请人们汇报一下自己被那些疾病困扰。并想将结果绘制成地图。但是站点所收获的流量却非常少。而HealthMap是波士顿儿童医院的附属机构。它在网上寻找文章、博客和新闻邮件,以追踪全球范围内的传染疾病。它受到 Google.org的支持,Google.org就是期望将疾病的侦查和预防作为自己主要的慈善目标。但是“谷歌感冒趋势”看起来是第一个应用强有力搜索引擎数据追踪疾病的公共项目。

  麻省理工学院的教授Thomas W. Malone说:“看起来这是一个真正聪明的、应用谷歌用户无意识创造的数据来判断世界的方法。我想我们正处在触摸集体智慧的前沿。”

 

京公网安备 11010502039920号