网络新时代:Web3.0、关联数据和语义网

Growthroute Ventures公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起:1) 羽翼渐丰的 Web 3.0″ , 2) 结构化网络中的黑马关联数据(Linked Data),3) 以及由来已久的传奇:语义网Semantic Web)。 以下对其进行简单介绍:

Web 3.0: Web 2.0之后轮到谁?

Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行,因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据,需要很长的时间才能将这些数据结构化。 

去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱,让所有人随时随地地联系在一起,让整个网络更加智能。”

至少我认为,如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络,那么Web 3.0则意味着开放和结构化数据,让网络更加“聪明”。 

关联数据(Linked Data): 结构化数据,但不一定是语义数据

Greg Boutin第二篇文章谈到了关联数据。他认为关联数据提供了关联结构化数据的新媒介,可以让机器更好地读取这些数据。但是,关联数据本身不会给信息增加任何语义含义,而是更好地携带语义数据,供用户访问。所以,关联数据虽然本身并不具备语义特征,但它可以在数据层面建立关联,为真正的语义网铺平道路。

关联数据这个概念来自W3C,该组织有一个关联开放数据(LOD)项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的Open Calais项目 Freebase, 和DBpedia。这些数据集是在现有本体论(ontologies)基础之上建立的,如WordNet,FOAF, 和SKOS,然后在它们之间建立关联。

Greg Boutin在其第三篇文章中写道,关联数据格式不会创建智能数据,仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。

语义网:Google唱主角

那些以上这些趋势会如何影响语义网呢?Tim Berners-Lee 认为语义网可以用于商业目的,但现实却是,目前使用资源描述框架(RDF)的实际应用寥寥无几。

但是 RDFa(允许发布者把RDF嵌入到HTML)带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa,而雅虎早在去年就大胆地推出了搜索猴子(Search Monkey ),达到了同样的目的。

Google将在语义网主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单,它早就在研发语义技术了。

Google也并非没有竞争对手。除了雅虎,微软去年夏天收购 Powerset也是瞄准了这个市场。

结论

Web 3.0是一个没有统一定义的词语,或者根本不应该这么称呼。但是很显然,结构化数据时代已经到来。我们从当前的关联数据热潮中就可以看到它的影子,并且得到了Google和雅虎等大公司的支持。谁知道呢,或许语义网也就在隔壁不远处。 

编译:pestwave

  • Share/Bookmark

留下评论

*
To prove you're a person (not a spam script), type the security word shown in the picture. Click on the picture to hear an audio file of the word.
Click to hear an audio file of the anti-spam word