Web3簡析系列之(2)
一、語義Web
1.1語義Web
語義Web或語義網(Semantic Web)由WWW的創始人Tim Berners-Lee于2000提出[1][2],并于2001《科學美國人》雜志發表論文“ The Semantic Web”[3]。作者在文中這樣描述“語義網不是一個獨立的網絡,而是當前的這個網絡的顯示的數據的能力將會大大提高,這樣語義網建設的進展就將有助于創造出引人注目的全新功能。”
語義Web的提出,主要原因是HTML僅僅用以表示數據顯示的布局,HTML所表達的頁面信息和組織方式,主要面向用戶直接閱讀,沒有將信息的表現形式、內在結構和表達內容相分離,沒有提供計算機可讀的語義信息,因而非常不利于計算機直接閱讀和處理。到上世紀90年代中期,隨著XML的出現,將數據的內容與布局區分開來,為語義更豐富、更自然的網上內容表達打開了新的局面。語義網的目標是:為Web上的信息提供具有計算機可以理解的語義,從而滿足智能代理(Agent)對Web上異構、分布信息的有效檢索和訪問,實現網上信息資源在語義層上的全方位互聯,并在此基礎上,實現更高層的基于知識的智能應用。語義Web支撐技術如圖1所示。
目前,對于語義Web,已經形成一套較為完整的理論體系,Extended Semantic WebConference國際會議從2004年開始第一屆,一直延續到現在[4]。

圖1 語義Web支撐技術[5]
上圖中部分概念解釋如下:
RDF(Resource Description Framework)資源描述框架
SPARQL(Query Language for RDF), 資源描述框架的查詢語言
OWL(Ontology Web Language 本體網絡語言
SKOS(Simple Knowledge Organization System)簡單知識組織系統
這里,Ontology(本體,本體論)的概念很抽象,下面稍作解釋(不感興趣的讀者請略過)。
1.2 Ontology(本體,本體論)
簡單地說,本體Ontology是格式規范的、對客觀實體本質的抽象描述, 是對某一領域可共享的、通用的理解,其目標是使知識能夠在人與人之間、人和系統之間、以及各種異構系統之間進行廣泛的交流。本體的形式化和結構化可以為交流、可重用性和知識組織提供了更好的工具和理解。
Ontology的概念最早源于亞里士多德(公元前384-322年)對事物存在本質的研究,在哲學上的定義為“對世界上客觀存在物的系統地描述,即存在論”,是客觀存在的一個系統的解釋或說明,關心客觀現實的抽象本質[6].
在語義網中,Ontology可以起到如下的作用:
(1)本體可以在不同的建模方法、范式、語言和軟件工具之間進行翻譯和映射,以實現不同系統之間的互操作和繼承。
(2)從功能上來講,本體和數據庫有些相似。但是本體比數據庫表達的知識豐富得多。首先,定義本體的語言,在詞法和語義上都比數據庫所能表示的信息豐富得多;最重要的,本體提供的是一個領域嚴謹豐富的理論,而不單單是一個存放數據的結構。
(3)本體是領域內重要實體、屬性、過程及其相互關系形式化描述的基礎。這種形式化的描述可成為軟件系統中可重用和共享的組件。
(4)本體可以為知識庫的構建提供一個基本的結構。以描述對象的類型而言:有簡單事實及抽象概念,這些可以描述成一個本體們主要描述的是事物或概念的條件,本部分別以這些組成部隊之間靜態聯系;本體也可以描述事物或概念這類結構去表達現實世界中浩如煙海的知識和常識。
(5)對于知識管理系統來說,本體就是一個正式的詞匯表。本體可以將對象知識的概念和相互間的關系進行較為精確的定義、在識積累、知識共享的效率將大大提高,真正意義上的知識重用和知識共享也能成為現實。
(6)本體適合表示抽象的描述。而企業模型是人們對企業或者企業的某些模型的抽象描述,因此在企業邏輯建模中,本體的使用可以幫助我們清楚地理解企業特定領域的相關元素、關系和概念,讓知識表達更加準確便捷,幫助人們進行更好的企業決策。
二、基于語義Web的Web3.0
2006年,萬維網的發明者伯納斯·李(TimBernes-Lee)提出了Web 3.0的概念[7],他認為Web3.0的核心是“語義網”,其愿景是語義網能夠使用本體論(Ontology)分析互聯網上的所有數據,允許機器在沒有人工干預的情況下處理許多任務,語義網是關于數據集成的。語義網通過使用元數據將“僅顯示”數據轉換為有意義的信息[8]。自2007年起,逐漸出現了基于語義網的Web3.0相關文獻。而紐約時報記者John Markoff則提出,Web3.0應該是智能Web,相當于AI+Web2.0[9],這一說法也得到了一些人的認可。此后的一段時間,直到現在,學術界提到的Web3.0,大多是基于語義網的。一些基于語義網的Web3.0論著有:論文“Embracing ‘Web 3.0’”2007、專著“PULL- the powerof the Semantic Web to transform your business” 2009出版(中譯本《Web 3.0: 互聯網的語義革命》,科學出版社2013)、論文集《WisdomWeb of Things》springer2016、《Knowledge Management and Web3.0》德國de Gruyter出版社2022、2020年Future Generation Computer Systems期刊出版了名為“Data Exploration in the Web 3.0 Age”的特刊。
本文所討論的Web3.0均指基于語義網的。
2.1Web3.0特點
基于語義Web的Web3.0具有如下特點[10][11]:
1) 語義Web——它是Web3.0的關鍵,使機器易于處理數據。
2)AI——AI是影響Web3.0技術流行的主要關鍵因素之一。它使機器通過大量的Web數據變得更加智能,以滿足用戶的需求。
3)3D圖形——Web3.0已經超越了它的前輩,因為它的三維技術,它提供了一個比2D更現實的三維在線世界。
4) 無處不在——同時存在或無處不在的概念,移動設備的興起日益增加,許多人更容易隨時隨地訪問互聯網。
5) 開放性和互操作性,這指的是在應用程序編程接口、數據格式、協議和設備與平臺之間的互操作性方面的開放性。
6) 全球數據存儲庫,這是一種跨程序和跨網絡訪問信息的能力。
一言以蔽之,基于語義Web的Web3.0的核心特點就是機器可以作為獨立的參與者。在Web1.0和Web2.0,信息(內容)的生產者和消費者都是人,在Web3.0,機器也與人類一樣成為了主體,成為了生產者和消費者。

圖2 在Web3.0,機器成為信息的生產者和消費者[12]
2.2 Web3.0賦能
具備相關的技術和能力后,Web3.0可賦能如下應用[13]:
- Web服務
- 基于代理的信息收集和分發
- 搜索引擎
- 商業智能
- 電子化學習與研究
- 精準營銷
這些應用,大多與知識(內容)相關,涉及到知識獲取、知識管理、知識應用。
2.3 Web3.0面臨的問題和挑戰
如前述,Web3.0具有強大的功能,可以賦能很多的應用。但是其技術實現方面存在一些難點,如[13]:
- 本體的構建
- 證明和信任標準化(自動利用、整合數據抽取信息)
- 國際化(語言問題)
此外,技術也是雙刃劍,它既可以被正當使用,也可能被攻擊者惡意使用,因此,Web3的應用也會帶來一些問題,如:
- 未經授權的訪問敏感信息
- 超文本垃圾郵件
- 身份竊取和社交網絡釣魚
- 自動啟動指令和惡意腳本注入
事實上,以語義網為基礎的Web3.0,經過了10多年,依舊沒有實現。主要原因是人工智能的發展還達不到相應的水平。
三、Web1-3演進
Web1-3演進,最明顯的區別是,在Web1.0,用戶只讀靜態網頁;Web2.0,可讀可寫;而Web3.0,用戶不僅可讀、可寫,而且可執行。另外,如前述,Web2.0時代,可以說是Web on Everything;到Web3.0時代,可以說是Web of Everything或Web of Things(有點類似于物聯網Internet of things),因為機器也可以讀、寫和執行web內容,機器成為信息的生產者和消費者。表1列出了Web 1.0、Web 2.0和Web3.0的簡單對比。
表1:Web 1.0, Web 2.0, and Web 3.0特點對比[14]
Web 1.0 Web 2.0 Web 3.0 Read Read and write Read, write, and execute Client server Peer to peer Portable personal Web HTML portals XML, RSS RDF Companies own Communities share Individuals Web pages Web applications Semantic applications |
文獻[15]對Web1-3進行了頗為詳細的分析,圖3為我們在文獻[15]Fig.1基礎上修改完善而成,(注:雖然文獻[15]討論的是基于區塊鏈的去中心化Web,參見《去中心化Web,Web3流派二》,然其Fig.1中Web3部分基本不涉及區塊鏈相關內容,更多的是語義Web相關,因此,我們將對比內容放在本節。)

圖3 Web1-3對比分析
參考文獻
[1] TheSemantic Web , https://www.w3.org/2000/Talks/0516-sWeb-tbl/all
[2] TimBerners-Lee, Weaving the Web: The Original Design and UltimateDestiny of the World Wide Web,ISBN-13? : ?978-0062515872
[3] https://www.scientificamerican.com/article/the-semantic-Web/
[4]https://2022.eswc-conferences.org
[5] Mini research Semantic Web
[6]本體(Ontology)綜述,http://imarine.blog.163.com/blog/static/51380183200861373316920
[7] TimO’Reilly,December 13, 2021,https://www.oreilly.com/radar/why-its-too-early-to-get-excited-about-Web3/
[8] 蔡維德,Web 3.0:新型網絡時代來臨
[9]NYTMarkoff: Web 3.0 = AI + Web 2.0,https://ebiquity.umbc.edu/blogger/2006/11/11/nyt-markoff-Web-30-ai-Web-20/
[10]《Knowledge Management and Web 3.0》P11, 2022
[11] E-LEARNING 3.0 = E-LEARNING 2.0 + WEB 3.0?
[12]《Knowledge Management and Web 3.0》ISBN 978-3-11-072264-2. 2022 ,P104
[13] Defining Web 3.0 opportunities and challenges2016
[14]《Knowledge Management and Web 3.0》ISBN 978-3-11-072264-2. 2022 ,P60
[15] Blockchainfor decentralization of internet: prospects, trends, and challenges, Cluster Computing (2021) 24:2841–2866,https://doi.org/10.1007/s10586-021-03301-8