知識(shí)鏈接的構(gòu)建方式研究_綠色生活方式概念
發(fā)布時(shí)間:2020-03-07 來源: 散文精選 點(diǎn)擊:
摘要 在概述知識(shí)鏈接中知識(shí)的各種關(guān)聯(lián)關(guān)系的基礎(chǔ)上,詳細(xì)分析知識(shí)鏈接的類型,并由此探討知識(shí)鏈接的4種主要構(gòu)建方式。作者提出利用參考鏈接機(jī)制推進(jìn)科學(xué)文獻(xiàn)的知識(shí)鏈接,進(jìn)行科學(xué)對(duì)象詞典編制,提升作者機(jī)構(gòu)等相關(guān)對(duì)象的鏈接與評(píng)價(jià)。建立主題圖促進(jìn)知識(shí)元鏈接,對(duì)知識(shí)要素的抽取標(biāo)引推動(dòng)科學(xué)數(shù)據(jù)的鏈接。
關(guān)鍵詞 知識(shí)鏈接 知識(shí)要素 科學(xué)對(duì)象 鏈接方式
分類號(hào) G250
知識(shí)鏈接是指從一個(gè)信息物體鏈接到另一個(gè)信息體,一般特指學(xué)術(shù)論文之間、概念單元之間和科學(xué)對(duì)象之間的鏈接關(guān)系。其發(fā)展與互聯(lián)網(wǎng)的出現(xiàn)息息相關(guān),很大程度上歸功于互聯(lián)網(wǎng)所提供的相互鏈接功能…。
通過知識(shí)鏈接,利用引文關(guān)系、上下位關(guān)系,可以不斷擴(kuò)大檢索范圍,掌握越來越多的相關(guān)文獻(xiàn)。通過知識(shí)鏈接,可以處理異質(zhì)信息資源,建立一個(gè)包括期刊雜志、科學(xué)數(shù)據(jù)、作者網(wǎng)頁、專利信息和產(chǎn)品信息等互相鏈接的圖書館信息環(huán)境。隨著技術(shù)的進(jìn)步、資源的豐富和標(biāo)準(zhǔn)化工作的進(jìn)展,知識(shí)鏈接還可以構(gòu)成一個(gè)統(tǒng)一的知識(shí)體系結(jié)構(gòu),形成序列化或結(jié)構(gòu)化的知識(shí)集合,構(gòu)建知識(shí)網(wǎng)絡(luò)門戶體系,揭示知識(shí)的本質(zhì)聯(lián)系,繼而對(duì)可鏈接的知識(shí)進(jìn)行智能檢索、知識(shí)導(dǎo)航、交叉揭示、統(tǒng)計(jì)分析,達(dá)到評(píng)價(jià)知識(shí)及其相關(guān)科學(xué)對(duì)象的目的。
因此,研究知識(shí)關(guān)聯(lián)關(guān)系、知識(shí)鏈接原理,探討知識(shí)鏈接的構(gòu)建方式,對(duì)于實(shí)施知識(shí)鏈接的具體實(shí)踐具有重要的現(xiàn)實(shí)意義。
1知識(shí)的關(guān)聯(lián)關(guān)系
1,1知識(shí)的同一關(guān)系
指由知識(shí)節(jié)點(diǎn)間具有某種相同屬性,各個(gè)知識(shí)單元間在中心主題、主題、主題因素、概念中所蘊(yùn)含的形象、屬性、關(guān)系所具有的某種程度的相同或相通(相似)之處。表明具有同一性的知識(shí)單元間的等同性、等價(jià)性、相似性、延展性,可以消解知識(shí)內(nèi)容的離散性、重復(fù)性,即將大量離散的具有同一性的知識(shí)單元聯(lián)系在一起。
1,2知識(shí)的隸屬關(guān)系
指構(gòu)成某知識(shí)節(jié)點(diǎn)的某一知識(shí)單元或知識(shí)單元集合隸屬于某一概念、范疇和類別的邏輯關(guān)系。即將具有隸屬關(guān)系的知識(shí)單元,按照一定的屬種、總分、包含的抽象思維或形象思維的邏輯關(guān)系進(jìn)行關(guān)聯(lián),使各個(gè)知識(shí)單元在屬種、總分、包含關(guān)系中擴(kuò)大或縮小適用功能和范圍。即可以通過一般和個(gè)別、總體和部分的內(nèi)在關(guān)聯(lián)性來建立知識(shí)鏈接。
1,3知識(shí)的相關(guān)關(guān)系
指在同一、隸屬關(guān)系之外知識(shí)單元間所具有的相互依存、相互滲透、相互制約、相互作用的關(guān)系,一般是指相反、相對(duì)、因果、引用、應(yīng)用、影響等各種關(guān)系,但其關(guān)系是不嚴(yán)格固定的或數(shù)量關(guān)系是不完全確定的。
除此之外,科學(xué)對(duì)象之間還有繼承關(guān)系、沿革關(guān)系、合作關(guān)系,科學(xué)文獻(xiàn)之間存在著引證關(guān)系(如互引、引文樹)、同現(xiàn)關(guān)系(如同被引、共引、共詞)、上下游間出版?zhèn)鞑リP(guān)系等,都可以構(gòu)建知識(shí)的關(guān)聯(lián)關(guān)系。
2知識(shí)鏈接的類分
2,1基于科學(xué)文獻(xiàn)的知識(shí)鏈接
通過科學(xué)文獻(xiàn)(學(xué)術(shù)論文、引文、專利、標(biāo)準(zhǔn)等)之間的引證關(guān)系,利用開放鏈接標(biāo)準(zhǔn),確定引文鏈接網(wǎng)絡(luò)地址(URL),建立引文鏈接索引庫,鏈接源與相應(yīng)的目標(biāo)可以是期刊論文、學(xué)位論文、標(biāo)準(zhǔn)、專利、圖書篇目、會(huì)議錄、文摘索引款目或甚至是Web站點(diǎn)、E-mail中的鏈接等。通過科學(xué)文獻(xiàn)中的各類型引文,在文摘索引與其所標(biāo)引文獻(xiàn)、文后參考資料與被引用資料之間建立關(guān)聯(lián)和鏈接。根據(jù)引文的引用、被引用和共同引用三種類型,可進(jìn)行引文正向鏈接、引文反向鏈接和共引文獻(xiàn)聚類鏈接等。用戶通過互聯(lián)網(wǎng)查詢這些建立了論文引文鏈接的數(shù)據(jù)庫和知識(shí)庫,借助各種引用途徑在整個(gè)知識(shí)體系中情景敏感地獲得相關(guān)知識(shí)信息。
許多情況下使用知識(shí)鏈接的用戶都處于一種包括OPAC系統(tǒng)、文摘索引數(shù)據(jù)庫、電子期刊及Web信息資源服務(wù)等多種類型信息資源在內(nèi)的復(fù)合圖書館環(huán)境之中。不僅實(shí)現(xiàn)同一個(gè)文獻(xiàn)數(shù)據(jù)庫中的文獻(xiàn)鏈接,還能實(shí)現(xiàn)多個(gè)文獻(xiàn)數(shù)據(jù)庫的內(nèi)容深度整合,在跨庫多維鏈接的基礎(chǔ)上,實(shí)現(xiàn)跨庫引文分析與文獻(xiàn)相似性分析,繼而建立跨庫的知識(shí)鏈接。
2,2基于知識(shí)元的知識(shí)鏈接
知識(shí)元是知識(shí)的最小單位,是知識(shí)結(jié)構(gòu)的基本組成部分,它普遍存在于豐富多彩的文獻(xiàn)世界中。不同的研究視角對(duì)知識(shí)元的稱謂不同,定量化的研究角度稱其為知識(shí)元或知識(shí)元素、知識(shí)因子,定性化的研究視角就是概念或事物。那么,在知識(shí)體系中知識(shí)元?jiǎng)t作為結(jié)構(gòu)最小的知識(shí)節(jié)點(diǎn),用語詞來表示就是關(guān)鍵詞或關(guān)鍵詞組。實(shí)現(xiàn)知識(shí)元鏈接,首先必須將這些最小的知識(shí)單元提煉出來。即把一個(gè)概念、一個(gè)事實(shí)或一個(gè)數(shù)據(jù)等實(shí)際能說明某個(gè)知識(shí)的各元素包括知識(shí)概念、關(guān)鍵詞或關(guān)鍵詞串等提煉出來,按照基本知識(shí)結(jié)構(gòu)存儲(chǔ)在知識(shí)元庫中。
知識(shí)元庫是知識(shí)元鏈接的中樞,由具有獨(dú)立意義的知識(shí)元素構(gòu)成,包括理論與方法、事實(shí)、數(shù)值型三類基本知識(shí)元。通過對(duì)知識(shí)信息點(diǎn)的元素化加工與概括提煉,可以了解各學(xué)科知識(shí)基本內(nèi)容,并發(fā)現(xiàn)知識(shí)之間的內(nèi)容關(guān)聯(lián)。知識(shí)元庫不僅可以直接表述知識(shí)的內(nèi)容,也可以通過全文數(shù)據(jù)庫的索引技術(shù),將使用這一知識(shí)元的所有文獻(xiàn)自動(dòng)鏈接為知識(shí)體系。
2,3基于科學(xué)對(duì)象的知識(shí)鏈接
知識(shí)領(lǐng)域內(nèi)存在著作者與作者、作者與機(jī)構(gòu)、機(jī)構(gòu)與機(jī)構(gòu)、作者與主題間的學(xué)術(shù)關(guān)系,重要機(jī)構(gòu)、團(tuán)隊(duì)、科研人員學(xué)術(shù)關(guān)系及其相關(guān)關(guān)系成為知識(shí)鏈接的基礎(chǔ)。
通過對(duì)科學(xué)共同體、作者、出版社、基金組織等科學(xué)對(duì)象間學(xué)術(shù)資助、科學(xué)引證、科研合作、科學(xué)出版等關(guān)系的分析,對(duì)科學(xué)文獻(xiàn)中學(xué)術(shù)參與者(機(jī)構(gòu)和人)之間合著關(guān)系、引用關(guān)系、人員機(jī)構(gòu)延續(xù)關(guān)系、人員和刊物關(guān)系等進(jìn)行挖掘,可以實(shí)現(xiàn)對(duì)知識(shí)領(lǐng)域內(nèi)科學(xué)對(duì)象(包括人和組織)的結(jié)構(gòu)、活動(dòng)模式和演化過程的揭示,實(shí)現(xiàn)對(duì)領(lǐng)域內(nèi)典型學(xué)術(shù)關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu)和演化過程的可視化表現(xiàn),發(fā)現(xiàn)機(jī)構(gòu)、科研團(tuán)隊(duì)和個(gè)人間學(xué)術(shù)網(wǎng)絡(luò)關(guān)系的特點(diǎn)與趨勢(shì)。
建立基于本體的科學(xué)對(duì)象網(wǎng)絡(luò)體系,將這些科學(xué)對(duì)象進(jìn)行揭示、集成和存儲(chǔ),有機(jī)組織到相應(yīng)的知識(shí)組織體系之中,建立起科學(xué)對(duì)象和原始文獻(xiàn)之間的關(guān)聯(lián)關(guān)系,形成可供計(jì)算的科學(xué)對(duì)象與科技文獻(xiàn)間關(guān)聯(lián)數(shù)據(jù)。并在此基礎(chǔ)之上,通過聚類、文獻(xiàn)計(jì)量、引文追蹤、鏈接分析、相關(guān)性規(guī)則計(jì)算等數(shù)據(jù)挖掘方法,識(shí)別出存在于科技文獻(xiàn)之中的各種學(xué)術(shù)關(guān)系網(wǎng)絡(luò),對(duì)領(lǐng)域內(nèi)存在的結(jié)構(gòu)關(guān)系和知識(shí)領(lǐng)域演化發(fā)展過程進(jìn)行描繪,以反映出當(dāng)前相關(guān)領(lǐng)域的研究中所存在的主要研究團(tuán)隊(duì)和個(gè)人的特點(diǎn)、研究進(jìn)展、研究主題分布情況、研究關(guān)鍵點(diǎn)等知識(shí)領(lǐng)域信息,從而為知識(shí)管理提供基礎(chǔ)數(shù)據(jù)支持。
2,4基于知識(shí)要素的知識(shí)鏈接
科技文獻(xiàn)中包含大量的技術(shù)、項(xiàng)目、產(chǎn)品及其參數(shù)、指標(biāo)、相關(guān)的圖形表格等知識(shí)要素,這些知識(shí)要素往往分散于各種類型、各種載體和各種內(nèi)容的文獻(xiàn)之中,各知識(shí)要素問也存在著相互關(guān)聯(lián),如項(xiàng)目創(chuàng)新技術(shù)、技術(shù)創(chuàng)造產(chǎn)品,產(chǎn)品又有各種相關(guān)的技術(shù)參數(shù)和指標(biāo),它們之間還存在著同一關(guān)系、上下位關(guān)系和相關(guān)關(guān)系等,存在著技術(shù)交替與延續(xù)、技術(shù)仿制及融合的發(fā)展 過程,而其表述除文本外,多數(shù)是圖形和表格等。對(duì)知識(shí)要素進(jìn)行識(shí)別和抽取,對(duì)圖形表格語義特征與語義模型、語義屬性進(jìn)行標(biāo)注及標(biāo)引,可以建立知識(shí)要素的概念化描述以及知識(shí)要素間的鏈接關(guān)系。能夠展現(xiàn)技術(shù)自身的實(shí)況,表現(xiàn)技術(shù)演化發(fā)展的過程,成為技術(shù)圖譜。
在泛在知識(shí)環(huán)境下,隨著互聯(lián)網(wǎng)和數(shù)據(jù)庫產(chǎn)業(yè)的發(fā)展,許多信息服務(wù)機(jī)構(gòu)不僅在自己的數(shù)據(jù)庫內(nèi)提供鏈接,而且開始建立跨機(jī)構(gòu)的知識(shí)鏈接,實(shí)現(xiàn)開放鏈接系統(tǒng)。其鏈接的方式也呈綜合性,豐富多樣,通過對(duì)鏈接解析工具的直接控制和使用,基于以DOI為唯一標(biāo)識(shí)基礎(chǔ)的鏈接推進(jìn)了開放鏈接系統(tǒng)的產(chǎn)生,使文獻(xiàn)間的鏈接在圖書館環(huán)境下普遍存在。同時(shí)也開始進(jìn)行從文獻(xiàn)到科學(xué)數(shù)據(jù)庫的鏈接,將文章中的基因系列與基因數(shù)據(jù)庫中的記錄鏈接,實(shí)現(xiàn)文章內(nèi)或文章間的化學(xué)結(jié)構(gòu)、知識(shí)單元、科學(xué)對(duì)象以及相關(guān)的技術(shù)參數(shù)指標(biāo)等知識(shí)要素的鏈接,將文章中對(duì)實(shí)驗(yàn)結(jié)果的描述與科學(xué)數(shù)據(jù)、科學(xué)參數(shù)結(jié)合等。
3知識(shí)鏈接的構(gòu)建方式
3,1參考鏈接機(jī)制構(gòu)建
超文本是一種按知識(shí)之間的關(guān)系非線性地存儲(chǔ)、組織、管理和瀏覽知識(shí)的技術(shù)與方法。超文本鏈接是表現(xiàn)知識(shí)之間關(guān)系的一種手段,指使用超文本標(biāo)記語言(HTML)的標(biāo)記指令,通過統(tǒng)一資源定位符(URL),指向鏈接對(duì)象的具體位置,在鏈接源(鏈源)與鏈接目標(biāo)(鏈宿)間建立聯(lián)系。其包括兩個(gè)核心要素:節(jié)點(diǎn)和鏈。節(jié)點(diǎn)是展現(xiàn)知識(shí)的基本單元,可以是題錄、不同載體形式的文獻(xiàn)全文,也可以是文獻(xiàn)的責(zé)任者、文獻(xiàn)主題、文獻(xiàn)出版機(jī)構(gòu)等。鏈用來組織節(jié)點(diǎn),表達(dá)節(jié)點(diǎn)問的關(guān)系,它是由一個(gè)節(jié)點(diǎn)指向其他節(jié)點(diǎn),或從其他節(jié)點(diǎn)指向該節(jié)點(diǎn),以表示不同節(jié)點(diǎn)間知識(shí)的關(guān)系,鏈需要采用相同的表述工具予以標(biāo)識(shí)。所以,知識(shí)鏈接可作為一個(gè)過程,也可看作一個(gè)系統(tǒng)。
鏈接是超文本的核心,其基本特征是在嵌入U(xiǎn)RL標(biāo)識(shí)的節(jié)點(diǎn)之間建立關(guān)系。適應(yīng)數(shù)字環(huán)境下異構(gòu)資源系統(tǒng)的發(fā)展,參考鏈接分為封閉式靜態(tài)鏈接、開放式靜態(tài)鏈接以及開放式動(dòng)態(tài)鏈接。封閉式靜態(tài)鏈接是指所有嵌入U(xiǎn)RL的信息鏈接點(diǎn)均在本地存儲(chǔ)和控制,如ISI的Web of Science;開放式靜態(tài)鏈接主要是鏈源和鏈宿互相提供鏈接對(duì)象的標(biāo)識(shí)符或URL,如Cross-Ref;開放式動(dòng)態(tài)鏈接主要是基于OpenURL協(xié)議的開放、擴(kuò)展和多向性鏈接,OpenURL標(biāo)準(zhǔn)的出現(xiàn)為建立無縫的、上下文敏感鏈接提供基礎(chǔ),如SFX。它們都是采用超文本鏈接技術(shù),通過唯一標(biāo)識(shí)符的指向,將文獻(xiàn)實(shí)體間的引證關(guān)系進(jìn)行定位,從而構(gòu)建參考鏈接機(jī)制。
許多新的技術(shù)標(biāo)準(zhǔn)陸續(xù)出現(xiàn),推進(jìn)了基于多樣性信息環(huán)境的知識(shí)鏈接。RDF建立了表達(dá)語意和知識(shí)關(guān)系的模型,DOI和CrossRef可以用所建立的數(shù)字對(duì)象唯一標(biāo)識(shí)體系固化相互之間的引用關(guān)系;OpenURL可以用來表達(dá)動(dòng)態(tài)的、基于用戶環(huán)境和身份的鏈接關(guān)系;而XLink支持多方向的擴(kuò)展鏈接,可以在文檔之間建立多向的復(fù)雜鏈接關(guān)系,實(shí)現(xiàn)鏈源到鏈宿之間的相互鏈接。
3,2科學(xué)對(duì)象詞典編制
作者及其單位、基金、文獻(xiàn)來源等是知識(shí)鏈接的科學(xué)對(duì)象,基于引文的知識(shí)鏈接,需要對(duì)其相關(guān)文獻(xiàn)外部特征和內(nèi)部特征進(jìn)行規(guī)范合一,除對(duì)文獻(xiàn)題目進(jìn)行歸一外,還需要對(duì)文獻(xiàn)來源(期刊名稱和出版社名稱)、作者及其單位、基金等科學(xué)對(duì)象進(jìn)行規(guī)范,是實(shí)現(xiàn)知識(shí)服務(wù)和統(tǒng)計(jì)評(píng)價(jià)功能的關(guān)鍵因素。
對(duì)科學(xué)對(duì)象的鏈接,需要在論文引文數(shù)據(jù)庫建設(shè)過程中進(jìn)行相關(guān)科學(xué)對(duì)象文本的抽取,制定相關(guān)規(guī)范及標(biāo)準(zhǔn),建立面向科學(xué)對(duì)象詞典的結(jié)構(gòu)體系和標(biāo)準(zhǔn),將文本內(nèi)容中的科學(xué)對(duì)象提煉出來,編制成科學(xué)對(duì)象詞典。例如,機(jī)構(gòu)包括正式名稱和別稱,同一機(jī)構(gòu)可以有許多不同的名稱,實(shí)名和指稱、譯名、指代、縮寫、簡稱等;機(jī)構(gòu)間有代用、相關(guān)、從屬等關(guān)系;需要辨析之間的同義、近義、反義、從屬、隱含、關(guān)聯(lián)等關(guān)系。
通過構(gòu)建信息抽取原型系統(tǒng),對(duì)知識(shí)內(nèi)容點(diǎn)的要素化提煉和規(guī)范,采用KDD和數(shù)據(jù)挖掘(Data Mining)等技術(shù)方法,從海量的、結(jié)構(gòu)化的數(shù)據(jù)集中識(shí)別出新穎、有效的要素,包括機(jī)構(gòu)、人員等實(shí)體的抽取。同時(shí),按照一定的分類體系,采用分類標(biāo)引法和詞語標(biāo)引法揭示科學(xué)對(duì)象的主題內(nèi)容和屬性,標(biāo)識(shí)出科學(xué)對(duì)象之間的相關(guān)關(guān)系,并進(jìn)行族性組織和語義、特性組織,使科學(xué)對(duì)象之間具有等級(jí)關(guān)系和學(xué)科關(guān)系。編制出規(guī)模適當(dāng)、具有語義關(guān)系、分級(jí)合理并可靈活配置的科學(xué)對(duì)象詞典(對(duì)象本體)。這樣,可以基于科學(xué)對(duì)象詞典相關(guān)語義場(chǎng)運(yùn)算技術(shù),把知識(shí)特征(形式特征與內(nèi)容特征)與詞典中的標(biāo)引詞匯進(jìn)行相符性比較,通過引文與論文之間的作者、機(jī)構(gòu)、出版社、基金等的規(guī)范,通過科學(xué)對(duì)象關(guān)聯(lián)特征實(shí)現(xiàn)實(shí)體之間的關(guān)聯(lián),進(jìn)行多實(shí)體關(guān)聯(lián)分析及多視角的實(shí)體分析,實(shí)現(xiàn)科學(xué)對(duì)象的相互鏈接和揭示,以及科學(xué)對(duì)象的導(dǎo)航和統(tǒng)計(jì)評(píng)價(jià),繼而達(dá)到發(fā)現(xiàn)知識(shí)之間內(nèi)容關(guān)聯(lián)的需要。
3,3主題圖與知識(shí)元庫建設(shè)
創(chuàng)建知識(shí)元庫、構(gòu)建主題圖是實(shí)現(xiàn)知識(shí)鏈接的基礎(chǔ)。作為一種知識(shí)組織體系,主題圖/概念關(guān)系圖是一個(gè)由眾多的主題、主題間的關(guān)聯(lián)關(guān)系組成的集合體。主題圖由主題、關(guān)聯(lián)來形成知識(shí)的結(jié)構(gòu)與關(guān)聯(lián)。主題可以表示任何概念化的知識(shí)?筛鶕(jù)應(yīng)用領(lǐng)域和用戶需求建立相應(yīng)的主題概念集。關(guān)聯(lián)表示相關(guān)主題之間互相的關(guān)系。將主題關(guān)聯(lián)起來,就形成了主題間的語義聯(lián)系。
文本中的知識(shí)元不是孤立的,知識(shí)元之間也存在著一定的邏輯關(guān)聯(lián)。知識(shí)元有其相對(duì)應(yīng)的主題/概念,一個(gè)知識(shí)元可以對(duì)應(yīng)一個(gè)或多個(gè)主題/概念;反之,一個(gè)主題/概念也可以由多個(gè)知識(shí)元來表達(dá)。知識(shí)元最合適的表達(dá)方式是主題圖,反映知識(shí)元之間的各種隱含的有效關(guān)聯(lián)(如等級(jí)種屬關(guān)系、矛盾關(guān)系、并列同一關(guān)系、簇類關(guān)系等),通過主題、主題間的關(guān)系以及知識(shí)元與資源關(guān)系的表現(xiàn)來組織知識(shí),并將其與相關(guān)信息資源進(jìn)行鏈接。通過對(duì)文本中知識(shí)元的抽取,建立知識(shí)元與主題/概念間的有機(jī)聯(lián)系,形成知識(shí)元庫,可以通過知識(shí)元本身顯現(xiàn)主題與資源實(shí)體之間的一種指向,實(shí)現(xiàn)對(duì)與知識(shí)元庫中相關(guān)聯(lián)的知識(shí)間的知識(shí)鏈接,形成一對(duì)一或一對(duì)多的指向,從而揭示單篇文獻(xiàn)的個(gè)體“知識(shí)元”與某領(lǐng)域共性“知識(shí)結(jié)構(gòu)”的鏈接關(guān)系。
分類法、主題詞表是信息組織的有效工具,在數(shù)字環(huán)境下,分類主題一體化系統(tǒng)作為一種重要的主題圖,可以在知識(shí)鏈接中發(fā)揮作用。其主要功能在于表示知識(shí)概念間的相互聯(lián)系,利用主題概念間的等同關(guān)系、等級(jí)關(guān)系和相關(guān)關(guān)系等豐富的聯(lián)系,結(jié)合知識(shí)元庫,定位某一知識(shí)概念所在的資源位置,將主題、主題間的相互關(guān)聯(lián)以及主題與信息資源的聯(lián)系以特定的方式直觀地展現(xiàn)出來,使抽象的知識(shí)內(nèi)容組織成一個(gè)有坐標(biāo)概念的知識(shí)地圖,并形成結(jié)構(gòu)化的語義網(wǎng)絡(luò),借助鏈接技術(shù),將用戶指引到相關(guān)的資源,獲得所需要的知識(shí)。
3,4知識(shí)要素的抽取標(biāo)引
對(duì)科技文獻(xiàn)中參數(shù)指標(biāo)和圖形表格等知識(shí)要素的識(shí)別與抽取,進(jìn)行圖形表格語義特征及語義模型、語義屬性的標(biāo)注和標(biāo)引,可以建立參數(shù)指標(biāo)的概念化描述以及與其他知識(shí)要素的鏈接關(guān)系,實(shí)現(xiàn)數(shù)據(jù)聚合。
知識(shí)要素的抽取標(biāo)引需要建立圖形、表格的識(shí)別模型和匹配模型,利用上下文分析方法自動(dòng)分析和判讀存儲(chǔ)在計(jì)算機(jī)中的圖形、表格所處的環(huán)境信息,找出其語義特征;利用參數(shù)指標(biāo)語義模型,通過語義特征分析判斷圖形、表格所具備的參數(shù)指標(biāo)屬性,并將相關(guān)屬性進(jìn)行標(biāo)注;利用數(shù)據(jù)清洗方法對(duì)圖形、表格進(jìn)行清洗,從而實(shí)現(xiàn)參數(shù)指標(biāo)的識(shí)別與分離。并對(duì)科技文獻(xiàn)信息中包含的大量圖形、表格及其與上下文的關(guān)系進(jìn)行分析,通過遞歸算法等推導(dǎo)出參數(shù)指標(biāo)語義模型,利用機(jī)器學(xué)習(xí)理論和上下文分析理論,識(shí)別參數(shù)指標(biāo);利用數(shù)據(jù)挖掘理論,清洗、析出科學(xué)數(shù)據(jù)。
利用知識(shí)組織中的概念體系,對(duì)抽取的參數(shù)指標(biāo)和圖形表格等知識(shí)要素進(jìn)行概念判斷、識(shí)別、歸類、描述和鏈接,利用自動(dòng)切詞技術(shù),對(duì)這些知識(shí)要素進(jìn)行元數(shù)據(jù)描述和知識(shí)加工標(biāo)引,建立知識(shí)要素的概念化表達(dá)和關(guān)聯(lián)。按照參數(shù)指標(biāo)等知識(shí)要素的元數(shù)據(jù)規(guī)范,進(jìn)行自動(dòng)標(biāo)注從而獲取相關(guān)屬性,建設(shè)知識(shí)要素?cái)?shù)據(jù)庫,實(shí)現(xiàn)知識(shí)要素間的有效鏈接與揭示。
知識(shí)鏈接原理是依據(jù)知識(shí)間特有屬性和關(guān)聯(lián)關(guān)系,知識(shí)鏈接方法得益于技術(shù)和標(biāo)準(zhǔn)的發(fā)展。開放鏈接標(biāo)準(zhǔn)的應(yīng)用,主題圖、知識(shí)元庫、科學(xué)對(duì)象詞典、知識(shí)本體等方面的研究為建立學(xué)習(xí)環(huán)境和信息環(huán)境之間的鏈接關(guān)系打下了良好的基礎(chǔ)。知識(shí)鏈接更加重視面向用戶需求的范疇分類和主題表達(dá),使之更加個(gè)性化和可視化,根據(jù)用戶行為特征組織知識(shí)和導(dǎo)航知識(shí)、挖掘知識(shí)和評(píng)價(jià)知識(shí);重視知識(shí)的多樣化、專業(yè)化、層次化、內(nèi)容過濾、知識(shí)抽取、顯性知識(shí)和隱性知識(shí)的轉(zhuǎn)換;更加重視人與人之間的聯(lián)系、機(jī)構(gòu)、社團(tuán)聯(lián)系等。這種分布異構(gòu)的各數(shù)據(jù)庫,通過知識(shí)元數(shù)據(jù)庫、引文索引庫和其他知識(shí)要素詞典和科學(xué)對(duì)象索引耦合起來的整體化數(shù)據(jù)庫集群形成一個(gè)集成的知識(shí)鏈接體系。任何一個(gè)用戶都可以通過文獻(xiàn)之間交錯(cuò)復(fù)雜的知識(shí)鏈接,最大限度地獲得相關(guān)知識(shí)信息,從而實(shí)現(xiàn)知識(shí)管理和知識(shí)服務(wù)的目標(biāo)。
相關(guān)熱詞搜索:構(gòu)建 方式 鏈接 知識(shí)鏈接的構(gòu)建方式研究 知識(shí)鏈接及其服務(wù)研究 論知識(shí)鏈接的建立規(guī)則
熱點(diǎn)文章閱讀