【數(shù)字保存的認知與實踐】大學(xué)生實踐報告3000字
發(fā)布時間:2020-03-10 來源: 歷史回眸 點擊:
[摘要][2011-08-25]數(shù)字保存認知是對數(shù)字保存基本問題的看法,對出版界的認知調(diào)查包括保存原因、保存威脅、保存費用和保存職責(zé)。數(shù)字保存實踐是對數(shù)字保存領(lǐng)域中相關(guān)問題的目前解決方法,對出版界的實踐調(diào)查包括保存內(nèi)容(出版物、期刊論文、研究型數(shù)據(jù))和保存策略(針對期刊論文的和針對研究型數(shù)據(jù)的);谡J知調(diào)查,提出加強數(shù)字保存可持續(xù)性研究的思路;趯嵺`調(diào)查,提出加強學(xué)術(shù)論文與研究型數(shù)據(jù)之間鏈接保存的思想。
[關(guān)鍵詞]數(shù)字保存 認知調(diào)查 實踐調(diào)查 出版界
[分類號]G250
數(shù)字保存是一項系統(tǒng)工程,其建設(shè)和運營涉及到數(shù)字時代學(xué)術(shù)交流系統(tǒng)中各利益相關(guān)方:研究人員(既是數(shù)字資源生產(chǎn)者,又是數(shù)字資源消費者)、出版界(數(shù)字資源傳播者)、保存機構(gòu)(數(shù)字保存系統(tǒng)的建設(shè)與運營者)以及保存資金提供者。對各利益相關(guān)方進行數(shù)字保存認知與實踐的調(diào)查,有助于了解對數(shù)字保存的期望,掌握數(shù)字保存的現(xiàn)狀,發(fā)現(xiàn)數(shù)字保存理論與實踐的問題。
到目前為止,全方位對數(shù)字保存認知與實踐的調(diào)查甚為鮮見。歐盟PARSE.insight項目歷經(jīng)三年(2008-2010年),對數(shù)字保存利益相關(guān)方進了比較系統(tǒng)的調(diào)查。本文從出版界角度,基于PARSE.in-sight的調(diào)查,分析總結(jié)出版界對數(shù)字保存的認知與實踐。
1 調(diào)查對象
針對出版界的PARSE,insight調(diào)查對象選擇來自目前兩個最主要的學(xué)術(shù)出版商名錄:STM出版商協(xié)會(International Association of Scientific,Technologi-cal and Medical Publishers,國際科學(xué)、技術(shù)與醫(yī)學(xué)出版商協(xié)會)和DOAj (Directory of Open Access Journals,開放存取期刊目錄)。
在STM協(xié)會中,有67家出版商(如Elsevier、Springer等)給予了回復(fù),其中歐盟42家、美國18家、其他7家,共出版同行評審期刊8800種,占本次調(diào)查全部期刊97%,占全球同行評審期刊35%(據(jù)統(tǒng)計,目前同行評審期刊約25400種)。
在DOAJ中,有126家出版商給予了回復(fù),其中歐盟55家、美國18家、其他53家,共出版開放存取期刊250種,占本次調(diào)查全部期刊3%。據(jù)估計,目前約10%的同行評審期刊是開放存取,但本次調(diào)查沒有考察DOAJ期刊是否是同行評審。
分析結(jié)果時,將出版商分兩類:一是大型出版商(出版期刊大于50種,如Elsevier出版2 000余種,STM出版商的前5家出版學(xué)術(shù)期刊之和占所有期刊的25%),二是小型出版商(出版期刊不大于50種,如大多數(shù)DOAJ出版商僅出版一種或幾種開放存取期刊)。
2 數(shù)字保存的認知
認知就是看法,出版界對數(shù)字保存的認知是指各類出版商對數(shù)字保存基本問題的看法,這些問題有:保存原因、保存威脅、保存費用、保存職責(zé)。
2.1 保存原因
兩類出版商對最重要保存原因(促進科學(xué)發(fā)展)和最不重要保存原因(數(shù)字資源的潛在經(jīng)濟價值)的認知比較一致,最大分歧發(fā)生在“由公共資金資助”這一原因上,如表1所示:
可能的解釋是,小型出版商主要出版公共資助的研究成果,但有些學(xué)科(藥學(xué)、醫(yī)學(xué)、化學(xué)和工程)的研究更多由私人資助,而這些學(xué)科的研究成果很少發(fā)表在小型出版商的開放存取期刊上。
2.2保存威脅
兩類出版商對數(shù)字保存最嚴重威脅的認知基本一致,位居前三位的是:數(shù)字保存系統(tǒng)的可持續(xù)性無法保證、軟硬件缺乏可持續(xù)性、數(shù)字資源來源信息改變或丟失等。最大分歧是對“數(shù)字資源文件格式過時”的威脅的認知上(見表2)。
2.3保存費用
數(shù)字保存需要大量資金。在出版界層面,需要保存的數(shù)字資源有學(xué)術(shù)期刊論文和作者隨論文一起提交的相關(guān)研究型數(shù)據(jù)(有些論文基于大量實驗,用戶查閱該類論文時常需要參閱相關(guān)研究型數(shù)據(jù))。
針對誰應(yīng)該支付學(xué)術(shù)期刊論文的保存費用,_曲類出版商的回答區(qū)別不大,相當(dāng)一部分認為應(yīng)該是公共資金,包括國家政府和國家圖書館,但也有一部分出版商認為出版界應(yīng)該承擔(dān)保存費用。針對準(zhǔn)應(yīng)該支付研究型數(shù)據(jù)的保存費用,政府資金仍然是最多的選項,其次是研究人員所在的研究機構(gòu)。如表3所示
2.4保存職責(zé)
對比期刊論文的保存職責(zé)承擔(dān)者與研究型數(shù)據(jù)的保存職責(zé)承擔(dān)者,兩類出版商的認知存在重大差異:前者排在首位的是出版商自己,后者排在首位的則為作者(見表4)。
針對期刊論文,大型出版商常常將保存職責(zé)外包給第三方(如Portico和CLOCKSS/LOCKSS),但小型出版商采用外包方式明顯較少。另外,兩類出版商對于國家政府應(yīng)該承擔(dān)保存職責(zé)的看法明顯不同,持該觀點的小型出版商比大型出版商多15%。
針對研究型數(shù)據(jù),雖然兩類出版商的認知比較一致,但因為只有一個數(shù)據(jù)超過了50%(“作者”選項),所以他們可能更不確定誰應(yīng)該承擔(dān)這種類型數(shù)字資源的長期保存職責(zé)。
3 數(shù)字保存的實踐
實踐就是行動,出版界對數(shù)字保存的實踐是指不同類型出版商對數(shù)字保存領(lǐng)域中相關(guān)問題的目前解決方法,這些問題有:保存內(nèi)容(出版物、期刊論文、研究型數(shù)據(jù))、保存策略(針對期刊論文的和針對研究型數(shù)據(jù)的)。
3.1保存出版物的類型
兩類出版商對保存出版物類型的實踐比較相似。在所有類型出版物中,小型出版商的選擇比例都略高于大型出版商,只有對數(shù)字圖書例外,可能的解釋是小型出版商很少出版圖書。如表5所示:
在數(shù)字時代,期刊的出版形式正在朝著多媒體方向轉(zhuǎn)變。總體上有一半以上出版商選擇了多媒體出版物。但對研究型數(shù)據(jù)進行保存的選擇明顯較低,可能原因有二:一是目前實踐的確很少,二是這類數(shù)據(jù)保存的商業(yè)化運作模式還有待開發(fā)。
3.2保存學(xué)術(shù)論文的版本
兩類出版商對長期保存的學(xué)術(shù)論文版本明顯不同。大型出版商多保存正式出版的版本,而小型出版商傾向于出版商接收的手稿。這種現(xiàn)象的解釋為,小型出版商出版的期刊大多是開放存取期刊,很少對作者的手稿添加信息,多采用文責(zé)自負方針;而大型出版商的期刊均為同行評審,常常需對作者手稿進行修改,認為正式出版的版本質(zhì)量最高。
該項調(diào)查為多項選擇,結(jié)果顯示,大型出版商比小型出版商更傾向于選擇更多的選項,說明大型出版商認為有保存價值的版本較多。如表6所示:
3.3研究型數(shù)據(jù)的接收情況
雖然兩類出版商大多接受研究型數(shù)據(jù),但大型出版商(72%)要高于小型出版商(57%),這可能說明了兩類出版商提供該類數(shù)據(jù)服務(wù)的層次差異。另外,目前不接收研究型數(shù)據(jù)的出版商大約有20%計劃5年內(nèi)接收。從期刊數(shù)量角度,接收研究型數(shù)據(jù)的大型出版商出版7730種,而小型出版商出版746種,共計8476 種,約占調(diào)查期刊(共9050種)的94%。
每種研究型數(shù)據(jù)都有其特性,不同類型研究型數(shù)據(jù)所需保存策略可能不同。針對接收研究型數(shù)據(jù)的出版商又進行了接收數(shù)據(jù)類型的調(diào)查,如表7所示:
辦公文檔、圖像和純文本是出版活動涉及的傳統(tǒng)數(shù)據(jù)類型,兩類出版商對這三種類型數(shù)據(jù)接受程度都比較高,但整體上小型出版商比大型出版商更高。
另外,隨著出版物形式的多樣化,多媒體、科學(xué)數(shù)據(jù)、統(tǒng)計數(shù)據(jù)、結(jié)構(gòu)化圖形和數(shù)據(jù)庫等類型的研究型數(shù)據(jù)也越來越多地被出版商接收。與小型出版商相比,大型出版商通常更傾向接收這些更加復(fù)雜的研究型數(shù)據(jù)類型,這反映了大型出版商向作者提供的服務(wù)水平較高。
3.4期刊論文的長期保存
期刊是出版商最主要的產(chǎn)品,除了面向用戶提供訪問外,絕大多數(shù)出版商(84%的大型出版商和55%的小型出版商)都對出版的學(xué)術(shù)期刊進行長期保存,這些出版商共出版8444種期刊(其中大型出版商7698種,小型出版商740種),約占調(diào)查期刊的93%。
至于采用的保存策略,多數(shù)大型出版商采用外包方式,而只有不足1/4的小型出版商采用這種策略。大型出版商選擇的外包商分別有Portico(30%)、CLOCKSS/LOCKSS(13%)和e―depot(7%),而小型出版商選擇這些外包商的比例分別只有5%、11%和0%。標(biāo)準(zhǔn)化和數(shù)字遷移是其他兩個較常用策略。但足,在所有選擇中,數(shù)字仿真最不常用,如表8所示:
3.5研究型數(shù)據(jù)的長期保存
針對接收的研究型數(shù)據(jù),兩類出版商絕大多數(shù)都不保存,不足1/5的出版商采取與期刊論文相同的保存策略(大多采用外包),只有很少的出版商通過專業(yè)的數(shù)據(jù)保存系統(tǒng)進行保存,如表9所示:
從期刊數(shù)量角度,絕大多數(shù)期刊沒有對研究型數(shù)據(jù)進行保存,其中大型出版商7451種,小型出版商533種,總計7984種,約占調(diào)查期刊的83%。
4 對數(shù)字保存的思考
數(shù)字保存是數(shù)字時代的一項重要活動,多年米,尤論在國內(nèi)還是國外,業(yè)界都進行了大量的理論研究與實踐探索,取得了豐厚成果。但是,根據(jù)PARSE.in-sight對出版界的調(diào)查,數(shù)字保存還遠未完善。
4.1認知上的思考
在認知上,雖然對數(shù)字保存的必要性認識高度一致(96%的兩類出版商認為數(shù)字保存的原因是“促進科學(xué)發(fā)展”),但對數(shù)字保存的未來高度憂慮(78%的兩類出版商認為數(shù)字保存的最嚴重威脅是“可持續(xù)性無法保證”)。因此,業(yè)界應(yīng)該加強對數(shù)字保存的可持續(xù)性研究。宏觀上,數(shù)字保存的可持續(xù)性包括管理、技術(shù)、質(zhì)量保證和經(jīng)濟可持續(xù)性等方面。多年來,對數(shù)字保存的研究主要集中在管理和技術(shù)層面,但對質(zhì)量保證和經(jīng)濟可持續(xù)性涉獵甚少,因此應(yīng)該開展對這兩個問題的探討。
從目前實踐來看,數(shù)字保存有兩類:基于市場機制運營(如CNKI的中國期刊全文數(shù)據(jù)庫)和基于公益性機制運營(如美國國會圖書館的“American Memory”),這兩類數(shù)字保存都可以視為經(jīng)濟產(chǎn)品,其中前者可視為市場經(jīng)濟產(chǎn)品,后者可視為公共經(jīng)濟產(chǎn)品。從經(jīng)濟產(chǎn)品角度,數(shù)字保存的質(zhì)量保證研究可以從質(zhì)量保證標(biāo)準(zhǔn)的建立和質(zhì)量認證模型的構(gòu)建兩個角度來進行,數(shù)字保存的經(jīng)濟可持續(xù)性研究可以從經(jīng)濟評價指標(biāo)體系的建立和評價方法的構(gòu)建兩個方面來實施。
基于上述思路,保存費用的承擔(dān)和保存職責(zé)的劃分也就更加明晰。數(shù)字文化遺產(chǎn)的保存屬于公共經(jīng)濟產(chǎn)品,由政府承擔(dān);商業(yè)型數(shù)字資源的保存屬于市場經(jīng)濟產(chǎn)品,由經(jīng)濟實體按照市場機制運營。但是,這兩類數(shù)字保存的經(jīng)濟評價指標(biāo)和評價方法可能會有所區(qū)別(比如,前者應(yīng)該包括國民經(jīng)濟評價,而后者可能更注重財務(wù)評價)。
4.2實踐上的思考
在實踐上,出版界對學(xué)術(shù)期刊論文的保存比較普及(84%的大型出版商和55%的小型出版商保存這類數(shù)字資源),但對研究型數(shù)據(jù)的保存較少(只有31%的大型出版商和同樣比例的小型出版商保存這類數(shù)字資源)。實際上,在自然科學(xué)領(lǐng)域,用戶對這兩類數(shù)字資源的交叉使用非常普遍,具體體現(xiàn)在兩個方面:一是對于基于數(shù)據(jù)密集型研究學(xué)科和實驗型學(xué)科,大部分研究論文都基于大量研究型數(shù)據(jù),用戶查閱論文時常需要參閱相關(guān)研究型數(shù)據(jù);二是研究型數(shù)據(jù)的含義體現(xiàn)在使用環(huán)境之中,當(dāng)用戶訪問研究型數(shù)據(jù)時,常常需要參閱使用該項研究型數(shù)據(jù)的專業(yè)期刊論文。因此,只有將研究型數(shù)據(jù)與期刊論文鏈接起來,才能滿足用戶的需求。然而,目前對這類鏈接的保存實踐幾乎沒有,這可能是導(dǎo)致研究型數(shù)據(jù)保存甚少的原因所在(因為沒有與論文相鏈接的研究型數(shù)據(jù)缺乏使用價值)。所以,業(yè)界應(yīng)該加強對這類鏈接保存的研究實踐。
對學(xué)術(shù)論文與研究型數(shù)據(jù)之間的鏈接進行保存可能涉及的問題有:①這兩類數(shù)字資源的唯一標(biāo)識符系統(tǒng)的標(biāo)準(zhǔn)化,這是實施鏈接保存的基礎(chǔ);②可信任數(shù)字保存網(wǎng)絡(luò)系統(tǒng)的建設(shè),這是保證鏈接有效的條件;③研究型數(shù)據(jù)質(zhì)量評價體系的建立,這是用戶訪問和使用研究型數(shù)據(jù)的前提。只有在這種結(jié)構(gòu)下,才能構(gòu)建和完善數(shù)字資源的兩類主要形式(學(xué)術(shù)論文和研究型數(shù)據(jù))長期保存的實踐框架,設(shè)計并完善保存策略。
[作者簡介]臧國全,男,1963年出生,教授,系副主任,發(fā)表論文60余篇,出版學(xué)術(shù)專著3部。劉思,女,1988年出生,碩士研究生,發(fā)表論文1篇。
相關(guān)熱詞搜索:認知 保存 實踐 數(shù)字保存的認知與實踐 數(shù)字認知 數(shù)字認知圖片
熱點文章閱讀