國內(nèi)科學數(shù)據(jù)相關(guān)研究進展分析:帕金森病科學研究進展
發(fā)布時間:2020-03-07 來源: 散文精選 點擊:
[摘要]對我國科學數(shù)據(jù)相關(guān)研究文獻統(tǒng)計以及科學數(shù)據(jù)建設(shè)歷程進行分析,將我國科學數(shù)據(jù)研究進程劃分為資源累積、數(shù)據(jù)庫建設(shè)、數(shù)據(jù)共享和知識環(huán)境建設(shè)4個階段,對各階段的科研需求、技術(shù)背景、政策環(huán)境和涉及層面給予客觀描述。分析科學數(shù)據(jù)相關(guān)研究進展的重要影響力和推動力,提出我國現(xiàn)階段存在問題與不足以及未來重點關(guān)注方向。
[關(guān)鍵詞]科學數(shù)據(jù)科學數(shù)據(jù)庫研究進展
[分類號]G203
1 引言
科學數(shù)據(jù)作為信息時代一種最基本、影響面最寬的科技創(chuàng)新資源,具有顯著的科技推動能力、投資引向價值、應(yīng)用增值潛力和決策支持作用。我國是科學數(shù)據(jù)資源大國,也是科學數(shù)據(jù)管理欠完善的國家。相對于美國、英國、日本等發(fā)達國家,我國科學數(shù)據(jù)的研究工作起步較晚,但發(fā)展卻比較迅速。本文試圖從文獻研究和歷程回顧兩種視角對我國科學數(shù)據(jù)相關(guān)研究進展情況與發(fā)展階段、主要影響和推動因素等進行客觀描述,提出現(xiàn)階段我國科學數(shù)據(jù)發(fā)展與研究進程中存在的問題以及未來的重點關(guān)注方向。
2 基于文獻的研究進展分析
以“科學數(shù)據(jù)”或“科學數(shù)據(jù)庫”作為題名或者關(guān)鍵詞進行檢索,從CNKI中國期刊全文數(shù)據(jù)庫中精確檢索到1979-2008年的文獻356篇;再以同樣的檢索詞在維普中文科技期刊數(shù)據(jù)庫中檢索1989-2008年的文獻,共得431篇。由于本次維普檢索結(jié)果中的非相關(guān)文獻較多,因此本文選取CNKI的檢索結(jié)果作為研究對象,排除非相關(guān)文獻后總計剩余255篇,經(jīng)過閱讀分析,按照文獻的研究方向和發(fā)表年代分類列表見表1:
從文獻發(fā)表時間和數(shù)量來看:最早發(fā)表的年代為1982年;1995年之前僅有16篇相關(guān)文獻,而2002-2008年,有相關(guān)文獻144篇,占文獻總量的56%,且呈高速遞增趨勢;分別以“科學數(shù)據(jù)”和“科學數(shù)據(jù)庫”作為檢索詞在“CNKI學術(shù)趨勢”中檢索得到與此相關(guān)學術(shù)關(guān)注度走勢圖詳見圖1和圖2。也可以看到,國內(nèi)對“科學數(shù)據(jù)”的關(guān)注度在2003年達到一個較高的峰值之后略有回落,但總體仍呈快速上升趨勢,并于2006年達到一個新的峰值;而對于“科學數(shù)據(jù)庫”的關(guān)注度在1996-1997年之間達到了第一個峰值,在2002-2003年之間達到了第二個更高的峰值。
從文獻內(nèi)容與研究方向來看(見表1):最早發(fā)表的一篇是對英聯(lián)邦農(nóng)業(yè)局科學數(shù)據(jù)庫的介紹(林廣信,1982年);1995年之前的16篇相關(guān)文獻中,有15篇足資源建設(shè)與管理或數(shù)據(jù)庫技術(shù)的簡介類文獻;1996―1997年,開始出現(xiàn)數(shù)據(jù)庫建設(shè)及其應(yīng)用類文獻;從2002年開始,大量出現(xiàn)關(guān)于科學數(shù)據(jù)共享的文獻,研究內(nèi)容也廣泛涉及到發(fā)達國家先進經(jīng)驗的研究與借鑒(孫樞,2002年;劉闖,2003年);機制體制、對策、政策法規(guī)、知識產(chǎn)權(quán)、共享平臺建設(shè)規(guī)劃、資源整合與開發(fā)和標準體系框架(徐楓,2003年);元數(shù)據(jù)(楊德婷等,2003年);共享支撐技術(shù)(李花安等,2006年);資源分類編碼、數(shù)據(jù)安全等諸多方面。
此外還出現(xiàn)了少量關(guān)于數(shù)據(jù)可視化、數(shù)據(jù)挖掘、數(shù)據(jù)分析等方面的文獻,總計有11篇,其中最早的一篇為科學數(shù)據(jù)圖顯分析軟件介紹(陳鐵,1995年),其余多為計算機與網(wǎng)絡(luò)技術(shù)專業(yè)文獻。內(nèi)容涉及可視化管理系統(tǒng)(王蓓蓓等,2004年)、數(shù)據(jù)倉庫技術(shù)(樊明輝等,2004年)、基于獨立分量分析的數(shù)據(jù)挖掘技術(shù)(聶琨坤等,2004年)、基于聚類算法的數(shù)據(jù)挖掘技術(shù)(李欣宇等,2006年)等,2008年出現(xiàn)的關(guān)于科學數(shù)據(jù)與科學文獻的關(guān)聯(lián)關(guān)系分析的文獻(孫志茹等,2008年)是科學數(shù)據(jù)分析與利用當中的比較新的研究方向;另外,也有少量關(guān)于數(shù)據(jù)質(zhì)量評價及績效評估、科學數(shù)據(jù)應(yīng)用與服務(wù)等類別的文獻,分別有2篇和6篇。
從涉及的學科與專業(yè)領(lǐng)域來看:相關(guān)研究文獻分別占文獻總量的51%和49%,大致持平;在涉及學科專業(yè)的相關(guān)研究中,地球科學(含氣象科學)的文獻數(shù)量為53篇,高居榜首,占到此類文獻的42%;其他涉及比較多的專業(yè)領(lǐng)域有醫(yī)藥衛(wèi)生27篇,農(nóng)業(yè)15篇,另有少量關(guān)于機械、水利、材料、林業(yè)、資源環(huán)境、交通運輸、生物信息學與生命科學、測繪科學等專業(yè)領(lǐng)域的文獻。
從論文作者所屬機構(gòu)和研究內(nèi)容所涉及的地域范圍來看,其中有23%的論文作者出自中國科學院(以下簡稱“中科院”),而涉及區(qū)域性科學數(shù)據(jù)建設(shè)與共享研究的僅占4%,其中包括廣東、河北、湖南、山西、黑龍江及西部地區(qū)等。
3 基于建設(shè)歷程的研究階段分析
3.1 關(guān)于國內(nèi)科學數(shù)據(jù)相關(guān)研究與建設(shè)歷程回顧
回顧我國科學數(shù)據(jù)研究與建設(shè)的歷程,與上述文獻分析結(jié)果吻合:1982年,中科院將“科學數(shù)據(jù)庫及其信息工程”列入其后lO年重大基本建設(shè)項目,并于1986年被國家計委納入國家重點建設(shè)計劃;1995年為統(tǒng)一組織“中國國家計算機與網(wǎng)絡(luò)設(shè)施(NCFC)”和“科學數(shù)據(jù)庫及其信息系統(tǒng)”兩大工程的建設(shè),成立了“中科院計算機網(wǎng)絡(luò)信息中心(CNIC)”;2001年底,為了促進氣象科學數(shù)據(jù)的全社會共享,科技部將中國氣象局作為科學數(shù)據(jù)共享的第一個試點,啟動了基礎(chǔ)性工作專項資金項目“氣象科學數(shù)據(jù)共享試點”;2002年科技部啟動“國家科學數(shù)據(jù)共享工程”,將數(shù)據(jù)資源建設(shè)和共享作為支持國家創(chuàng)新發(fā)展的戰(zhàn)略工程,納入到《2004-2010年國家科技基礎(chǔ)條件平臺建設(shè)綱要》中去,成為國家中長期科技發(fā)展規(guī)劃的重要內(nèi)容之一;2003年國家財政支持啟動了包含科學數(shù)據(jù)共享平臺在內(nèi)的國家科技基礎(chǔ)平臺建設(shè)規(guī)劃,并開始著手部署試點工作;2004年科技部開展的國家科技基礎(chǔ)條件資源調(diào)查數(shù)據(jù)顯示,在調(diào)查到2 459個數(shù)據(jù)庫中,總量達4 971.18TB,共獲得建庫資金28.27億元;2006年,以“信息社會的科學數(shù)據(jù)與知識”為主題,以促進世界范圍的數(shù)據(jù)共享為目標的第20屆國際科學數(shù)據(jù)委員會(CODATA)國際學術(shù)會議在北京召開,徐冠華部長在大會報告中表示,到2010年,中國要基本建成覆蓋全面、結(jié)構(gòu)合理的國家科學數(shù)據(jù)中心群及其共享服務(wù)網(wǎng)絡(luò)體系,形成科學數(shù)據(jù)的良性匯交與更新機制,基本滿足各部門對科學數(shù)據(jù)的需求。
3.2 國內(nèi)科學數(shù)據(jù)相關(guān)研究進展階段的分析
結(jié)合我國科學數(shù)據(jù)研究與建設(shè)的發(fā)展歷程,對相關(guān)文獻進行參閱與考證,可將國內(nèi)科學數(shù)據(jù)研究與建設(shè)發(fā)展過程分為資源累積建設(shè)、數(shù)據(jù)庫建設(shè)、數(shù)據(jù)共享、知識環(huán)境建設(shè)4個階段,見表2。
科學數(shù)據(jù)的資源累積階段(20世紀80年代以前)。傳統(tǒng)的、相對封閉的科學研究方式?jīng)Q定了所產(chǎn)生的科學數(shù)據(jù)也是零散、孤立、非系統(tǒng)的,科研活動產(chǎn)生的數(shù)據(jù)或數(shù)據(jù)集合多數(shù)由研究人員或研究團隊自行擁有,管理和利用都處于比較低級的水平。
科學數(shù)據(jù)庫建設(shè)階段(20世紀80年代后一2000年)。隨著新型研究手段、計算技術(shù)、觀測與傳輸技術(shù)的快速革新,科學數(shù)據(jù)產(chǎn)出和處理的時間大大縮 短,致使各項科研活動產(chǎn)生的科學數(shù)據(jù)量急劇增加,對科學數(shù)據(jù)管理和利用的要求也明顯提高,國內(nèi)部分研究機構(gòu)和行業(yè)領(lǐng)域開始了科學數(shù)據(jù)庫研究與建設(shè)的探索工作,如中科院于1982年啟動了“中科院科學數(shù)據(jù)庫”項目,經(jīng)過20余年的發(fā)展,現(xiàn)已經(jīng)成為國內(nèi)信息量最大、服務(wù)層次最高的綜合性科學數(shù)據(jù)系統(tǒng)。
?科學數(shù)據(jù)的共享階段(2000年-2006年)。人類步入了知識經(jīng)濟時代,科學技術(shù)的發(fā)展明顯呈現(xiàn)出大科學、定量化和注重過程研究等特點,也越來越依賴于系統(tǒng)的、高可信度的基本科學數(shù)據(jù)及其衍生的數(shù)據(jù)產(chǎn)品,系統(tǒng)性的科學數(shù)據(jù)建設(shè)與共享成為這一階段的主要任務(wù),國家層面的頂層設(shè)計和戰(zhàn)略規(guī)劃起到至關(guān)重要的作用,如2002年科技部啟動的“國家科學數(shù)據(jù)共享工程”以及2003年啟動的“國家基礎(chǔ)條件平臺建設(shè)”,在國內(nèi)引發(fā)了科學數(shù)據(jù)共享研究的熱潮。
科學數(shù)據(jù)的知識環(huán)境建設(shè)階段(2006年至今)。數(shù)據(jù)密集型、數(shù)據(jù)驅(qū)動型研究方式引發(fā)傳統(tǒng)科學研究向信息化科學研究(e-Science)的變革,多學科、交叉學科的融合發(fā)展以及全球化、跨學科、大規(guī)模的科研合作,引發(fā)了更高層次、全球范圍的信息需求。“泛在知識環(huán)境”。概念在國內(nèi)的提出,也為科學數(shù)據(jù)的發(fā)展提供了方向,而網(wǎng)格技術(shù)則為實現(xiàn)不同地域分布的計算資源、存儲資源、數(shù)據(jù)資源、信息資源、知識資源、專家資源的全面共享和協(xié)同作業(yè)提供了可能。
4 科學數(shù)據(jù)相關(guān)研究進展的動因分析
縱觀我國科學數(shù)據(jù)研究與建設(shè)發(fā)展歷程,每一階段的出現(xiàn)和進步均與當時的科研環(huán)境與需求、技術(shù)水平以及宏觀政策環(huán)境密切相關(guān),因此,一個國家的科技發(fā)展階段和狀況、計算機及信息技術(shù)水平、國家層面的頂層規(guī)劃與政策環(huán)境等三個方面的因素,是科學數(shù)據(jù)研究與建設(shè)發(fā)展的主要影響因素;反之,國家層面科學數(shù)據(jù)建設(shè)與研究水平,也會對科學研究進展和信息技術(shù)水平提高起到幫助和促進作用。本文根據(jù)各種影響因素之間的關(guān)系制作了用以說明科學數(shù)據(jù)研究進展狀況與其影響因素之間相互作用的關(guān)系如圖3所示:
首先,科學數(shù)據(jù)來源于科學研究,又服務(wù)于科學研究?蒲谢顒拥男枨笫谴龠M科學數(shù)據(jù)產(chǎn)生、管理、應(yīng)用的第一推動力,而對科學數(shù)據(jù)的有效保存、完善管理和充分利用也為支持更復雜的科學研究及科技創(chuàng)新提供了不可替代的基礎(chǔ)資源;其次,先進的計算機技術(shù)與信息技術(shù)為科學數(shù)據(jù)的收集、管理、共享和分析利用提供了技術(shù)實現(xiàn)條件,海量科學數(shù)據(jù)的出現(xiàn)以及科研活動對科學數(shù)據(jù)管理與應(yīng)用要求的提高,又進一步促進了當代計算機與信息技術(shù)的發(fā)展;再次,從科學數(shù)據(jù)累積管理到科學數(shù)據(jù)庫建設(shè),從科學數(shù)據(jù)庫共享體系建設(shè)再到e―Science環(huán)境的構(gòu)建,國家層面的規(guī)劃部署、國家政策引導與推動對其發(fā)展起到至關(guān)重要甚至決定性的作用。
5 我國現(xiàn)階段科學數(shù)據(jù)研究與建設(shè)存在問題及未來重點關(guān)注方向
5.1 存在問題分析
通過相關(guān)文獻分析可以看出,盡管我國科學數(shù)據(jù)相關(guān)研究與建設(shè)經(jīng)歷了20余年的快速發(fā)展,但現(xiàn)階段仍存在如下問題:①從文獻研究內(nèi)容與方向來看,對于科學數(shù)據(jù)資源建設(shè)與共享的技術(shù)實現(xiàn)及體系構(gòu)建等方面關(guān)注較多,而對于面向科研需求的科學數(shù)據(jù)有效開發(fā)利用等方面的關(guān)注不足;②從涉及的學科領(lǐng)域來看,某些學科領(lǐng)域(如地球科學)的科學數(shù)據(jù)研究與建設(shè)得到了很好的發(fā)展,而部分學科領(lǐng)域的科學數(shù)據(jù)研究建設(shè)尚未得到關(guān)注;③從涉及的地域范圍來看,國家層面的科學數(shù)據(jù)研究建設(shè)有了比較快速的發(fā)展,而區(qū)域范圍內(nèi)的科學數(shù)據(jù)建設(shè)、共享和利用等發(fā)展不均衡,大部分區(qū)域科學數(shù)據(jù)建設(shè)與共享工作未能有效開展。
通過對我國科學數(shù)據(jù)實際建設(shè)情況分析可以看出,國家層面的統(tǒng)籌規(guī)劃與政策引導建設(shè)起到了十分火鍵的作用。現(xiàn)階段,盡管科學數(shù)據(jù)已經(jīng)從支撐科技活動的基礎(chǔ)資源提升為支撐國家科技創(chuàng)新發(fā)展的寶貴資產(chǎn)和戰(zhàn)略資源,但在具體的建設(shè)實踐中仍然存在一些不足,如整體部署與規(guī)劃不完善而造成的條塊分割和重復建設(shè),如我國國家層面兩大科學數(shù)據(jù)共享體系(科技部的“科學數(shù)據(jù)共享工程”和中科院的“中國科學院科學數(shù)據(jù)”)之間的統(tǒng)一協(xié)調(diào)與分工合作問題;地方性、區(qū)域性大量基礎(chǔ)科學數(shù)據(jù)還未能有效納入國家統(tǒng)一的標準化、系統(tǒng)化管理,因而未能得到全面共享和有效的開發(fā)利用;對于科學數(shù)據(jù)可持續(xù)發(fā)展保障機制方面的研究與實踐不足,導致某些學科領(lǐng)域和某些區(qū)域的科學數(shù)據(jù)研究與建設(shè)投入不足或投入產(chǎn)出成效不理想等問題。
5.2 未來重點關(guān)注方向
鑒于科研需求、技術(shù)水平與國家層面總體規(guī)劃等宏觀因素對科學數(shù)據(jù)研究與建設(shè)的重要影響和推動作用,結(jié)合前述文獻研究和建設(shè)實踐兩個不同視角的分析結(jié)果,以美、英等發(fā)達國家在科學數(shù)據(jù)管理與應(yīng)用方面的研究與建設(shè)經(jīng)驗為參照,從三個層面人手,提出我國未來科學數(shù)據(jù)研究進展的重點關(guān)注方向:
關(guān)注科研需求,探討怎樣以更加科學的方式服務(wù)科研活動、工程活動甚至各種社會活動,盡最大可能發(fā)揮科學數(shù)據(jù)的科研價值、經(jīng)濟價值和社會價值,如:科學數(shù)據(jù)在各個學科領(lǐng)域的科學研究中的應(yīng)用與開發(fā);科學數(shù)據(jù)在教育、經(jīng)濟、環(huán)境和社會領(lǐng)域的應(yīng)用與服務(wù);科學數(shù)據(jù)在科學決策中的開發(fā)利用等。
關(guān)注世界先進技術(shù)的發(fā)展態(tài)勢,充分利用最新的網(wǎng)絡(luò)技術(shù)、信息技術(shù)進行科學數(shù)據(jù)的管理、開發(fā)和利用,如:e-Science環(huán)境建設(shè)與網(wǎng)格技術(shù);數(shù)據(jù)挖掘、集成、分析與可視化工具與技術(shù);互操作技術(shù);元數(shù)據(jù)、語義網(wǎng)和本體等知識組織技術(shù);分布式數(shù)據(jù)處理和應(yīng)用的理論、模型和方法等。
關(guān)注宏觀層面的戰(zhàn)略規(guī)劃,探討科學數(shù)據(jù)發(fā)展的長期、有效、可持續(xù)的發(fā)展機制,如:可持續(xù)發(fā)展的數(shù)據(jù)源、數(shù)據(jù)標準和數(shù)據(jù)模型;可持續(xù)發(fā)展的科學數(shù)據(jù)管理、運作、監(jiān)督與評價機制;未來的數(shù)據(jù)共享中心的角色和運作及其創(chuàng)新數(shù)據(jù)服務(wù)模式;國家級超大規(guī)模科學數(shù)據(jù)倉庫及其數(shù)據(jù)服務(wù)能力建設(shè);作為發(fā)展中國家加入全球科學數(shù)據(jù)共享以及國際間科學數(shù)據(jù)協(xié)作的探索等。
說明:對科學數(shù)據(jù)研究來說,除文獻成果之外,還有更為重要的數(shù)據(jù)實體、應(yīng)用架構(gòu)、規(guī)范與標準體系等建設(shè)成果,本文在選用CNKI相關(guān)文獻作為研究對象的進行文獻分析的同時,參看了國內(nèi)部分科學數(shù)據(jù)共享體系的建設(shè)成果,結(jié)合國內(nèi)科學數(shù)據(jù)庫建設(shè)實際進展狀況進行對比分析,以求與文獻分析結(jié)果相互印證。
相關(guān)熱詞搜索:研究進展 科學 分析 國內(nèi)科學數(shù)據(jù)相關(guān)研究進展分析 大數(shù)據(jù)分析是科學研究的 大數(shù)據(jù)分析是科學研究的第幾范式
熱點文章閱讀