縱觀科學(xué)的發(fā)展,無論是四百年前開普勒行星運(yùn)動(dòng)定律的提出,還是當(dāng)今新粒子的發(fā)現(xiàn)、新醫(yī)藥的研制、數(shù)字地球的發(fā)展,等等,無不依賴于對實(shí)驗(yàn)、觀測、調(diào)查、測量、模擬等所產(chǎn)生的原始數(shù)據(jù)及有關(guān)派生數(shù)據(jù)的分析和利用。正因?yàn)槿绱耍畔⒓夹g(shù)一直以來的發(fā)展都以提高人類采集、傳輸、存儲(chǔ)、管理與分析數(shù)據(jù)和信息的能力作為一項(xiàng)核心目標(biāo)。在本世紀(jì),上述能力的提高所導(dǎo)致的數(shù)據(jù)爆炸越來越顯著,科學(xué)研究也日益表現(xiàn)出數(shù)據(jù)密集型和以數(shù)據(jù)為中心的特征,推動(dòng)科學(xué)研究進(jìn)入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)作為知識經(jīng)濟(jì)時(shí)代的戰(zhàn)略高地,是國家和全球的新型戰(zhàn)略資源。圍繞大數(shù)據(jù)引起的競爭不僅將決定國際信息產(chǎn)業(yè)格局,還將深刻影響經(jīng)濟(jì)發(fā)展、國家安全、科技進(jìn)步和綜合競爭力[1]。
數(shù)據(jù)成為檢驗(yàn)科學(xué)研究價(jià)值的試金石。一方面,許多學(xué)科領(lǐng)域的科學(xué)發(fā)現(xiàn)以數(shù)據(jù)為基礎(chǔ),以新的數(shù)據(jù)發(fā)現(xiàn)為目標(biāo),輔以挖掘工具與分析手段,將數(shù)據(jù)與重要發(fā)現(xiàn)融合。另一方面,數(shù)據(jù)成為重復(fù)科學(xué)試驗(yàn)、確保研究成果真實(shí)可靠的檢驗(yàn)基礎(chǔ)。這一全新階段在生命科學(xué)、高能物理、數(shù)字地球、全球變化、深空探測等領(lǐng)域的積極實(shí)踐,無不彰顯大數(shù)據(jù)與大科學(xué)緊密相連、密不可分的時(shí)代特色。科學(xué)數(shù)據(jù)走出深閨,成為科學(xué)研究的亮點(diǎn)和法寶,使推動(dòng)產(chǎn)生新的科學(xué)發(fā)現(xiàn)成為可能。科學(xué)大數(shù)據(jù)作為大數(shù)據(jù)的分支體系,已成為繼實(shí)驗(yàn)、理論和計(jì)算模式之后的數(shù)據(jù)密集型科學(xué)范式的典型代表,正在從模型驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)模式進(jìn)行轉(zhuǎn)化,帶來了科研方法論的創(chuàng)新[2]。科學(xué)大數(shù)據(jù)已經(jīng)并將繼續(xù)在上述大科學(xué)領(lǐng)域中發(fā)揮重要作用,未來必將在大科學(xué)領(lǐng)域?yàn)榭茖W(xué)發(fā)現(xiàn)做出更加重大的貢獻(xiàn)[3]。