近日,國家數據局發(fā)布《關于加強數據科技創(chuàng)新的實施意見》(以下簡稱《實施意見》),對數據科技的技術攻關和高水平應用等提出了具體的要求?!秾嵤┮庖姟访鞔_定義,數據科技是以發(fā)揮數據疊加倍增作用、釋放數據要素價值為目標,系統性構建的數據科學、技術與工程體系。
從這個定義可以看出,數據科技是一個具有鮮明中國特色的新科技概念。其特色主要體現在三個方面:一是體現在目標導向上。數據科技旨在推動數據在社會經濟發(fā)展中的深度融合與應用,充分釋放數據作為新型生產要素的價值,服務于國家數字經濟發(fā)展與數字化轉型的戰(zhàn)略需求;二是體現在體系架構上。數據科技并非單一技術,而是涵蓋數據供給、流通、利用和安全等關鍵環(huán)節(jié)的技術體系。這種面向應用場景的分類方式,更有助于理解數據科技對數據產業(yè)全鏈條的支撐作用;三是體現在發(fā)展需求上。數據科技與現有大數據技術密切相關,同時又對其提出了新的系統性要求。為適應數據要素市場化配置與價值釋放的需要,迫切需要對現有大數據技術體系進行重構與升級。
國家數據局成立以來,通過一系列政策文件與實際行動,有力推動了數據要素市場的培育與發(fā)展。然而,數據資源要真正轉化為現實生產力,除了制度保障之外,也離不開數據科技的有力支撐。相關文件的出臺與數據科技的進步,必將對我國數據要素市場建設與數字中國進程產生深遠影響。
厘清數據科技發(fā)展的底層技術邏輯
數據科技是面向數據要素價值化這一目的而構建的數據供給、流通、利用和安全等技術,除了少數特定技術外,其多數技術能力根植于大數據、人工智能、信息安全等基礎信息技術之中。
具體可從數據價值實現過程來理解二者的關系: 一是讓數據“供得出”,核心在于數據匯聚與集成。需要破解數據孤島問題,從各類異構信息系統中低成本、高可靠地提取、重組與匯聚數據,并實現數據的長期保存與就緒可用。數據需要在支持業(yè)務功能實現的同時,在源頭就實現數據要素化;二是讓數據“流得動”,核心在于跨域數據管理與協同。為促進數據在不同主體間的安全有序流動,需對數據流通過程進行訪問控制、全程留痕、可信審計,并支持跨域的數據查詢、處理分析,這對數據管理、處理和治理技術都提出了更高要求;三是讓數據“用得好”,核心在于多模態(tài)大數據分析與大模型訓練。當前數據分析技術已形成從傳統關聯分析、機器學習到深度學習、神經網絡乃至大模型驅動的廣譜分析體系,正朝著更深度的語義理解與更精準的決策支持演進。大模型訓練需要大量的高質量的數據集,這也是使用數據的重要形態(tài);四是讓數據“保安全”,核心在于數據治理與安全合規(guī)。這涉及數據全生命周期的權限控制、加密保護、隱私計算、合規(guī)審計等技術。與傳統的信息安全技術側重點有所不同,必須從支撐數據流通與價值釋放的視角,體系化構建兼顧安全與利用的數據流通安全治理方案。
由此可見,數據科技與基礎信息技術,尤其是大數據技術和信息安全技術,緊密相關且深度融合。數據科技的進步,在很大程度上依賴于大數據等相關基礎技術的持續(xù)突破與適配演進。
構建數據科技發(fā)展的“以數據為中心”大數據技術體系
《實施意見》在總體要求中明確了數據科技關鍵技術的發(fā)展目標,到2027年要在數據供給、流通、利用和安全等關鍵技術和設備實現階段性突破,到2030年數據領域關鍵技術達到國際領先水平。這一目標艱巨而光榮,是我國數據科技工作者的歷史使命與發(fā)展機遇。為了實現這一目標,《實施意見》從基礎研究、技術攻關、概念驗證、成果轉化等技術發(fā)展的全鏈條進行了系統部署。
一是要加強基礎研究和應用基礎研究。數據要素化要求我們應該從數字孿生視角去看待數據的組織模式,以物理世界和人類社會的“對象”為核心進行組織與匯聚。傳統信息系統以業(yè)務流程為中心組織數據,優(yōu)化目標是提高系統的處理效率;未來則應推動數據與應用系統解耦,以數據價值釋放為最終優(yōu)化目標,構建獨立于具體應用系統的數據資源體系。數據的價值來源于數據的“流動”,沒有數據之間的匯聚、融合、分析,就不可能產生新的價值。數據的價值如何度量?數據流動的背后的規(guī)律是什么?需要什么樣的數據流通基礎設施?這些問題都值得深入去研究。國家數據局聯合國家自然科學基金委員會曾發(fā)布數據要素專題項目來支持數據科技的基礎研究,相信未來還會有更多的基礎研究類項目支持數據科技領域的前沿問題研究。
二是要加強關鍵數據技術的攻關突破。用“以數據為中心”的學術思想,重構大數據技術體系,是攻關突破的方向。以數據為中心就是要以數據的高效可信的供給、流通和利用為中心,“跨域”是其中最為核心的挑戰(zhàn)與主戰(zhàn)場。這里的“跨域”具有多重含義,至少包括跨空間域、跨管轄域、跨信任域等,根源在于數據需要在不同主體間高效地共享流動,還要構建可信的環(huán)境,保障數據的權屬和數據的安全。因此,未來大數據技術(管理、處理、分析、治理)必須將“跨域協同能力”作為設計的核心考量。當然,“以數據為中心”的內涵還需要我們在數據科技的持續(xù)技術攻關中不斷深化。國家數據局之前曾對數據流通基礎設施提出了多種可能的解決方案,包括可信數據空間、數聯網等,數據科技的關鍵技術攻關需要針對這些數據流通基礎設施形成可行的大數據技術的集成方案。
三是以場景推動數據技術的落地,形成新質生產力。國際領先水平需要體現在對新興產業(yè)的支撐上,體現在賦能社會經濟高質量發(fā)展里,體現在大國博弈的科技自立自強中?!秾嵤┮庖姟穼萍汲晒D化進行了全鏈條布局,明確提出了要布局建設一批數據領域的概念驗證、中試基地、檢驗檢測等平臺,通過“高價值、廣覆蓋、強牽引”的數據科技應用場景,為技術驗證提供“試驗田”。這正是我們科技創(chuàng)新的舉國體制的優(yōu)勢所在。
國家數據局印發(fā)《實施意見》,明確提出加強數據科技創(chuàng)新,將極大地推動“十五五”時期我國數據事業(yè)的發(fā)展。我們應牢牢把握這一機遇,推動“以數據為中心”的大數據技術體系重構,力爭在由中國引領的數據科技發(fā)展道路上取得突破、發(fā)揮關鍵作用。(作者杜小勇系中國人民大學教授)
(人民網記者許維娜 整理)
【相關閱讀】
之一:強化數據科技創(chuàng)新 促進數據要素價值釋放
之二:數據要素化時代的數據科技創(chuàng)新