數(shù)據(jù)要素作為數(shù)字經(jīng)濟時代的核心要素,在提高生產(chǎn)要素的配置效率、推動生產(chǎn)要素創(chuàng)新性配置方面發(fā)揮著重要作用。目前,高質(zhì)量中文數(shù)據(jù)庫稀缺,高質(zhì)量數(shù)據(jù)清洗成本高,高質(zhì)量訓(xùn)練數(shù)據(jù)集匱乏。同時,數(shù)據(jù)標準不統(tǒng)一,數(shù)據(jù)交易規(guī)則不一致,降低了數(shù)據(jù)要素交易活躍度,數(shù)據(jù)共享不充分,催生“數(shù)據(jù)孤島”,制約了高質(zhì)量數(shù)據(jù)生成和供給。高質(zhì)量數(shù)據(jù)要素的迫切需要與不平衡不充分的數(shù)據(jù)要素供給之間的矛盾日益突出。高質(zhì)量數(shù)據(jù)要素供給體系的構(gòu)建,核心在于激活高質(zhì)量數(shù)據(jù)要素源頭,關(guān)鍵在于暢通高質(zhì)量數(shù)據(jù)要素流通渠道,著力點在于發(fā)揮數(shù)據(jù)標注領(lǐng)軍企業(yè)的標桿作用,激發(fā)市場活力。
歸集高質(zhì)量訓(xùn)練數(shù)據(jù)集,打造高質(zhì)量中文語料數(shù)據(jù)庫。一是政企牽引,擴大高質(zhì)量數(shù)據(jù)要素源頭。發(fā)揮政府機關(guān)、科研院所、企事業(yè)單位豐富的數(shù)據(jù)資源優(yōu)勢,支持各類經(jīng)營主體通過數(shù)據(jù)流通交易平臺提供高質(zhì)量數(shù)據(jù)集。二是平臺賦能,建立高質(zhì)量數(shù)據(jù)配套服務(wù)機構(gòu)。搭建高質(zhì)量的文字、圖片、音頻、視頻等多模態(tài)大模型預(yù)訓(xùn)練語料庫,支持在依法設(shè)立的數(shù)據(jù)交易機構(gòu)開展數(shù)據(jù)流通、交易融合應(yīng)用,探索建設(shè)行業(yè)性高質(zhì)量數(shù)據(jù)交易配套服務(wù)平臺。三是基地支撐,打造高質(zhì)量數(shù)據(jù)產(chǎn)業(yè)集群。鼓勵開展大模型研發(fā)、訓(xùn)練和應(yīng)用,重點支持在通用大模型的基礎(chǔ)上開發(fā)適用于垂直行業(yè)的專用大模型,優(yōu)先提供高質(zhì)量數(shù)據(jù)集推廣示范、低成本算力保障等綜合支持。建立人工智能產(chǎn)業(yè)數(shù)據(jù)資源清單,建設(shè)“產(chǎn)業(yè)數(shù)鏈”,打造以數(shù)據(jù)為核心的虛擬產(chǎn)業(yè)集群。四是人才驅(qū)動,創(chuàng)建新型高質(zhì)量數(shù)據(jù)行業(yè)隊伍。推動數(shù)據(jù)與行業(yè)知識深度融合,開發(fā)數(shù)據(jù)產(chǎn)品,滿足算法設(shè)計、模型訓(xùn)練、產(chǎn)品驗證、場景應(yīng)用等需求,逐步建立和完善復(fù)合型數(shù)字經(jīng)濟人才隊伍。積極培育大數(shù)據(jù)企業(yè),完善大數(shù)據(jù)產(chǎn)業(yè)服務(wù)支撐體系,夯實數(shù)據(jù)要素市場產(chǎn)業(yè)基礎(chǔ),催生創(chuàng)造數(shù)據(jù)標注師、分析師、數(shù)據(jù)資產(chǎn)評估師等一批新型職業(yè)崗位。
加強公共數(shù)據(jù)高質(zhì)量供給,推動公共數(shù)據(jù)定向開放。一是加大公共數(shù)據(jù)開放共享力度,推動公共數(shù)據(jù)和社會數(shù)據(jù)定向有條件開放和及時更新。二是優(yōu)化公共數(shù)據(jù)開放目錄,進一步完善數(shù)據(jù)治理和審核機制。三是健全公共數(shù)據(jù)開放評價體系,持續(xù)開展公共數(shù)據(jù)開放水平動態(tài)評估,對出現(xiàn)異常的指標及時回溯分析,以評促改推動公共數(shù)據(jù)質(zhì)量提高。四是強化公共數(shù)據(jù)治理能力,加強公共數(shù)據(jù)全生命周期管理,充分利用政務(wù)信息化項目管理抓手,將數(shù)據(jù)治理要求貫穿項目管理始終。五是完善數(shù)據(jù)基礎(chǔ)體系,以監(jiān)管促進各級各部門提升公共數(shù)據(jù)開放的種類、數(shù)量和質(zhì)量。
培育數(shù)據(jù)標注領(lǐng)軍企業(yè),構(gòu)建數(shù)據(jù)產(chǎn)業(yè)服務(wù)生態(tài)。一是建設(shè)數(shù)據(jù)精細化標注平臺,開發(fā)智能云數(shù)據(jù)管理服務(wù)系統(tǒng),研究平臺和服務(wù)系統(tǒng)激勵機制,鼓勵企業(yè)研究互聯(lián)網(wǎng)數(shù)據(jù)全量實時更新技術(shù)、多源異構(gòu)數(shù)據(jù)整合和分類方法,研發(fā)數(shù)據(jù)清洗、標注、分類、注釋和內(nèi)容審查等算法及工具。二是培育本土數(shù)據(jù)標注領(lǐng)軍企業(yè),積極探索建立一批數(shù)據(jù)標注產(chǎn)業(yè)基地、園區(qū),推動數(shù)據(jù)的采、存、洗、標、訓(xùn)等業(yè)務(wù)全面發(fā)展。三是制定數(shù)據(jù)標注行業(yè)發(fā)展規(guī)劃,逐步完善數(shù)據(jù)采集標注行業(yè)的規(guī)范和標準,建立智能語音、計算機視覺、自然語言處理、數(shù)據(jù)集交換共享、數(shù)據(jù)集安全隱私等方面的行業(yè)應(yīng)用標準,形成數(shù)據(jù)標注行業(yè)的標準化體系,推動基礎(chǔ)數(shù)據(jù)服務(wù)產(chǎn)業(yè)健康有序發(fā)展。
培育數(shù)據(jù)交易市場生態(tài),盤活高質(zhì)量數(shù)據(jù)資產(chǎn)池。一是打造數(shù)據(jù)要素市場和市場化配置改革先行區(qū)。加強政策支持和引導(dǎo),明確試點目標和定位。建立跨部門協(xié)調(diào)機制,推動數(shù)據(jù)共享和流通。二是暢通數(shù)據(jù)交易渠道。鼓勵各類經(jīng)營主體通過數(shù)據(jù)交易場所開展數(shù)據(jù)交易活動,推動區(qū)域性、行業(yè)性數(shù)據(jù)流通,鼓勵公共數(shù)據(jù)加工形成的數(shù)據(jù)產(chǎn)品和服務(wù)進場交易。三是探索多樣化數(shù)據(jù)定價模式。推動用于數(shù)字化發(fā)展的公共數(shù)據(jù)按政府指導(dǎo)定價有償使用,鼓勵企業(yè)與個人信息數(shù)據(jù)由市場自主定價,促進數(shù)據(jù)要素價格形成。四是拓寬行業(yè)數(shù)據(jù)空間。支持各行業(yè)主管部門引導(dǎo)本行業(yè)龍頭企業(yè)、數(shù)據(jù)經(jīng)紀人打造行業(yè)數(shù)據(jù)空間,對符合條件的數(shù)據(jù)產(chǎn)業(yè)給予相應(yīng)的補貼或稅收優(yōu)惠,在智能制造、節(jié)能降碳、綠色建造、新能源、智慧城市等重點領(lǐng)域,大力培育貼近業(yè)務(wù)需求的行業(yè)性、產(chǎn)業(yè)化數(shù)據(jù)商,助力廣東打造數(shù)字經(jīng)濟創(chuàng)新引領(lǐng)型城市。
作者曾慶鐸、趙超,單位分別系廣東工業(yè)大學(xué)經(jīng)濟學(xué)院和中共廣東省委黨校校刊編輯部
本文系國家社會科學(xué)基金課題(23BJL114)、黨的二十大精神研究專項課題(2022ZXYB07)階段性成果