• <u id="qkpp5"></u>

    1. <p id="qkpp5"><nav id="qkpp5"><option id="qkpp5"></option></nav></p>
      <p id="qkpp5"><var id="qkpp5"></var></p>
    2. 玖玖av,国产成人精品777777,日韩无,成人亚洲精品一区二区三区嫩花,人妻2,好吊AV,内射网站,国产九九在线视频
      正在閱讀:專家解讀 | 夯實高質量數據集底座:完善數據資源體系,助力“人工智能 ”創新發展

      專家解讀 | 夯實高質量數據集底座:完善數據資源體系,助力“人工智能 ”創新發展

      2025-08-25 15:23:53來源:“國家數據局”微信公眾號 關鍵詞:數據采集標準數據治理技術閱讀量:21754

      導讀:隨著應用實踐的深入,大規模低質量的數據集局限性逐步顯現,“高質量”數據集成為影響大模型“智商”的核心因素,數據清洗、標注等工作受到重視。
        隨著大模型和人工智能技術快速演進,人工智能產業范式從“以模型為中心”轉向“以數據為中心”,高質量數據集成為人工智能能力提升和“人工智能+”場景落地的關鍵支撐。
       
        早期,業界普遍認為“數據越多越好”,數據集的概念主要圍繞數據的“大規模”特征,認為通過海量數據就可以訓練出更好的模型。隨著應用實踐的深入,大規模低質量的數據集局限性逐步顯現,“高質量”數據集成為影響大模型“智商”的核心因素,數據清洗、標注等工作受到重視。伴隨著人工智能在工業制造、醫療健康、教育教學等領域的應用落地,通用高質量數據集難以滿足細分場景訓練需求,高應用價值、高知識密度和高技術含量的行業高質量數據集供給日趨關鍵。今年5月,國家數據局印發《數字中國建設2025年行動方案》,明確提出“加強交通、醫療、金融、制造、農業等重點領域數據標注,建設行業高質量數據集”,為相關工作指明了方向。
       
        但在實際工作中,我們仍面臨著諸多挑戰,制約了行業高質量數據集的高效建設與應用。
       
        一是數據采集標準與轉化機制有待進一步完善。各級公共數據平臺歸集整合能力不斷加強,企業數字化轉型持續加速,但受數據標準不一、采集誤差等影響,數據存在分布偏差、顆粒度不一、采集缺失等狀況,導致大量數據沉淀且難以直接使用。同時,為更好支持數據資源向可供人工智能大模型使用的高質量數據集轉化,還需進一步完善面向應用端的數據治理、標注、評估和開發利用機制。
       
        二是數據治理技術融合創新有待提升。行業高質量數據集是數據資源和專業知識的融合產物,現階段行業專識數據集主要依賴人工標注,亟需智能化、自動化標注工具以及精準的數據合成技術支持,以提升數據集生產效率,滿足專業場景對數據集“規模”“質量”“附加知識”的多重需求。
       
        三是高質量數據集專項支持政策有待完善。高知識密度、高應用價值的數據集開發周期長、成本高、復用率低,數據價值轉化路徑不清,市場回報機制不明,缺乏專門針對行業專識數據集的投資或補貼政策。同時,高質量數據集價值實現面臨流通慢、責任界定不清等問題,影響供需雙方的積極性和規模化交易,需要進一步構建涵蓋高質量數據集建設、流通交易、創新應用、運營收益的政策體系。
       
        為應對上述挑戰,需要多方協同發力,推動形成涵蓋資源匯聚、流通、應用以及技術創新、制度建設的高質量數據集建設體系,有力支撐人工智能應用創新發展。
       
        一是暢通高質量數據集流通交易渠道。將高質量公共數據集納入公共數據管理,實現集中管理、高效調用、智能應用,提升在政府部門間的整體利用效能。進一步完善供給渠道,打造高質量數據集流通交易體系,一方面依托公共數據開放平臺,打造高質量數據集開放專題,持續保障面向企業和社會公眾的高質量數據集普惠供給;另一方面鼓勵公共數據專區運營單位,結合本領域市場需求,定向開展高質量數據集融合建設,提升高質量數據集市場化供給能力。同時,支持相關開源平臺等規范化、規模化運營,探索高質量數據集開源機制。支持數據交易機構加快構建人工智能行業高質量數據集供需對接能力,進一步整合外部資源力量,引入數據集清洗、標注、合成、質檢等領域生態合作伙伴,形成高質量數據集開發治理、供需對接、評估定價等服務能力。
       
        二是加大高質量數據集相關技術攻關力度。聚焦關鍵環節突破,加大科技研發投入,鼓勵相關市場主體打造智能化、自動化的行業高質量數據集標注工具,強化人機協同能力,提升標注效率與精準度。組織攻關多源異構數據融合技術,建立統一跨行業數據格式標準,破解“數據孤島”難題。推動數據合成等技術迭代,探索模擬稀缺高質量數據集的有效路徑,通過技術創新夯實數據集建設根基。
       
        三是健全數據集建設保障制度。發揮數據標準化技術委員會作用,推動高質量數據集格式、質量、流通有關標準建設。探索原創數據集確權、價值評估、流通交易、收益分配等機制建設,培育可持續供給生態。鼓勵各類社會主體共建數據要素創新安全可信環境,充分利用“數據要素×”競賽活動等渠道,加強對高質量數據集評估測試和應用落地的全面支撐。
       
        文 | 北京市人民政府副秘書長  北京市政務服務和數據管理局黨組書記、局長 沈彬華
      我要評論
      文明上網,理性發言。(您還可以輸入200個字符)

      所有評論僅代表網友意見,與本站立場無關。

      版權與免責聲明:

      凡本站注明“來源:智能制造網”的所有作品,均為浙江興旺寶明通網絡有限公司-智能制造網合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智能制造網”。違反上述聲明者,本站將追究其相關法律責任。

      本站轉載并注明自其它來源(非智能制造網)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:智能制造網”,本站將依法追究責任。

      鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-89719789;郵箱:1271141964@qq.com。

      不想錯過行業資訊?

      訂閱 智能制造網APP

      一鍵篩選來訂閱

      信息更豐富

      推薦產品/PRODUCT 更多
      智造商城:

      PLC工控機嵌入式系統工業以太網工業軟件金屬加工機械包裝機械工程機械倉儲物流環保設備化工設備分析儀器工業機器人3D打印設備生物識別傳感器電機電線電纜輸配電設備電子元器件更多

      我要投稿
      • 投稿請發送郵件至:(郵件標題請備注“投稿”)1271141964.qq.com
      • 聯系電話0571-89719789
      工業4.0時代智能制造領域“互聯網+”服務平臺
      智能制造網APP

      功能豐富 實時交流

      智能制造網小程序

      訂閱獲取更多服務

      微信公眾號

      關注我們

      抖音

      智能制造網

      抖音號:gkzhan

      打開抖音 搜索頁掃一掃

      視頻號

      智能制造網

      公眾號:智能制造網

      打開微信掃碼關注視頻號

      快手

      智能制造網

      快手ID:gkzhan2006

      打開快手 掃一掃關注
      意見反饋
      我要投稿
      我知道了