尊龙凯时人生就是搏

专家解读丨筑牢高质量数据集底座,赋能人为智能创新发展

2026-06-29

文丨国度数据发展钻研院院长 胡坚波

当前,人为智能在加快从“可用”向“好用”迈进。高质量数据集作为大模型训练与利用的基石,供给规模与质量直接决定人为智能创新高杜纂产业落地深度。近日,国度数据集治理服务系统正式颁布并启动试运行,标志取我国高质量数据集建设进入集约化治理新阶段,为人为智能加快发展注入了强劲动能。


尊龙凯时人生就是搏(中国区)官方网站

一、国度数据集治理服务系统的沉要意思

(一)系统建设是落实国度沉大战术部署的关键行动。习近平总书记强调,“数据是新的出产身分,是基础性资源和战术性资源,也是沉要出产力”。“十五五”规划纲领将“建设高质量数据集”列为数字中国建设沉点工作,明确面向能源、交通、造作、教育、健康、金融等领域建设高质量数据集。国度数据局在“531”工作系统中,凸起数据赋能人为智能创新发展这“1”项沉点工作,先后部署140项先行先试工作,推广104个典型案例,确定72家链主单元,全面发展强基扩容、标注攻坚、提质增效等六大专项行动。国度数据集治理服务系统的上线,为有关顶层设计和工作部署提供了平台载体和技术底座。

(二)系统建设是破解高质量数据集建设瓶颈的沉要伎俩。在国度数据局两全推动下,我国高质量数据集建设获得显著功效。截至2026年第一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB,日均Token挪用量突破140万亿。然而,急剧发展的背后仍存在一些结构性问题。一是建设主体分散,数据治理部门难以实时、全面把握资源底数与建设进展。二是供给侧信息不合称,容易导致统一领域沉复建设、质量参差不齐。三是需要侧获取成本高、周期长,迟滞了数据驱动技术创新的过程。只有构建全国统一的数据集治理服务系统,能力从底子上破解“数据找不着、质量没保险、供需难对接”的瓶颈。

(三)系统建设是抢占全球人为智能竞争造高点的有力支持。从全球领域看,重要经济体将高质量数据集建设提升至国度战术高度。美国启动“创世纪工作”,通过整合联国当局横跨能源、交通、医疗等领域的海量公共数据资源,构建面向人为智能训练的高质量数据底座,以坚韧其在基础模型领域确当吓着势D芄凰,高质量数据集已成为大国科技博弈的战术造高点,其建设水平直接关乎一国在全球人为智能产业链中的话语权和竞争力。加快构建自主可控的高质量数据集治理与服务系统,对于我国人为智能从“并跑”迈向“领跑”拥有沉大意思。只有通过设施化、集约化建设,推动优质数据资源高效汇聚、安全流通和宽泛利用,能力夯实人为智能发展的数据底座,确保我国在全球科技竞争中赢得自动、抢占先机。

二、国度数据集治理服务系统的定位和能力

(一)安身国度级公共服务设施定位。系统选取“物理分散、逻辑集钟妆的汇聚模式,在不强造数据出域的前提下,构建全国统一的数据集资源目录与治理系统,两全持有者的合法权利和资源的有效配置,推动高质量数据集“供得出、流得动、用得好”,实现全国“底数一本账、调度一盘棋、合作一张网”的工作格局。系统着力打造三个“枢纽”:一是全国高质量数据集的有效治理枢纽,实现全域资源可管、可查、可监测 ;二是数据集供需双方的高效对接枢纽,降低买卖成本、提升匹配效能 ;三是数据集建设的生态服务枢纽,推进产业繁华发展。

(二)精准赋能三类主题用户。系统重要服务于数据治理部门、数据集供给方和数据集需要方三类用户。一是向数据治理部门全面展示全国数据集的建设进展和散布情况,便于把握工作动态、明确问题短板、优化政策方向。二是向数据集供给方提供数据集建设全流程服务,引发建设动力,加强建设能力,提升数据质量。三是向数据集需要方提供数据集流通利用支持服务,急剧定位合规优质的数据集,缩短获取周期、降低用数成本。除此之表,系统作为国度级数据基础设施,可能有效阐扬资源汇聚的优势,赋能处所当局、产业园区等主体,打造线上产业生态荟萃区。

(三)构建完整的职能系统。系统构建了“治理+服务”的齐全职能架构。治理职能聚焦可管可查,蕴含数据集治理与建设情况治理两大?。前者实现全国数据集目录统一汇聚,展示资源散布情况 ;后者统计采集、加工、利用等全流程建设进展,支持科学决策。服务职能聚焦好用易用,分为基础服务与拓展服务 ;》务蕴含供需颁布、质量测评、查问检索等,满足普惠需要 ;拓展服务蕴含工具链、数据集利用等,赋能高水平创新主体。同时,系统选取数据加密、区块链存证、敏感信息自动检测、合规审核等伎俩,成立基础防护、自动防御、容灾备份三位一体的安整个系,确保治理服务全流程安全靠得住。

三、充分阐扬国度数据集治理服务系统的底座支持作用

以系统试运行为起点,国度数据发展钻研院将在国度数据局领导下,加快建设我国高质量数据集领域的权威平台,充分阐扬系统对高质量数据集建设工作的推进作用,为人为智能国度战术提供坚实的数据支持。

(一)美满系统职能,构建全性命周期治理服务系统。依照整体规划,系统分三期建设。目前一期已如期上线,实现供需颁布、全域检索、凭证申领等基础职能。在试运行过程中,将成立用户反馈和迭代升级机造,不休美满现有职能,优化使用履历。后续,将持续推动二期和三期建设工作,增长数据集建设进展监测、数据集图谱等治理职能,拓展权利激励、工具链、模型利用、定价评估等服务,对接国度公共数据资源登记、数据产权登记等有关平台以及处所和行业有关系统,形成国度级系统牵引、处所和行业协同的一体化格局。

(二)扩大用户领域,激活数据集产业生态。宽泛带头各类主体使用系统,提升用户数量和活跃度。推动高质量数据集“链主”、先行先试等沉点单元的建设成就“应发尽发”,激励科研机构、行业龙头企业、数据服务商颁布自主建设的高质量数据集,形成覆盖多模态、多领域、多行业的资源汇聚格局。索求成立贡献评价、积分治理等权利激励机造,引发各类主体颁布数据集的动力。聚焦沉点领域建设行业专区,发展特色服务,打造权威的高质量数据集线上生态圈。健全安全合规机造,为数据集规 ;锰峁┯辛Φ陌踩С。

(三)阐扬枢纽作用,推进人为智能创新发展。以系统为纽带,推动高质量数据集从“可查可找”向“可用好用”深入。依附供需对接与质量评测职能,打造一批AI-Ready的高质量数据集,为模型训练与利用提供尺度化、可验证的数据集产品。推动系统与数据买卖所等机构系统对接,支持系统上颁布、评测和获得标识凭证的数据集在合规前提下挂牌、上架和买卖,买通从建设、颁布到流通、利用的全链条。聚焦多模态、思想链、具身智能等数据集热点需要,通过系统疏导有关主体扩大供给,阐扬市场“调节器”的作用,加快数据身分赋能人为智能创新发展。

起源:国度数据局

上一篇:

下一篇:

返回
目录
【网站地图】