2024年5月24日,全国数据资源调查工作组(国家工业信息安全发展研究中心)在“数字中国”峰会上发布了《全国数据资源调查报告》。报告中的4组数据揭示了我国数字经济发展过程中的的4大市场机会。
市场机会1——数据生产量达32ZB,表明我国数据要素市场总体规模庞大
2023年我国数据生产量32.85ZB,相当于1200多万个国家图书馆,数据资源规模总量位居世界前列。近年来,我国信息化、数字化进程明显加快,各种数据采集终端和智能传感装置在各行各业普及应用。一是我国智慧城市建设产生的数据超过世界其他国家数据总和。我国智慧城市建设开展时间长、覆盖城市多、数据智能采集设备布设多,每时每刻都在生产海量的城市道路交通、政府公共服务、个人衣食住行等方面的大量数据;二是我国规模庞大的互联网用户产生了海量的数据资源。我国是全球互联网应用普及程度最高的国家,截止2023年底,上网人数达10.92亿人,全国移动电话用户总数达17.27亿户,其中5G移动电话用户达8.05亿户,约占全球的五分之四。庞大的互联网和移动互联网用户群体成为我国海量数据的主要来源之一;三是我国智能制造规模和水平都位于世界前列。截至2023年底,5G、千兆光纤网已融入71个国民经济的应用中,应用案例已经超过了9.4万个。关键工序数控化率、数字化研发设计工具普及率分别达到了62.2%和79.6%。建设5G工厂300家,“5G+工业互联网”建设项目超过8000个,5G已经由生产现场监测、厂区智能物流等外围辅助环节,深入到远程设备操控、设备协同作业等核心控制环节,制造业重点领域数字化水平加快提升。全国具备行业、区域影响力的工业互联网平台超过340个,重点平台工业设备连接数超过9600万台套。智能制造应用规模和水平大幅提升,五成规模以上制造企业进入数字化网络化制造阶段,制造机器人密度跃居全球第五位,智能制造装备产业规模达3万亿元,市场满足率超过50%。作为全球制造第一大国,我国各种智能制造设备、智能采集和传感装置、自动化智能化经营管理系统等,每天都生产出海量的工业数据资源。
市场机会2——数据存储量为1.7ZB,表明我国数据存储产业发展潜力巨大
2023年我国数据存储规模为1.73ZB,其中新增数据存储规模为0.95ZB,占全年数据32ZB生产总量的2.9%,海量数据在源头就放弃。这组数据反映了三个事实:首先,数据产存转化率低是世界各国的普遍现象,这是由数据的易腐性特点所致。有研究表明,60%的非结构化数据在几毫秒内就失去真正价值,超过一半的数据在产生的那一刻就不再有价值,能得到分析处理并产生实际效用的数据非常少,全球90%的数据从未得到分析使用。谷歌广告数据中未经加工的原始数据中,有70%超过90天就会过时。另外,数据的贬值速度取决于数据类型、用途和具体业务场景等。如股票数据对于证券市场从业者具有较高的价值,但对于出海捕鱼从业者价值就很低,但是天气数据对于出海捕鱼从业者价值就很高,而对于证券市场从业者价值则较低。其次,我国对数据的潜在价值认识不够。当前我国还处于数据要素化初级阶段,数据资源在经济发展中的关键要素作用还远未发挥出来,数据资源的价值潜能还远远没有释放出来,社会各界对数据资源的要素作用、潜在价值还认识不清。另一方面,数据长期存而不用不仅需要巨大存储成本,而且还有数据安全隐患,因此,我国许多地区、行业都对数据作出了强制销毁的规定。如我国许多城市都规定道路交通监控数据只保留二至三个月。再次,我国对数据的复用价值认识不足。在实际生产实践工作中,人们只对当前能产生效益的数据进行了存储,而对于那些对自已生产经营价值不大而对其他市场主体价值巨大的数据,并没有专门保存。
因此,我国数据存储产业将成为今后发展重点方向。一方面要大力发展存储产业,大幅度降低数据存储成本。鼓励自主可控的存储技术、存储产品和存储企业发展,通过持续技术创新,不断降低存储成本,让更多市场主体的数据存得起。事实上,我国在存储技术、存储产品和存储企业等方面,无论是在技术水平方面,还是在自主可控方面,都处于国际领先行列,通过大规模数据存储应用,完全有可能极大降低存储成本。另一方面要鼓励有条件的企业和机构加大数据存储量。鼓励行业企业,特别是央国企要主动承担,通过数据分级分类,对一些将来价值潜力大,或对其他领域应用价值大的数据,加大存储力度。
市场机会3——数据使用占比为4成,表明我国数据资源开发利用将得到更快发展
在2023年的全国存储数据总量中,一年未使用的数据占比约为4成,这说明不少数据被存储后不再被读取和复用。事实上,无论是公共数据持有者,还是企业数据持有者,在数据资源开发利用方面,除互联网、金融等个别行业的企业对数据的多要素协同、多场景复用、多数据融合应用的乘数作用有所实践和探索之外,其他行业领域企业只关注数据在自身场景中的应用,而绝大多数市场主体对数据资源的应用还处于空白状态。
因此,应大力推动“数据要素×”三年行动计划实施,利用三年时间在12个行业和领域推出300个数据应用典型场景,向全国推广示范,为全社会各类市场主体在数据资源应用方面打个样,推动创新更多应用场景,大规模扩大数据要素在千行百业中的应用,让更多原先没有存储的数据存起来,让原先大量没有利用的数据用起来,让更多的冷数据热起来。
市场机会4——我国智能算力占比约为30%,表明智能算力将成为今后发展重点
截止到2023年底,全国共有2229个算力中心,算力规模约为230EFLOPS,同比增长约为30%。其中,智能算力占比约为30%。这组数据至少揭示了三个事实:一是我国算力中心数量不是多了而是少了。据有关统计数据,全球算力中心数量已超过15000座,其中,拥有超过5000台服务器的超大规模算力中心有700多座。美国拥有算力中心数量近3000座,占比全球算力中心数量达34%,而超大规模算力中心数量有270多座,全球占比达39%。我国2229座算力中心位居全球第二位,全球占比只有不到15%,而超大规模算力中心只有66座,不到美国的1/4。作为全球第二大经济体,特别是全球首个将数据作为生产要素的国家,现有算力中心在数量上对国民经济和社会发展支撑还需要进一步加强。二是我国算力结构偏低端化。从算力规模上看,目前2023年全球算力总规模达740EFLOPS,美国算力总规模达270EFLOPS,占比36%,我国算力总规模达230EFLOPS,占比31%。而排在第三的日本仅有6%,只有中国的五分之一左右,可见中美是遥遥领先的。从算力结构上看,我国智能算力规模不到70EFIOPS,占算力总规模比约为30%,而美国智能算力规模已超过180EFLOPS,占算力总规模比例超过68%,中美两国在智算中心规模方面差距明显。三是我国算力基础设施竞争力亟待提升。算力是数据要素化发展新阶段的技术支撑和产业基础。当前,我国算力基础设施面临两方面突出问题:第一是算力核心技术受制于人。算力芯片是算力基础设施的核心技术和产品,美国在算力芯片方面对我国采取了严格禁运措施,而英伟达宣布CUDA生态闭源,直接导致我国一批新兴起的GPGPU厂商无法经营。第二是算力分布极不均衡。我国大多数智算中心位于贵州、内蒙等西部地区,而大量需求量最大的实时性算力需求都在东部经济发达地区。在目前算力调度和算力传输仍有瓶颈的情况下,一方面西部地区的算力基础设施不能得到有效利用,另一方面东部地区的大规模实时性算力需求无法得到满足。
因此,我国应着重从以下两方面解决算力基础设施的问题:一是大力支持国产算力芯片的技术突破和发展。支持昇腾等具有自主可控能力的国产AI芯片发展,特别是在集成电路制造方面,要持续加大支持力度,甚至要发挥新型举国体制优势,举全国之力发展。二是加快发展全国一体化算力网。通过统筹“通用算力、智能算力、超级算力一体化布局”,“东中西部算力一体化协同”,“算力与数据、算法一体化应用”,“算力与绿色电力一体化融合”,“算力发展与安全保障一体化推进”等五个统筹,建立全国一体化算力调度体系。
1、凡本网注明“来源:GovCDO、数字菁英、数字菁英网、SCOC智城中国、数据要素一线或公共数据运营生态圈”及标有原创的所有作品,版权均属于数字菁英(数字菁英网)。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非GovCDO、数字菁英、数字菁英网、SCOC智城中国、数据要素一线或公共数据运营生态圈)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其它问题需要同本网(feedback@digitalelite.cn)联系的,请在相关作品刊发之日起30日内进行。
链接:国家信息中心 | 中国信息通信研究院 | 中国电子技术标准化研究院 | 中国电子信息产业发展研究院 | 全国市长研修学院
数字理政网站:北京数字理政科技发展中心 | 数字菁英网