从集中训练走向边缘推理,AI架构迎来新一轮重构潮

发布时间:2025-06-13作者:网翼互联阅读:0

自ChatGPT引爆生成式AI浪潮以来,全球算力需求持续飙升,AI产业的重点也在悄然转移。Gartner高级研究总监曾劭清近日在媒体沟通会上指出,AI计算正从“以训练为中心”走向“以推理为主导”。数据显示,2024-2027年,训练算力需求增长趋缓,而推理算力将呈爆发式增长,预计到2028年,推理与训练的算力比例将达到3:1,在中国甚至可能升至4:1。

image.png

这一趋势背后,是AI从实验室走向真实商业应用的必然结果。曾劭清表示,企业对于基础大模型的微调需求将逐渐下降,反而是对推理部署的需求激增。尤其是在金融、制造、零售、医疗等行业中,AI服务正向实时化、场景化发展,推理任务对低延迟、高并发的要求不断提升,使得传统云端部署无法完全满足业务需求。

于是,AI推理正加速向“边缘”延伸。Gartner预计,到2027年,AI加速器(非GPU架构)将成为边缘推理的核心算力单元,其出货量有望首次超越GPU。这不仅是市场需求的变化,更体现了算力架构的范式转移。与GPU相比,AI加速器因采用算法适配设计,在推理场景中的能效表现更优,弥补了GPU通用架构在AI任务中的利用率短板。

此外,AI算法本身也在分化演进。虽然Transformer依然是当前主流,但以Diffusion为代表的新架构(如OpenAI的Sora)正迅速涌现,背后对应的是全新的计算图谱与芯片需求。Gartner预测,到2030年,支持Diffusion模型的AI加速芯片市场规模将增长25倍,成为推动下一轮芯片创新的核心力量。

AI正从“集中训练”迈入“边缘推理”时代,一场涵盖算法、芯片、场景的架构变革已悄然开启。


标题:从集中训练走向边缘推理,AI架构迎来新一轮重构潮

TAG标签:

上一篇:AI算力重心正转向“推理时代”,边缘节点成新战场
下一篇:AI不是“大力出奇迹”——Gartner警示企业战略错配与算力浪费
返回顶部