AI算力新时代:智能体崛起与边缘计算的未来版图

发布时间:2024-12-19作者:网翼互联阅读:0

随着AI PC和AI手机的推出,以及Apple Intelligence等产品的持续优化,基于小型语言模型的应用程序正在逐步普及,部分AI查询将在边缘设备或终端设备上完成。根据Barclays最新发布的一份关于AI推理计算未来趋势的报告,边缘查询在总查询量中的占比预计将从2024年的1%上升到2025年的10%。到2026年,这一比例可能达到15%,并在2028年增至约25%。一些专家甚至预测,未来端侧AI的占比可能增长至50%。

image.png

随着大语言模型能力的不断增强,应用场景的持续拓展,大模型的应用架构也逐渐清晰。在应用层,**智能体(agent)**成为行业关注的重点。智能体作为大模型能力的延伸,弥补了其在操作和执行方面的不足,并具备记忆、搜索、规划、决策和执行等核心能力。

Barclays报告指出,当前AI行业正处于Chatbot和Copilot阶段,2025至2026年将迎来agent时代。这一趋势得到了行业发展的印证,例如谷歌在12月11日发布最新模型Gemini 2.0时,同时推出了一系列智能体产品。可以预见,智能体将成为大语言模型发展的下一站。

端侧大模型和智能体的崛起标志着AI迈入新阶段,也将对AI算力需求产生重要影响。报告认为,未来AI算力的重点将逐渐从训练转向推理计算。随着GPT-5等下一代大型语言模型的出现,以及像NVIDIA Blackwell GPU这样的新AI基础设施的推出,AI应用,特别是agent系统,或将迎来爆发式增长。这种增长可能推动消费者和企业AI市场的真正腾飞。

报告预测,伴随agent系统的广泛应用,AI推理计算的需求将显著增加。预计推理计算将占AI算力市场的主导地位,约占推理市场总需求的30%。随着AI的普及,到2026年,如果消费者AI的日活跃用户(DAU)超过10亿,企业任务中agent的渗透率超过5%,总AI计算需求预计将达到1500亿EFLOPs,其中推理计算将占比接近75%,而训练计算将占25%。

基于对企业级agent的采用估计,到2026年企业推理计算的需求量将达到约50亿EFLOPs。随着B200从2024年开始部署,H100也将广泛用于企业推理计算。然而,报告指出,仍有约30亿EFLOPs的企业推理需求需要通过新一代芯片来满足。

总结来看,随着智能体的崛起和边缘计算的快速发展,AI行业将迎来推理计算主导的新时代,推动技术和市场双重突破。


标题:AI算力新时代:智能体崛起与边缘计算的未来版图

TAG标签:

上一篇:液冷技术加速出海:市场机遇与标准化双驱动
下一篇:守护数字未来:亚马逊云科技的创新安全防御体系
返回顶部