首页 > AI教程资讯 >ArmSME2技术加速安卓AI升级,驱动移动应用下一代功能革新

ArmSME2技术加速安卓AI升级,驱动移动应用下一代功能革新

2025-07-21万象ai

从按下快门前就对照片进行即时锐化,到通话过程中实时消除背景噪音,再到离线状态下与人工智能(AI)助手互动,端侧AI正在重塑移动体验。而Arm计算平台正是实现这些无缝交互体验的强劲驱动力。

随着AI工作负载变得日益复杂且广泛渗透至各个领域,移动开发者面临的需求也与日俱增:他们需要在内存、电力和热预算等严格且多样化的限制下,实现实时且高效的性能表现,同时确保不会给应用及其工作负载增加额外的复杂性。

为了应对这些挑战,Arm推出了可伸缩矩阵扩展2(SME2)技术,以直接在移动CPU上加速高强度的矩阵计算工作负载——这些工作负载对计算机视觉和生成式AI应用至关重要。SME2是Armv9架构中的一组高级CPU指令,它基于SME升级、能够在AI异构计算框架下,高效支持图像处理、自然语言处理、语音生成等实时移动端推理任务。

开发者如何获取SME2的优势

移动开发者无需改动现有代码、模型或应用程序,即可直接获取SME2带来的性能提升。这得益于Arm的软件加速层——ArmKleidiAI,它能够无缝集成到主流运行时库和AI框架中,为开发者提供开箱即用的性能体验。

得益于KleidiAI深入且广泛的集成,SME2已在Google专为安卓系统优化的神经网络推理库XNNPACK中实现支持。此外,SME2也被集成至多个框架中,包括阿里巴巴MNN、GoogleLiteRT和MediaPipe、微软ONNXRuntime,以及llama.cpp。这些集成意味着SME2已深度嵌入到软件栈中。当设备支持并启用SME2时,XNNPACK会自动通过KleidiAI将矩阵计算密集型任务路由至SME2,从而让开发者在无需改动任何应用逻辑或基础架构的情况下,直接实现性能提升。

与此同时,KleidiAI不仅着眼于当下的性能加速,更是为满足未来需求而设计。随着Arm不断推出新特性与架构升级,KleidiAI将持续为所支持的AI框架和运行时库带来自动的性能提升,而无需开发者投入额外精力。

大规模AI性能与能效优化

搭载SME2增强硬件的安卓新机即将上市,开发者可率先通过硬件加速解锁AI性能跃升。与此同时,SME2已支持最新的iOS设备(完整支持机型列表详见此处),只要应用中使用了集成SME2的AI框架,便可自动享受这些性能提升。

在搭载SME2增强硬件的设备上运行GoogleGemma3模型时,其聊天交互中的AI响应速度比未启用SME2的同款设备快六倍。此外,仅用单个CPU核心,Gemma3便可在不到一秒的时间内启动多达800字的文本摘要任务。目前,一家领先的独立软件供应商(ISV)已承诺将其应用中的大部分词元(token)生成工作负载从云端迁移到移动端,这在一定程度上得益于端侧AI能力的持续突破。

Google安卓杰出软件工程师IliyanMalchev表示:“借助SME2增强的硬件,更先进的AI模型(如Gemma3)能够直接在各类设备上运行。随着SME2的持续扩展,移动开发者能够在不同生态系统中无缝部署下一代AI功能,从而为终端用户带来低延迟、广泛可用的智能手机体验。”

除了性能的提升,SME2还为Arm生态系统(如iOS与安卓)提供了可移植的解决方案。目前,已有900万款应用在Arm计算平台上运行,超过2,200万名软件开发者基于Arm平台构建他们的应用和工作负载。

助力开发者构建AI的未来

对安卓开发者而言,他们只要将应用构建在集成了KleidiAI的AI框架和运行时库之上,就能自动获得SME2带来的性能提升,并可在各类设备上无缝部署下一代AI功能。

开发者若提前布局,即可确保其应用在SME2增强硬件推向市场时实现优化,无需改动任何一行代码,便可为用户带来更快的性能、更低的延迟以及更高的能效。

此外,Arm还发布了开发者启动平台,帮助移动开发者充分利用SME2的技术优势,通过丰富案例展示如何针对KleidiAI增强框架进行开发,从而默认激活硬件层面的最新加速能力。

有关如何规划SME2的更多信息,请参阅Arm社区博客。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之

4980
281

同类推荐更多

有哪些稳定的海外影视网站推荐

有哪些稳定的海外影视网站推荐

最火的AI教程资讯

2025-01-07

有哪些稳定的海外影视网站推荐_映技派,专注ai人工智能!,在寻找免费的影视网站时,有许多优秀稳定的海外影视网站可以选择,以下是一些针对海外观众推荐的影视网站,适合观看电影和电视剧。