
2025 年 11 月 13 日,中国上海讯 - 国内率先的芯片IP假想与劳动提供商安谋科技(中国)有限公司(以下简称“安谋科技Arm China”)本日文书,在上海举办“周易”X3 NPU IP新品发布会。
四肢安谋科技Arm China“All in AI”家具战术下落生的首款重磅家具,以及“AI Arm CHINA”战术发展地点的重要推论,“周易”X3 NPU IP基于专为大模子而生的最新DSP+DSA架构,戮力于打造端侧AI磋磨服从新标杆,在性能、功能与易用性等方面全面跃升,面向基础关节、智能汽车、搬动末端、智能物联网四大范围,为加速卡、智能座舱、ADAS(高等驾驶扶直系统)、具身智能、AI PC、AI手机、智能网关、智能IPC(收集录像机)等勾引带来前所未有的AI磋磨体验。
△安谋科技CEO陈锋
安谋科技CEO陈锋暗意:“在东说念主工智能期间,安谋科技将会‘All in AI’,抓续发力自研NPU IP,与CPU、GPU IP沿路构建完好的家具组合,阻隔安谋科技‘为客户创造中枢价值,作念中国智能磋磨生态领航者’的愿景。”
△安谋科技Arm China家具研发副总裁刘浩
安谋科技Arm China家具研发副总裁刘浩暗意:“在‘All in AI’家具战术的指引下,咱们将抓续加大参加,当年瞻性视线整合顶尖研发资源,秉抓怒放合营理念,为生态伙伴提供业界率先的从硬件、软件到劳动的端到端处置决策,全力赋能伙伴的家具改进和营业化落地。”
△“周易”X3 NPU IP新品发布会现场
性能跃迁
前瞻五年布局,让端侧大模子“跑得稳、答得顺”
在半导体IP范围,“面向将来5年的家具地点进行前瞻布局”已成为行业共鸣——涵盖IP研发、芯片及末端家具研发量产。安谋科技Arm China深谙这一礼貌,前瞻性地在“周易”X3中选拔兼顾CNN与Transformer的通用架构假想,复旧全算力类型并增强浮点运算FLOPS,助力阻隔从定点到浮点磋磨的重要搬动,并欢畅大模子磋磨需求,为将来5年Gen AI、Agentic AI与Physical AI的端侧落地奠定期间基石。
跟着AI大模子期间的飞快发展,智高手机、AI PC和智能汽车等端侧勾引正迎来AI智力的爆发性需求。从多模态语音助手到及时图像生成,从智能座舱交互到扶直驾驶决策,端侧勾引需要承载越来越复杂的AI磋磨任务。关系词,端侧AI部署面对算力受限、能效条目高、带宽瓶颈、开发门槛高等多重挑战——如安在有限的功耗和算力资源下阻隔大模子的高效启动,成为行业亟需冲破的重要费事。
“周易”X3基于专为大模子而生的最新DSP+DSA架构(DSP兼顾了通用磋磨与专科加速的向量磋磨智力、DSA架构则领有更大算力和复旧更多精度的矩阵磋磨),从磋磨服从、带宽、精度适配、任务处理四大维度阻隔升级,精确处置端侧AI大模子启动费事,打造端侧AI磋磨服从的新标杆。
其单Cluster最高复旧4个Core,领有8~80 FP8 TFLOPS算力且可天真成就,单Core带宽高达256GB/s。相较于“周易”X2家具,“周易”X3的CNN模子性能提高30%~50%,多核算力线性度达到70%~80%。
在同算力规格下,AIGC大模子智力较上一代家具阻隔10倍增长,这收获于16倍的FP16 TFLOPS、4倍的磋磨中枢带宽、高出10倍的Softmax和LayerNorm性能提高共同驱动。
借助这些优化,端侧大模子推理将更高效:在Llama2 7B大模子实测中,“周易”X3 NPU IP在Prefill阶段算力诓骗率高达72%,并在安谋科技Arm China自研的解压硬件WDC的加抓下,阻隔Decode阶段灵验带宽诓骗率超100%,远超行业平均水平,欢畅大模子解码阶段的高蒙胧需求。
△“周易”X3 NPU IP新品亮点
此外,“周易”X3在架构层面阻隔了多项改进,集成以下重要特色:
●集成自研解压硬件WDC:使大模子Weight软件无损压缩后通过硬件解压能取得独特15%~20%等效带宽提高。
●新增端侧大模子启动必备的W4A8/W4A16磋磨加速形状:对模子权重进行低比特量化,大幅镌汰带宽破钞,复旧云霄大模子向端侧的高效迁徙。
●集成AI专属硬件引擎AIFF(AI Fixed-Function)与专用硬化调治器:阻隔超低至0.5%的CPU负载与低调治蔓延,天真复旧端侧多任务场景和恣意优先级调治场景,确保高优先级任务的即时反应。
●复旧int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度交融磋磨,强浮点磋磨:可天真适配智高手机角落部署、AI PC推理、智能汽车等从传统CNN到前沿大模子的数据类型需求,均衡性能与能效。
△安谋科技Arm China家具总监鲍敏祺
安谋科技Arm China家具总监鲍敏祺指出:“‘周易’X3慑服‘软硬协同、全周期劳动与成就客户’的家具准则,提供从硬件、软件到售后劳动的全链路复旧,当年瞻性假想、专科团队托福与深度劳动参加,全面助力客户家具到手与营业化落地。”
软硬协同
从“好用”到“用好 ”,Compass“金牌扶直”提高开发服从
“周易”X3 NPU IP不仅提供高性能硬件,还配套完善易用的“周易”Compass AI软件平台,通过“软硬一体”的协同假想,让路发者从“好用”到“用好”,显耀提高开发部署服从。
Compass AI软件平台通过隐讳开发全经过的器用链、极致的易用性优化与怒放的生态布局,破解端侧AI开发“适配难、周期长、门槛高”的痛点。四肢中枢器用,平台中的NN Compiler(神经收集编译器)集成Parser(模子领会)、Optimizer(优化器)、GBuilder(生成器)及AIPULLM(大模子启动器用),可阻隔主流模子的高效飞动、自动化优化与部署成就生成,并具备以下中枢智力:
●平淡的框架与模子复旧:复旧超160种算子与270种模子,兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流AI框架,提供开箱即用的Model Zoo。
●改进的Hugging Face模子“一键部署”:通过AIPULLM器用链,径直复旧Hugging Face体式模子,阻隔“一站式”飞动与部署,极大镌汰开发门槛。
●先进的模子推理优化:阻隔业界率先的大模子动态shape复旧,高效处理恣意长度输入序列;同期提供包括Tensor/Channel/Token Level千般量化神态,以及GPTQ等大模子主流量化决策,并加多对LLM/VLM/VLA及MoE等模子的高性能复旧,保险推理精度并阻隔云到端快速迁徙。
●天确凿开发者赋能:提供多种怒放接口,复旧用户模子与自界说算子的开发与调试;配备丰富的调试器用与Bit精度软件仿真平台,复旧多档次白盒开发与性能调优,极大简化算法移植与部署。
●全面的系统与异构兼容:复旧Android、Linux、RTOS、QNX等多种操作系统,并通过TVM/ONNX阻隔SoC异构磋磨,高效调治CPU、GPU、NPU等磋磨资源。
安谋科技Arm China积极构建怒放生态,Compass AI软件平台中的Parser、Optimizer、Linux Driver、TVM及里面IR体式等中枢组件已接踵开源,并领有丰富的调试器用,可欢畅开发者白盒部署需求,且复旧更易用的DSL算子编程说话。在此基础上,平台赋予开发者更深度的定制智力:客户不仅不错使用平台中的Compiler、Debugger或DSL说话开发出我方的自界说算子,也可通过Parser、Optimizer等器用打造出属于我方的模子编译器,从而阻隔相反化假想与开发服从提高。
△“周易”NPU Compass AI软件平台
不仅如斯,安谋科技Arm China期间团队还围绕“周易”X3 NPU IP和Compass AI软件平台的软硬件协同进行用心假想和反复论证,运筹帷幄是提高客户最终落地决策的服从和能效。举例,在“周易”X3 NPU IP的AIFF模块软硬件假想中,硬件端充分连络软件使用场景,通过增大总线带宽、加多DMA(径直内存拜谒)的outstanding(未处理的教唆或数据肯求)等神态提高数据搬运、数据并行服从,软件端则针对硬件特色假想专属使用形状,如对模子进行合理切分以充分阐扬多核并行上风。
△安谋科技Arm China NPU家具线负责东说念主兼首席架构师舒浩博士
安谋科技Arm China NPU家具线负责东说念主兼首席架构师舒浩博士以为:“‘周易’X3的家具上风,源于通用、天真、高效且软硬协同的系统架构假想,这一假想使其兼具平淡的行业适用性与天确凿边端侧AI应用场景匹配智力。”
多场景落地
从无形IP到AI万象,端侧智能垂手而得
新一代“周易”X3 NPU IP将端侧智能的界限拓展至更精深的应用场景,面向基础关节、智能汽车、搬动末端、智能物联网四大范围,精确匹配面前爆发的端侧AI需求,可平淡应用于加速卡、智能座舱、ADAS、具身智能、AI PC、AI手机、智能网关、智能IPC等AI勾引:
●基础关节范围:在加速卡场景中,“周易”X3 NPU IP复旧CNN与大模子等千般结构的AI模子高效加速,为数据中心及角落磋磨节点提供核默算力。
●智能汽车范围:“周易”X3 NPU IP同期赋能智能驾驶与智能座舱:在ADAS系统中,可为自动停车等扶直驾驶功能提供高性能AI算力复旧;在IVI(车载信息文娱系统)中,复旧基于语音与车表里视频图像输入的智能互动。
●搬动末端范围:在AI PC、AI手机上,“周易”X3 NPU IP可阻隔超分渲染,提高显现鉴别率,并复旧基于大模子的AI Agent应用,为用户带来更智能、更教唆的交互体验。
●智能物联网范围:在智能网关、智能IPC等勾引中,“周易”X3 NPU IP复旧腹地AI推理,阻隔更快反应与更智能的末端体验,欢畅角落勾引对及时性与秘籍保护的高条目。
△“周易”NPU IP系列家眷现场demo展示区
这次发布会现场系统展示了“周易”NPU家具家眷的期间演进与落地恶果,生动阐发其何如将无形的算力飞动为垂手而得的智能体验。
●“周易”Z1:算力0.32~3.75 TOPS,赋能AIoT场景,平淡复旧东说念主脸识别、东说念主脸及东说念主体重要点检测和笔墨识别等,且已进入AI智能音箱等多种家具。
●“周易”Z2/Z3:算力1.25~5 TOPS,面向AIoT、初学级座舱等市集,复旧前视扶直驾驶决策、舱泊一体决策及安全式样盘决策,以及图像超鉴别率优化等。
●“周易”X1:算力10 TOPS,面向高端AIoT、汽车座舱等市集,复旧驾驶员监控、乘客监控、自动停车、AVM 360环顾,以及AI图像降噪等。
●“周易”X2:算力10-30 TOPS,面向高端AIoT、AI PC、AI Pad、手机等市集,现场展示了启动Stable Diffusion v1.5的文生图智力,启动CLIP的文搜图智力,可阻隔端侧多模态AI教唆启动。
●“周易”X3:算力8-80 FP8 TFLOPS,面向基础关节、智能汽车、搬动末端、AIoT等市集,现场展示了基于“周易”X3的主流大模子效果,包括启动DeepSeek-R1-Distill-Qwen-1.5B模子的文生文AI教唆对话,启动Stable Diffusion v1.5的文生图效果,启动MiniCPM v2.6模子的图片识别及图生文多模态应用等,均展现出优异的端侧大模子推感性能。
从“周易”Z1的基础感知到“周易”X3的复杂透露,这一期间演进旅途明晰地标明,端侧AI正在从单一的功能阻隔,迈向交融多种模子、适当动态场景的“全民普及”新阶段。“周易”X3 NPU IP的假想充分预判端侧AI的“场景深入”趋势:以极致算力阐扬破解“多模子交融”的算力需求,以全算力类型并增强浮点运算FLOPS适配“精度动态演变”的场景相反,借助软硬协同的生态打造端侧算力底座。
关于NPU架构的将来演进,舒浩博士也指出,跟着磋磨架构的抓续演进,NPU架构的四大演进地点:
●更高效的通用磋磨智力:天真量化算法、千般化收集会构、高效部署优化期间;
●更强的磋磨膨胀智力:单核Scale-up/Down智力、多核Scale-out智力、多Die、多chip协同智力;
●复旧更多的数据体式:比如FP4、1.58bit、OCP-MX;
●更高效的软件使用界面:需要有愈加友好的编程模子;高效DSL说话;软件接口档次化、完备。
●更怒放的生态与合营形状:软件生态和资源、软硬协同开发。
回想来说,“周易”X3 NPU IP的发布,标识着安谋科技Arm China“All in AI”家具战术的崇拜开启。安谋科技Arm China以“AI Arm CHINA”为战术发展地点,积极反应“AI+”行动策画,抓续深耕期间范围改进,同期联袂伙伴共建怒放生态,加速构开国内“AI+”产业升级的智能磋磨基石,为千行百业智能化转型提供更强IP“核芯”能源。
剪辑:芯智讯-浪客剑体育游戏app平台
