
国内首颗端边大模型存算一体AI芯片发布,后摩智能吴强:具身机器人发展处于早期

国内首颗端边大模型存算一体AI芯片正式发布,这是智能科技领域的一大突破,后摩智能公司的吴强表示,该芯片的研发标志着具身机器人的发展已经进入早期阶段,这款芯片将极大地推动人工智能技术在边缘计算和物联网等领域的应用,为智能机器人等前沿领域的发展提供强有力的支持,摘要字数在100-200字之间。
7月27日消息,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)正在举行。
本届WAIC以“智能时代 同球共济”为主题,来自30余个国家和地区的1200余位嘉宾齐聚沪上,其中包括12位图灵奖、诺贝尔奖得主,80多位中外院士,以及多个国际顶尖实验室代表;展厅方面,展览面积首次突破7万平方米,吸引800多家企业参展,集中发布3000余项前沿展品,包括40余款大模型、50余款AI终端产品、60余款智能机器人及100余款“全球首发”或“中国首秀”新品。
WAIC大会期间,国内端边大模型AI芯片公司后摩智能发布了全新端边大模型 AI 芯片——后摩漫界M50,同步推出力擎系列M.2卡、力谋系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
这是国内首颗面向端边大模型的存算一体AI芯片。M50芯片实现了160TOPS(INT8)、100TFLOPS(bFP16)的物理算力,搭配最大48GB内存与153.6 GB/s的超高带宽,典型功耗仅10W,相当于手机快充的功率,就能让PC、智能语音设备、机器人等智能移动终端高效运行1.5B到70B(700亿)参数的本地大模型。和传统架构相比,M50 的能效提升5-10倍,真正实现“高算力、低功耗、即插即用”。
会后媒体交流时,后摩智能CEO吴强表示,目前公司研发的端边推理加速卡可以适配从7B到70B的DeepSeek模型,芯片上限大约在100B(1000亿)参数规模,并且在与中国移动一起研发一体机产品。他认为,具身智能机器人更像是十年前的智能驾驶,这一赛道发展才刚刚开始,这是一个很大的新兴垂直赛道,格局还未定,大家依然有机会,一旦具身智能机器人发展起来,肯定比智能驾驶要大很多。“具身智能是我们的机会之一。”
据悉,后摩智能成立于2020年,致力于利用先进存储器件等技术做存算一体大算力智驾芯片,提供高能效比、低成本芯片及解决方案。公司创始人吴强毕业于美国普林斯顿大学,早前曾在AMD、Facebook公司任职,此前是地平线公司CTO,团队硕博占比达70%以上。
实际上,所谓存算一体(Computing in Memory)指的是在存储器中嵌入计算能力,以新的运算架构进行二维和三维矩阵乘法/加法运算。与以往的冯诺依曼架构相比,其打破了由于计算单元与存储单元过于独立而导致的“存储墙”,解决算力发展速度远超存储、存储带宽限制计算系统的速度等问题,成为后摩尔时代下新的技术发展路径。
公开数据显示,预计到2030年,中国存算一体芯片市场规模将超过1100亿元。
成立至今,后摩智能已完成四轮融资,投资方包括红杉资本中国基金、启明创投、经纬创投、联想创投、和玉资本、金浦投资等机构。最近一轮是在2024年7月,后摩智能宣布完成数亿元人民币的战略融资,由中国移动旗下北京中移数字新经济产业基金、上海中移数字转型产业基金共同对公司进行投资。
鸿途H30发布两年之后,后摩智能全面转型和聚焦端边大模型AI算力赛道,其研发的端边AI芯片,将广泛应用于Pad、PC、智能语音设备、机器人等多种终端,以及一体机、计算盒子、工作站等智能边缘设备上,落地于消费终端、智能办公、智能工业等领域场景。
吴强坦言,这个转型过程非常痛苦,主要是认为存算一体和大模型有很多契合点。
“其实很多人问我为什么要转变,而从2023年下半年开始,我觉得智能驾驶这个赛道有可能走不通,当时整个自动驾驶赛道非常卷,格局逐渐稳定,给新入局的机会越来越少。为了体现存算一体的优势,所以一代芯片算力做得很大,但忽略了当时的市场需求,算力大就意味着成本高,而2023年行业都在讲价格、讲低成本,我们那个算力太超前、太冗余了,今天大家还会讲几百T和高阶,那个阶段不相信L3,很多业内人士说L3永远不会到来,都在拼算力成本,当时芯片和市场需求有很大Gap(差距)。所以,如果我们做一个新的芯片挤入智能驾驶,市场窗口就又错过了,当时新入局的机会越来越少,我在想要不要转变,当时非常痛苦。 研发非常痛苦,大家不愿意,而对我来讲也很痛苦,大家会质疑你为何没有坚持到底,但又明显知道自动驾驶芯片赛道走不通。最后,还是生存的压力大于面子,我们选择转型,我认为端边大模型有很大的新兴机会,并没有什么巨头在里面。2024年初,我们快速把第一代芯片调整了一版推出M30,后来中国移动对我们帮助很大,用M30运行600亿参数大模型,给了我们更多信心,认为存算一体和大模型有契合,最后转到这个方向并开始规划,用时不到两年的时间。”吴强称。
谈到新的产品,吴强表示,力谋LM5050 加速卡与力谋LM5070 加速卡分别集成 2 颗、4颗M50芯片,为单机及超大模型推理提供高密度算力,最高可达640TOPS。此外,M50芯片的存算一体技术从SRAM-CIM,到DRAM-PIM,一直在探索DRAM-PIM的产品化。
展望未来,吴强强调,后摩智能已启动下一代DRAM-PIM技术的AI芯片研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效,而且能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的 AI 算力能够融入PC、平板等日常设备。该芯片预计最快于2026年对外发布。
“M50的发布只是一个开始,我们的目标是让大模型算力像电力一样随处可得、随取随用,真正走进每一条产线、每一台设备、每一个人的指尖。”吴强称。
(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)