功耗低至毫瓦级!苹芯科技发布存算一体NPU,交付多模态智能感知芯片
金融翼行者
2024-09-24 13:11:52
0

作者 | ZeR0

编辑 | 漠影

芯东西8月8日报道,今日,北京AI芯片创企苹芯科技发布存算一体NPU“PiMCHIP-N300”和多模态智能感知SoC芯片“PiMCHIP-S300”。两款产品是存算一体技术在28nm及22nm制程节点上的首次产品化实现。N300已有客户,S300预计在今年第四季度推向市场。

通过将计算和存储深度融合,PiMCHIP-S300实现了数据处理的“零搬运”,在大幅提升计算效率的同时,显著降低了功耗,可应用于智能可穿戴设备、智能安防、具身智能、AI大模型、健康数据分析等领域。

苹芯科技创立于2021年2月,同年9月其基于SRAM架构的存内计算加速器S200测试成功,该成果还发表于素有“固态电路领域奥林匹克”之称的芯片顶会ISSCC 2022。今天的新品发布也是对其过去三年创业发展的阶段性总结。

清华大学电子工程系教授、无问芯穹科技有限公司发起人汪玉现场发表致辞,他总结了苹芯两款新品的三个特点:1)在28nm成熟工艺下取得跨代性能提升,实现极致能效比;2)通用性强,能支持不同应用;3)是一个平台架构的概念,在大模型、可穿戴、机器人等应用领域均能发挥作用。

汪玉回顾道,他与苹芯科技联合创始人、CEO杨越相识28年的老友。两人是清华附中同学,住校时经常一起踢球,然后都保送到清华大学,汪玉就读于电子工程系,杨越进入自动化系。

苹芯科技的创立也有汪玉的一份功劳。在2018年卖掉深鉴科技后,汪玉2019年下半年去美国斯坦福大学访问,正好杨越在美国工作,汪玉就劝他回国,搞点事情。2021年年初,杨越回国创办苹芯,第一个办公室也是汪玉帮忙找的。

此外,在存算一体技术方向上,汪玉跟苹芯团队算是同行。汪玉大约在2012年、2013年开始研究存算一体并发表相关论文。

据了解,苹芯科技已与国内外电子类头部企业、大型企业集团等客户展开合作,为其提供存内计算技术的一站式解决方案。

一、单核算力0.5TOPS,系统功耗毫瓦级,支持自定义算子

PIMCHIP-N300是苹芯科技自研的新一代存算一体NPU(神经网络处理单元)IP,专为机器学习和AI领域设计,可内嵌到端侧芯片中,能以更高效率、更低能耗承担繁重的神经网络加速任务。

杨越谈到端侧电子产品中出现两个趋势,一是智能本地化,二是小型化、轻量化、低功耗化。两个趋势都对底层芯片提出了新的设计要求,低成本、高效能、小面积、低功耗这四个优化维度几乎涵盖了所有端侧芯片的设计理念。

PiMCHIP-N300采用软硬融合架构,充分考虑可扩展性,单核可提供0.5TOPS算力,系统功耗为25-100mW,典型场景下静态功耗仅10μW,支持混合精度计算,涵盖INT4/INT8/FP16精度,支持12大类超过100种算子,核心计算单元能效比达27TOPS/W,跑YOLO-V3 tiny网络的算力资源利用率达89.5%。

在兼容性方面,PiMCHIP-N300支持自定义算子,可满足不同模型部署需求,并针对人声监听、眼动追踪、主动降噪、环境感知等应用场景提供了配置方案和专门优化。

在灵活性方面,该NPU有高速任务调度加速单元,支持多核或多个计算单元的实时任务调度。

为了满足客户更自主、灵活的算法移植需求,苹芯科技根据客户定义的场景或数据,提供一键部署的端到端的解决方案,开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,并提供免费的软件工具链,包括软件模拟器、调试器、C编译器,能够减少二次开发的时间。

苹芯科技CTO章尧君把存算技术平台分为五类:应用、工艺、电路、架构、算法,每一部分需要相互配合和共同设计,从应用出发,确定需要的算法、工作环境及设计要求,进而确定架构设计和工艺选择,根据工艺特性设计电路,最终实现存算芯片方案。

这是一个密度优先、功耗优先、速度优先的设计方案。混合计算架构可基于不同的技术和设计参数实现,包括不同阵列形状(存储容量),SRAM、RRAM等不同的存算单元,不同的存算容量与算力的比例,以及不同输入/输出数量。

章尧君总结说,苹芯科技以高能效加速计算核心为原点开始开发,之后做从定点运算到浮点运算,以及一些面向特殊应用的设计,并在研可灵活实现不同算力部署需求的首款存算编译器,还将提供混合计算架构和异构存内计算量化映射技术。

二、多模态智慧感知芯片:28nm,异构架构,单核能效比27TOPS/W

PIMCHIP-S300多模态智慧感知芯片是一款基于SRAM的存内计算芯片,内置自研NPU、数字PIM单元,单核能效比高达27TOPS/W,具备高能效、小面积、低功耗、低成本等特点,可高效完成数据密集型任务。

该芯片采用轻量级Cortex-M MCU处理器,实现实时控制与调度;支持音、视频及多种传感器接入,实现多模态融合感知;支持多路麦克风阵列预处理流程,满足各级语音场景应用。基于自研异构架构,这款AI芯片可实现超低功耗唤醒、VAD、语音识别、运动监测、视觉识别,针对特定计算能节约90%的耗能。

苹芯科技副总裁江广展示了PIMCHIP-S300芯片的谍照。它采用28nm制程、BGA封装、自研异构架构,12mm * 12mm大小,die做得很小,能满足更小型化的需求。

这款芯片拥有丰富的外设接口,单颗芯片既可以接收数据,也可以本地处理数据,产生简单决策,最终产生控制,一颗就能闭环。

其高度灵活和易集成性,有助于大幅缩短产品开发周期。苹芯打造了完整交钥匙解决方案,底层操作系统、中间件、工具链都会开源,提供一键AI部署工具、一键二进制生成和下载工具。

该存算一体AI芯片提供电池可驱动的低功耗,未来还能结合新能源甚至是光伏电池,达到更好的小型化和易部署能力,广泛支持无人机、具身智能等场景应用。

苹芯挑选了近期参与MLPerf测评的竞品,进行综合比较,图表显示,在跑多种AI算法时,苹芯存算一体AI芯片的能耗和延迟均最低。

同时,苹芯自研了一套开源的Pstreamer异构计算框架,通过管道将不同端侧通用算法和算力模块连接起来,实现声光电不同模态信息的采集、融合、感知等功能,并衔接决策与控制功能,以帮助客户快速部署产品,快速推向市场。

结语:已申请40余项海内外专利,将积极拥抱大模型生态

苹芯科技定位自身为智能计算架构的革新者,致力于通过创新的存算一体解决方案,为AI的广泛应用铺设技术高速路,推动从智能终端设备到智慧城市、从智能医疗到具身智能的全方位变革。目前苹芯已申请海内外专利40余项,相关知识产权和工程经验覆盖从存储器器件、电路设计、算法优化到体系结构等全技术栈。

杨越在发表致辞时谈道,展望未来,苹芯科技将继续秉承“创新引领未来,技术改变世界”的理念,积极拥抱大模型生态,以产品为核心,不断加大研发投入,深化与高校、科研机构的合作,培养和吸引顶尖人才,共同推动中国集成电路产业向更高层次迈进。

包括苹芯两款新品在内,随着相关技术和器件的迭代和成熟,越来越多存算一体AI芯片产品走向落地商用,为国内AI加速解决方案提供一种兼顾高能效与灵活性的新选择。

相关内容

功耗低至毫瓦级!苹芯科技发...
作者 | ZeR0编辑 | 漠影芯东西8月8日报道,今日,北京AI...
2024-09-24 13:11:52
华海清科(688120)2...
本站消息,截至2024年2月8日收盘,华海清科(688120)报收...
2024-06-24 22:58:15

热门资讯

两会快讯 全国人大代表马新强...   “武汉是我国重要的工业基地和中国软件名城,工业软件应用土壤丰沃,产业实力雄厚。为此,建议国家进一...
令人发指!男子嚣张偷拍女生裙底... 【令人发指!男子嚣张偷拍女生裙底被路人录像取证】近日,女青年小王在北京地铁10号线国贸站候车时,男子...
欧派家居(603833)8月3... 证券之星消息,截至2024年8月30日收盘,欧派家居(603833)报收于44.35元,上涨5.9%...
上期所调整螺纹钢期货品种相关合...   上海期货交易所1月12日发布公告, 经研究决定,自2024年1月16日交易(即1月15日晚夜盘)...
节后闲钱何处去?稳健理财成主流 新年开好“投”,万事不用愁!2024年开年以来,“雪球敲入”“量化危机”等现象发生,对于很多投资者来...
紫砂壶新手必知的五大误区,避开... 在中国传统文化中,紫砂壶以其独特的艺术魅力和实用价值,成为了文人墨客的心头好。然而,对于许多初学者来...
二炮基地司令员,父亲在医院交了... 自从1996年之后,我国解放军的部队当中,在连级以上的单位,都会挂上八大英模的挂像,以此来纪念英雄模...
通达信三线扭转副图指标公式(附... 编程思路破译N赋值:13TS赋值:收盘价的有效数据周期数>=10输出MM:(3*收盘价+最高价+最低...
外媒:中国正尝试重新定义高端汽...   车载充气床垫、车尾餐厨系统、车载无人机……近日,外媒关注到不少中国电动汽车上涌现的“黑科技”,认...
迎政策催化,新型城镇概念拉升,... 证券时报网讯,新型城镇概念23日盘中强势拉升,截至发稿,招标股份“20cm”涨停,舜禹股份、德必集团...