存算一体是啥新趋势?值得教授学者纷纷下海造芯

率先迈入 B1 轮的知存科技,创始人 &CEO 王绍迪出身北大微电子,2017 年获得 UCLA 电气工程博士学位,同年提前结束博士后研究工作,回国创业。

苹芯科技则由清华校友陈怡然、杨越组队成立。陈怡然现为杜克大学教授,IEEE/ACM Fellow。杨越博士毕业于多伦多大学,还曾任美光科技首席系统架构师。

九天睿芯 CEO 刘洪杰博士毕业于 ETH,师承 IEEE Fellow 托比亚斯 · 德尔布鲁克。后者是类眼图像传感器发明人,在神经拟态计算领域有着突出贡献,现在亦是九天睿芯科技顾问。

据统计,自 2012 年开始,AI 训练需要的算力每 3.5 个月就会翻倍,这个速度已远超过摩尔定律的 18 个月。

目前,主流芯片主要依靠不断迭代先进工艺制程,来提升芯片性能,应对 AI 算力需求。

一是成本持续走高。根据 IC Insights 调研机构估算,如果想追赶上台积电在先进制程上的制造能力,起码需要五年时间外加近万亿元的投入。

二是由物理限制引发的芯片性能问题越发突显。随着集成电路的尺寸越来越小,栅极电压夹断沟道的难度变大,从而出现严重的电流泄露现象,导致芯片功耗失控,发热严重。

此外,当制程走到 1nm 时,电子会产生 量子隧穿效应 而穿透绝缘层,导致晶体管出现漏电问题。

再加上数据在存储单元和计算单元之间频繁的搬运还带来了过高的无用功耗(占比高达 60%-90%),芯片的性能往前迈进困难重重。

存算一体的概念由此再度被提及,并很快成为产学研各界破解 AI 算力困境的 希望之星 。

存算一体的概念诞生于 1969 年,最早由斯坦福研究所的 Kautz 等人提出。

顾名思义,存算一体就是指计算单元与存储单元融合,在完成数据存储功能的同时可以直接进行计算。

这一设计可以从根本上解决冯 · 诺伊曼瓶颈,在做到低成本、大算力的同时,保持低功耗。

这两种计算方式采取的存储器不同,前者以 SRAM 等易失性存储器为主,后者采用 Flash 和 RRAM 等优势更大的非易失性存储器。

而依照计算单元与存储单元的关系(距离)划分,目前存算一体的技术路线大致可分:

近存计算是通过将计算资源和存储资源拉近,来实现能效和性能的提升,在广义概念上也被归入存算一体架构。

一种计算操作由位于存储器内部的独立计算单元完成,存储单元和计算单元相互独立存在。

另一种是在内部存储中添加计算逻辑直接执行数据计算,这种架构数据传输路径最短, 能同时满足大模型的计算精度要求。

在现在这个时间节点,给存算一体技术的发展梳理时间线 年可说是这一新技术潮流的探索期。

一方面,新技术的兴起意味着机会与红利,对工业界的玩家们而言,自然迫切需要高精尖人才入场,打造技术壁垒挤占生态位。

另一方面,站在科学家们的角度来看,身至产业一线将实验室中的理论转化为实践,亦是难得的施展抱负、甚至改变世界的机遇。

正如前文所言,当前,存算一体技术已然成为后摩尔时代突破芯片性能瓶颈最具潜力的技术方向之一。

尽管刚从实验室中走出不久,但其未来的应用潜力,已受到资本和产业界的一致看好。

然而,与愈发强烈的市场需求相矛盾的是,在现阶段而言,做存算一体芯片无疑是一件入局技术门槛相当高的事。

一方面,存算一体技术考验的是计算系统和存储系统的整合能力,设计要求本身就比标准模 IP 和存储器 IP 更复杂。

另一方面,由于缺乏 EDA 工具以及适配的工具链,该技术对技术领导者的要求也会比其他成熟的芯片领域更高。

要知道,存算一体当前面临的最大挑战之一,就是新兴技术的未知性带来的高风险。

并且其涉及的完整技术链条包括底层器件、电路设计、架构设计、工具链、软件等等,并且各个环节之间的适配度也非常重要。

这就导致现阶段的存算一体试错成本很高,如果相关公司创始团队缺乏足够的存储器量产经验和技术路线认知,那么很可能会一步踏错,满盘皆输。

总的来看,如果将之放在整个半导体产业的大背景下,该行业还处于较为早期的阶段。

我国存算一体芯片研发公司集中诞生于 2017-2020 年,目前共有 10 家左右可以列为头部初创,大部分处在 A 轮前后。

具体业务方面,各公司基本都是基于传统的 Nor Flash 或 SRAM 存储器做存算一体芯片,但由于侧重点各不相同,尚未形成竞争格局。

其中九天睿芯专注于神经拟态感存算一体芯片研发,后摩智能做大算力 AI 芯片,千芯科技聚焦大算力可重构存算一体芯片的架构设计,苹芯科技在基于 SRAM 做存内计算加速器……

在此之外,国内也出现了一家专门基于新型存储器技术(RRAM)进行存算一体芯片研发的公司:亿铸科技(侧重于大算力 AI 芯片)。

RRAM 新型存储器技术在存算一体芯片上具有速度快、结构简单、存储密度大等优势,有望成为未来的发展趋势,目前距离工艺成熟还有 2-5 年的时间。

存算一体芯片的应用场景主要分为两方面:一是面向端侧,对低功耗需求强烈的场景;二是面向云侧推理,对大算力需求强烈的场景。

目前业内 80% 的公司优先布局对能效比有高要求的端侧小算力场景(如智能可穿戴设备,智能安防,移动终端,AR/VR),国内在这方面初步实现量产的有两家:知存科技和九天睿芯。

相反,大算力场景(如自动驾驶)上的落地还不算特别明显,还处于业内共同努力的阶段。

其中,千芯科技主要融合存算一体与可重构计算,以支持 AI 芯片的更大算力和可编程灵活性。

后摩智能的成品在算力方面已做到数十 TOPS,可支持大规模视觉计算模型,已跑通智能驾驶算法模型。

国外方面,大多公司的融资已进入 C/D 轮,几家头部企业如 STT、Syntiant 和 Mythic 走在全球商业化前列,芯片出货量最高达 2000 万级别(国内最高百万级),并有约 15 家公司实现了超 100 亿美元的营收(我国仅 1-2 家)。

究其原因,除了国内起步时间稍晚 3-5 年外,我们还存在着产业 / 技术链还不够完整、配套工具(如 EDA 软件、编译器)不够成熟、与芯片大厂的合作程度不够高等问题。

目前,在存储技术上,国内大多数公司都采用购买国外成熟的存储技术 IP 来完成存内计算的研发,这种模式存在一定的风险。

比如一旦在 IP 授权上发生问题(如停止授权),将会影响到存算一体技术的持续演进,甚至会阻碍技术成熟的速度。

不过国内已经出现了专门做新型存储器技术(RRAM)研发的公司。一旦该技术实现完全国产化,我国将不会受到存储器技术 IP 授权的限制。

值得注意的是,目前,在存算一体芯片这个领域,国内外均未实现大规模量产。而事实上,存算一体技术在国内有更大的发展空间:

国内市场在从非智能硬件向智能硬件转变的过程中,对端侧智能产品的兴趣远大于国外市场,因此在需求侧会出现更多元的机会。

尽管现阶段市场规模相对有限,初创企业们的增长来源主要为定制开发费用和 SoC 芯片销售费用,近期量产可达千万级别的公司预计仅有 1-2 家,未来几年内能实现量产的也只是再增加 3-5 家。

但量子位分析师认为,存算一体芯片行业的市场价值可以类比为一座巨大的冰山,下面还隐藏着相当大的市场潜力。

就拿应用来说,存算一体芯片必将从端侧小算力市场逐步扩展到整个 AI 芯片领域。总的来看,短期内,行业将会呈现持续走高的态势。

量子位智库预估,到 2025 年,国内存算一体芯片市场规模为 125 亿元。

相关公司也将逐渐从定制化产品过度到标准化产品研发上,针对端侧、边缘侧和云侧不同场景提供更具通用性的产品。

这个转变需要 5 年左右的时间,完成转变到了 2030 年,市场规模就将迎来幅增长,达到 1136 亿元。

其中,中小算力芯片市场规模约为 1069 亿元,大算力芯片约为 67 亿人民币。

特别感谢:达摩院、后摩智能、九天睿芯、苹芯科技、千芯科技、燕博南、亿铸科技(按首字母排序)。

欢迎关注人工智能、智能汽车的小伙伴们加入我们,与 AI 从业者交流、切磋,不错过最新行业发展 & 技术进展。

据官方消息,本届成都车展主题为“享蓉城·促产业·驭未来”,展期为8月26日~9月4日,将在中国西部国际博览城举办。

发表回复

您的电子邮箱地址不会被公开。

© 2022 鸭脖最新版yabo|yabo123.vip - WordPress Theme by WPEnjoy