客户端
游戏
无障碍

7

评论

8

9

手机看

微信扫一扫,随时随地看

阵量科技新获融资押注Chiplet,GPGPU的国产化破局

图片

【摘要】2025年1月7日,阵量科技完成A轮融资,三一集团、联创集团等机构入局。

在AI算力需求井喷的背景下,这家成立仅4年的企业以Chiplet技术为矛,瞄准GPGPU芯片赛道,对标AMD MI系列。

其申请专利“芯粒通信方法”。Chiplet技术通过模块化设计打破传统芯片的良率与成本瓶颈。

事实上,阵量科技做的就是人工智能芯片相关的业务。

GPGPU突破了GPU仅用于图形渲染的局限,赋予其通用计算能力。阵量的产品有关GPGPU(通用GPU),对标AMD的MI芯片。

传统CPU如同全能小能手,能处理各类任务,但面对大规模并行计算时,效率欠佳。而GPGPU芯片擅长并行处理海量数据,在计算密集型任务上优势显著。

GPGPU 广泛应用于人工智能领域、商业计算和大数据处理领域。科学研究领域也离不开GPGPU芯片的助力。

AMD的MI系列芯片应用于人工智能领域,如深度学习模型的训练和推理。在处理大规模数据集和运行复杂算法时表现出色,适用于大语言模型的训练与推理。

阵量科技同样瞄准人工智能领域,迅速切入GPGPU芯片领域。

然而,台积电封装技术垄断、美国芯片禁令下的供应链风险,以及英伟达CUDA生态压制,让这场国产替代之战充满变数。阵量能否在巨头的阴影下杀出血路?答案或许藏在Chiplet的“碎片化优势”与政策红利中。

以下是正文:

01

阵量新获投资,押注Chiplet技术

2025年1月7日,阵量科技获得A轮融资,三一集团、联创集团、粤民投慧桥广晟贰号(深圳)投资合伙企业三家机构投资阵量。阵量科技注册资本为50366.3003万人民币,成立于2020年5月6日。

当前AI生产力大爆发,根据AGI时代的“二八定律”,80%的软件功能将由人工智能自动生成,仅有20%需要人工手动调试。大模型的飞速发展对芯片算力的需求越来越高,给芯片行业带来了挑战,但也有机遇。

阵量科技CEO王勇曾指出:从AI1.0到AI2.0,AGI之路的重大里程碑就是大模型。

他认为:在AI2.0时代,GPU会代替CPU成为行业最重要的IP;Chiplet,3D IC等会成为趋势;工艺仍然会往2nm演进,GAA、CXL、背面供电、垂直供电、存内计算、光电共封等技术会落地。

2024年6月26日,阵量科技申请了一项名为“一种芯粒通信方法及装置、芯粒、芯片、存储介质”的专利,并与同年10月11日公布。

芯粒,即Chiplet,是一种新兴的半导体设计和封装技术。

Chiplet 技术将复杂的芯片功能分解成多个小型、独立且可复用的模块。这些模块可以是处理器核心、内存芯片、传感器或其他类型的集成电路,它们通过高速接口或连接器相互连接,形成一个完整的系统芯片。

Chiplet 允许使用不同的工艺节点制造不同的模块。这意味着某些模块可以使用先进的制程工艺,而其他模块则可以使用较旧的、成本较低的工艺。这种灵活性有助于平衡性能和成本。

同时,由于Chiplet 模块被设计为标准化的组件,可以在不同的系统中重复使用。允许添加或移除模块,以调整系统的功能和性能。

这种模块化方法使得系统更容易适应市场变化和技术创新。降低了设计复杂度和成本,同时提高了设计效率。

和传统的SoC相比,Chiplet的良品率高,显著降低了成本。

实际上,芯片越“大”,晶圆区域出现瑕疵的概率就越大,相应的良品率就越低。

而每个小芯片的制造和测试过程简单可靠,晶圆区域出现瑕疵的概率低。因此Chiplet技术有助于提高良品率,进而降低生产成本和提高产品质量。

Chiplet 技术在带来诸多优势的同时,也面临着一些问题。首先,散热和力学问题是 Chiplet 架构的一大挑战。由于芯片堆叠,功耗显著增加,导致散热困难。

其次,封装和成本问题也不容忽视。Chiplet 之间的互连需要高密度、低延迟的封装技术。如果封装技术不过关,可能导致 Chiplet 之间的互连不稳定,影响芯片性能。

最后,信号传输和延迟问题也是 Chiplet 技术需要面对的难题。与传统的单芯片 SoC 相比,Chiplet 之间的互连带宽有限,且存在更高的延迟。这可能会影响芯片的整体性能,特别是在高性能计算、人工智能等需要高带宽和低延迟的领域。

02

Chiplet架构重塑GPGPU

按照使用场景划分,当前 Chiplet 架构主要应用于服务器处理器芯片、人工智能加速芯片、通信芯片、移动与桌面处理器芯片、晶圆级处理器芯片。

事实上,阵量科技做的就是人工智能芯片相关的业务。

随着人工智能技术的发展,大模型的训练和推理对人工智能加速芯片提出了更高的峰值算力和能耗要求。因此,采用Chiplet 架构设计芯片并集成HBM芯粒是一种非常流行的做法。

目前典型用于神经网络的训练和推理的芯片可以分为3类:神经网络专用的加速器芯片、GPGPU芯片和 FPGA芯片。

GPGPU,即通用图形处理单元,突破了GPU仅用于图形渲染的局限,赋予其通用计算能力。

在 GPGPU 芯片中,国外企业采用Chiplet 设计的典型代表是 Intel Ponte Vecchio 芯片、AMD MI系列芯片、NVIDIA Corporation的 H100。

AMD首席执行官苏姿丰在Computex主题演讲上表示最新的MI325X加速器将于2024年第四季度上市。

即将推出的MI350芯片系列,预计将于2025年上市。与现有的MI300系列人工智能芯片相比,MI350在推理方面的性能预计将提高35倍。

而阵量的产品有关GPGPU(通用GPU),对标AMD的MI芯片。

目前国内企业的代表主要是壁仞、燧原。

其中壁仞BR100采用2片基于7 nm工艺的完整功能芯粒组合使用,再封装 4片HBM2E。这款芯片获得了世界人工智能大会的SAIL奖,标志着其在全球市场上获得认可。

燧原DTU1.0则主要是在其GPGPU芯片封装里集成了HBM内存芯粒。

03

禁令下的国产GPGPU替代机遇

传统CPU如同全能小能手,能处理各类任务,但面对大规模并行计算时,效率欠佳。而GPGPU芯片擅长并行处理海量数据,在计算密集型任务上优势显著。

GPGPU 广泛应用于人工智能领域、商业计算和大数据处理领域。在人工智能领域,机器学习、深度学习模型训练需要进行海量矩阵运算,GPGPU芯片凭借其强大的并行计算核心,能在短时间内完成复杂计算,大幅缩短训练时间。GPGPU可以用于深度学习模型的训练和推理,加速图像识别、语音识别、自然语言处理等任务。

科学研究领域也离不开GPGPU芯片的助力。在计算化学中,模拟分子结构和化学反应过程,数据量巨大且计算复杂。GPGPU芯片能够高效处理这些数据,帮助科研人员更快地探索新的药物分子、材料特性,加速科研进程。

AMD的MI系列芯片主要应用于人工智能领域,如深度学习模型的训练和推理。这些芯片在处理大规模数据集和运行复杂算法时表现出色,适用于大型语言模型的训练与推理。

阵量科技同样瞄准人工智能领域,迅速切入GPGPU芯片领域。

当前,GPGPU领域仍面临着垄断和渠道受限。高端2.5D/3D封装技术仍被台积电CoWoS垄断,国内长电科技、通富微电的工艺成熟度落后1-2代。

美国芯片禁令导致7nm以下代工流片渠道受限,壁仞科技BR100芯片被迫采用成熟制程组合,性能仅为英伟达A100的70%。

美国的芯片禁令主要限制英伟达、AMD向中国出售GPGPU。此举导致中国高算力芯片供应不足,一定程度上限制了中国人工智能业的发展。不过同时也刺激了中国GPGPU的国产替代,为GPGPU国产打开了市场大门。

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部