(文/朱秩磊)ChatGPT为代表的AIGC 引发AI计算中心需求井喷,英伟达高性能GPU成为了新一轮AI掘金热的硬通货。如果AI进步的瓶颈在于算力,那么现阶段计算能力的主要限制则是英伟达的GPU供应能力,随着需求持续攀升,其生产正越来越受限于台积电CoWoS的产能。
尽管台积电在最新的业绩说明会中强调不认为在 AI 能在今年下半年驱动半导体需求恢复增长,但仍然为英伟达等主要AI芯片的客户启动了CoWoS产能扩张计划。然而远水救不了近火,CoWoS严重短缺的当下,谁有机会分得一杯羹?
代工、封测产能过剩,CoWoS缘何逆袭?
2022年下半年以来,半导体行业景气度急转直下,过高的产业链库存,使得除汽车领域之外的大部分代工、封测市场进入了产能过剩的状态。近期TrendForce的数据显示,与前两年的订单满载截然不同的是,当前各大晶圆厂的产能利用率未达到峰值。8英寸晶圆产线中,台积电、联电、世界先进、力积电和中芯国际(约当8英寸晶圆)的产能利用率预计分别下降至97%、80%、73%、86%和79.5%;12英寸晶圆产线,台积电、三星、联电产能利用率分别下降至96%、90%、92%。
封测方面,IDC最新研究显示,由于封测厂仍处于清库存阶段,上半年产能利用率大部分维持在50%-65%,随着库存调整后的需求温和复苏,下半年有望回升至60%-75%,甚至来自先进封装的部分急单能让产能利用率提升至80%,然而仍与2022年的70%-85%仍有差距。
然而就在这样的颓势下,台积电连月来不断传出CoWoS先进封装产能告急的声音。究其原因,正是ChatGPT为代表的AIGC驱动英伟达、AMD等公司的高性能计算芯片GPU、CPU等需求井喷,而这些芯片大多采用了台积电的CoWoS封装。
TrendForce最新报告指出,目前主要由搭载英伟达A100、H100、AMD MI300,以及大型数据中心厂商如谷歌、AWS等自主研发的AI服务器成长需求强劲,预计2023年AI服务器(包含搭载GPU、FPGA、ASIC等)出货量预估近120万台,年增率近38%,AI芯片出货量同步看涨,可望成长突破五成。
在全球对于AI数据中心算力的旺盛需求推动下,英伟达的GPU订单也在不断飙升,其最高端的H100在明年第一季度之前都是售罄状态。为此,英伟达近月来都在争取台积电对其A100、H100等AI GPU的产能支持,同时亚马逊AWS、博通、思科和赛灵思等公司也都提高了对台积电的产能需求。这些芯片无一例外都使用了台积电的CoWoS封装。
英伟达A100 SEM扫描图 来源:semianalysis
例如英伟达H100采用台积电4N工艺、CoWoS-S 2.5D封装。芯片流片在台积电位于台南的Fab 18厂,与其N5工艺共用相同的机台,由于PC、智能手机和非AI相关数据中心芯片的需求严重疲软,台积电N5工艺的产能利用率降至70%以下,因此H100的晶圆生产没有任何问题,甚至因吸收了台积电的闲置先进产能而获得一些定价优势。而这些流好片的晶圆(WIP)存放在晶圆库中,等待CoWoS产能才能继续封装成为最后的成品。
供应链消息显示,仅英伟达今年对CoWoS的需求就达到4.5万片,比年初预计的3万片大幅增加了50%,台积电原本产能就不多的CoWoS湿制程更难以满足如此庞大的需求。
AI推动HBM成存储厂商救命稻草,但产能难以即时满足
除了CoWoS产能,HBM(高带宽存储)也正成为限制AI处理器的另一个重要瓶颈。
用于数据中心中的GPU,扩展内存带宽越来越重要,尤其AI服务器中推理和训练工作负载是内存密集型的,随着人工智能模型中参数量的指数级增长,仅模型权重参数的大小就已达到TB级。因此,AI处理器的性能受到从内存中存储和检索训练和推理数据的能力的制约,这就是俗称的“内存墙”问题。
集微分析师指出,由于HBM拥有比DDR SDRAM更高的带宽和更低的耗能,已经成为HPC处理器的首选内存技术,现阶段没有其他替代选择,在高端AI服务器GPU搭载HBM芯片更已是主流。比如英伟达A100,H100,以及在最新整合CPU及GPU的Grace Hopper芯片中,单颗芯片HBM搭载容量提升20%,达96GB;AMD更是大量采用HBM,其中MI300搭载HBM3,MI300A达128GB,更高端的MI300X则提升了50%,高达192GB。而谷歌在下半年推出的TPU张量处理器,据传也搭载HBM存储器,以扩建AI基础设施。
这极大地推动了HBM的技术更新以及市场增长。作为新一代内存解决方案,HBM市场被SK海力士、三星、美光三大DRAM原厂牢牢占据。TrendForce调查显示,2022年HBM市占率分别为SK海力士50%、三星约40%、美光约10%,预计2023年全球HBM需求量将年增近六成,达到2.9亿GB,2024年将再增长30%。
作为HBM的先驱,SK海力士在技术和市场占有率上都更胜一筹,是最新一代的HBM3的唯一大批量供应商,市场份额超过95%,今年将推出具备8Gbps数据传输性能的HBM3E样品,并将于2024年投入量产。与此同时,三星和美光也将HBM作为下一步业务增长的关键动力。三星表示将投资1万亿韩元扩大HBM产能,并于今年推出HBM3产品;美光预计其相关HBM产品“将在2024财年贡献有意义的收入,并在2025年贡献大幅增加的收入”。
在存储市场仍处于寒冬的背景下,几大存储厂商在过去一段时间都进行了减产动作,而HBM的需求突然降临无疑被其视为“救命稻草”。不过,虽然这三大存储芯片制造商正将更多产能转移至生产HBM,但由于调整产能需要时间,很难迅速增加HBM产量,预计未来两年HBM供应仍将紧张。
由于GPU核心与HBM堆栈通过CoWoS封装在同一基板上,HBM的产能紧张也在一定程度上限制了AI处理器的出货。
CoWoS产能不足,哪些厂商有望受益?
在产能需求持续升级之下,台积电才从一开始的保守转而在Q2业绩法说会上确认将积极扩充CoWoS产能,将投资900亿元新台币(约28.7504亿美元)打造位于竹科铜锣园区的先进封装厂,预计2026年底建厂完成、2027年第三季开始量产,月产能达11万片12英寸晶圆,涵盖SoIC、InFO以及CoWoS等先进封装技术,同时将明年的CoWoS月产能提升至今年的2倍。
CoWoS是台积电于2011年发布的2.5D先进封装技术,至今已演进至第六代,根据不同的中介层主要分为CoWoS-S(硅中介层)、CoWoS-R(RDL中介层)、CoWoS-L(LSI+RDL中介层)三种。
简单来说,CoWoS是先将芯片通过Chip on Wafer(CoW)的封装制程连接至硅晶圆,再把CoW芯片与基板连接,整合成CoWoS。利用这种封装模式,使得多颗芯片可以封装到一起,通过硅中介层互联,达到了封装体积小、功耗低、引脚少的效果。
台积电CoWoS-S
“其核心关键技术包括中介层、RDL、TSV、μBump等,需要前后道工艺结合,挑战在于散热、芯片间的信号串扰和延迟、设计布局以及可靠性等问题。”集微咨询分析师指出。
多年来,台积电针对CoWoS技术的开发重点之一是支持不断增加的硅中介层尺寸,以支持构建在中介层之上的处理器和HBM堆栈,而面临产能紧张的一个重要原因,正是中介层的生产以及相关设备的供应紧张。因此,台积电才会传出需要寻求合作,并可能外包给合作伙伴。
目前,日月光、安靠、联电和三星等厂商都被指因台积电产能紧张而受益,那么究竟谁能分得一杯羹呢?
根据台媒消息,英伟达从6月下旬起,已开始推动台积电向传统封装厂商合作伙伴发送硅中介层载板产能需求,并同步推动联电扩大2024年硅中介层载板产能;同时近期安靠和日月光均在与CoWoS设备供应商密集洽谈,很可能意味着将进行扩产。
CoWoS工艺流程 来源:Counterpoint Research
其中,一种方案是台积电完成晶圆和中介层生产,即CoWoS的“CoW”部分,然后交由自家(比如空余InFO产能)或别家封装厂完成“oS”部分;另一种方案是联电生产硅中介层,即“Co”部分,再送往安靠或日月光完成“WoS”部分。
先进封装技术专家王为(化名)对集微网分析,CoWoS生产拆分成两个部分是可行的,但是涉及到很多工艺的know-how,并且材料成本很贵,“能做”和“能做好”有很大的差别。“客户的SoC Die、HBM堆栈等成本都很贵,如果良率不佳,将导致最终封测成品价格远高于台积电。”他指出,“如果一个完整流程涉及不同公司,或半成品在不同厂房之间运输,也会带来商务纠纷的风险以及运输方面的麻烦。”
联电2.5D硅中介层解决方案
比如联电,最近在先进封装方面频频发力。根据该公司官网资料,联电是全球首个提供硅中介层制造开放解决方案的代工厂,即通过联电+OSAT的合作模式,由联电完成前段2.5D TSI硅中介层晶圆(FEoL+TSV+FS RDL),然后交由封测厂完成中段MEoL和后段BEoL工序。
在7月28日的日月光法说会上,该公司已经证实,正在与代工厂合作中介层相关技术,并具备CoWoS整套制程的完整解决方案,预计今年下半年或明年初量产。
不过,相比台积电,联电目前在中介层方面的产能仍然很小,原因之一与台积电一样,均是TSV所需刻蚀(DRIE)设备不足,并且由于在封装间距方面的限制,联电暂时只能做A100。
集微分析师指出,虽然各家的2.5D工艺,对应的中介层层数、TSV的尺寸、所用的材料、曝光次数及效率的差异都会影响最终成本,在某种程度上也是资金实力的竞争,因为高端设备十分昂贵,买得起更好的设备生产出来的产品也更好。在这方面,台积电因为先进制程的优势自然也具备更高端的设备。“CoWoS需要在晶圆上对芯片进行更精确的堆叠和互连,因此更高精度的电镀等先进设备必不可少。”
例如,硅中介层的最大尺寸受掩模版的曝光尺寸限制,因而与所用的光刻机种类相关。根据此前台积电公布的CoWoS路线图,今年推出的第六代CoWoS_S工艺,硅中介层尺寸达到了3400mm2左右,可支持更多HBM堆栈,而这无疑对光刻机提出了更高要求。此外,TSV的制作挑战在于高深宽比的通孔和高密度引脚的对齐,生产过程中包括深孔刻蚀、气相沉积、铜填充、CMP、晶圆减薄、晶圆键合等工艺涉及的设备均与TSV性能息息相关。
CoWoS的潜在替代方案?
另一位业内专家大可(化名)告诉集微网,与台积电CoWoS类似的2.5D先进封装技术还有三星的I-Cube/H-Cube、日月光的FOCoS-Bridge、英特尔的EMIB等。
三星的I-Cube包括I-CubeS和I-CubeE量子方案,最新一代的I-CubeS,I-CubeS 8的硅中介层拥有3倍标线尺寸,可容纳8个HBM堆栈和2个逻辑裸片;I-CubeE支持嵌入式硅桥裸片,对大中介层而言,更具成本效益。H-Cube是三星推出的另一种2.5D封装解决方案,主要是采用面积较小的ABF基板或FBGA基板叠加大面积的HDI基板的方式,来解决当前PCB严重短缺的问题。
三星I-Cube/H-Cube
“虽然三星在2.5D先进封装方面已经布局多年,百度2018年推出的第一代百度昆仑AI芯片正是基于三星14nm工艺及I-Cube封装解决方案,但是前道代工业务较弱也在一定程度上影响了其先进封装业务的进展,因而至今客户仍然很少。”大可指出。不过随着台积电CoWoS短期内难以满足客户需求,三星有希望能接到部分订单,并且三星的优势在于它是唯一一家拥有从内存,处理器芯片设计、制造到先进封装业务组合的公司。
日月光FOCoS-Bridge
日月光方面,除了与代工厂合作完成2.5D封装,也在开发自己的完整解决方案。该公司在今年5月底推出了FOCoS-Bridge,在70mmx78mm尺寸的大型高效能封装载板中,包含两颗相同尺寸47mmx31mm的FOCoS-Bridge的扇出型封装结,可通过8个硅桥(Bridge)整合2颗ASIC和8个HBM堆栈,面向AI和HPC应用。日月光强调,FOCoS-Bridge可提供与硅中介层相似的电气、信号和电源完整性性能,但成本更低,并且没有掩模版尺寸限制。
最后,大陆整体封装产业尽管已跃居全球领先地位,但是在以TSV为代表的2.5D/3D等先进封装领域仍然较为薄弱。尤其当前采用2.5D/3D先进封装的芯片都是前沿先进工艺制程,线宽和芯片间距越来越小,比如当下主流的HBM3对线宽的最低要求是1.8/1.8μm,目前只有代工厂有能力在硅中介层上将线宽降至1.8/1.8μm以下,封装厂还不具备这一能力;国内封测龙头长电科技披露的XDFOI平台当前可以实现3-4层高密度的RDL走线,其中介层线宽/线距最小可达2μm。
而根据集微咨询发布《2022年中国集成电路封测产业白皮书》,2022年中国大陆本士综合性封测企业营收TOP10中,仅有长电科技、通富微电、华天已具备2.5/3D封装能力。据悉,国内在这一领域的主导者和主要推动者是H公司。
长电科技XDFOI
当越来越多的国产大模型进入到追赶GPT的队伍中,在进口高性能AI处理器受限的情况下,国产GPU的发展有望迎来随着巨大的算力需求缺口而产生蝶变,这就要求下游制造、封装技术也尽快提升,为突破AI领域的封锁补齐短板。并且,在国内先进制程发展受阻的情况下,加速2.5/3D等先进封装领域的追赶才能尽力弥补先进制程能力不足的遗憾。