全球半导体产业正在以前所未有的速度扩张。麦肯锡的分析表明,到2030年,该行业将以每年6%到8%的速度增长,届时年销售额将达到1万亿美元大关。
终端市场对计算、数据存储、无线通信和人工智能等用途的需求约占这一增长的60%。其余部分来自需要成熟节点(8英寸或6英寸)的行业,如汽车、工业和有线通信领域。虽然需要尖端芯片的终端市场(如计算和人工智能领域)的动态可能会造成需求的小幅波动,但至少在未来十年内,半导体行业将实现整体增长。
该行业的发展伴随着投资。在过去的20年中,领先的12英寸晶圆在研发和运营最佳实践方面获得了大量投资,这使得提高制造能力变得相对容易。但对于8英寸或更小的晶圆平台(常用于汽车、工业和有线通信),情况就不同了。
在这些平台上制造的芯片被称为“成熟节点”,历来需求固定,增长平缓。但是,当终端市场的巨大需求将成熟节点的制造设施——即“晶圆厂”——推向满负荷生产时,情况就发生了变化。
许多晶圆厂需要迅速提高产能,还有一些需要提高性能,以尽量减少因维护而停工的成本。但大多数拥有成熟节点的晶圆厂至少已有20年的历史,其设备、工艺和生产率也与之不相称。
在这种情况下,工厂的效率对于满足市场需求和成本预期就显得尤为重要。潜力是巨大的。根据麦肯锡的经验,提高设备的可靠性可以帮助工厂将工具可用性(一台设备准备好处理来料的时间比例)提高15%以上。当应用于瓶颈问题时,约70%至80%的改进将转化为工厂的整体设备效率(OEE)(生产运营利用率相对于其全部潜力的整体衡量标准)。因此,工厂可以在不增加工具或扩大占地面积的情况下,迅速利用大量的潜在能力,通常可提高10%以上。
受访者对公司产生负面影响的各种因素的态度分析(从非常负面到非常正面)
要做到这一点,就必须在思维方式、流程和系统上做出重大改变,从被动反应转向预防和提前规划。工厂领导者需要优先考虑设备恢复,进行持续的计划维护,并有效管理零部件。本文的见解将为8英寸或更小的晶圆平台带来最大益处,但这些概念适用于所有半导体工厂。
旧习使工厂处于被动模式
许多运行成熟节点的工厂尚未采用最新的数据管理系统、精益生产流程和实践以及“工业4.0”工具。多年来的成本削减和人才流失造成的机构知识流失削弱了生产车间的能力。这些因素综合在一起,使得应对维护问题变得困难重重,而且在发生问题时效率低下
随着时间的推移,由于缺乏有计划、有组织的行动,许多工厂陷入了反应性维护的怪圈,导致工厂整体可用性降低,晶圆产出减少。根据麦肯锡的经验,一些工厂的维护率(M-ratios)已经低于1.0,这意味着计划外维护时间超过了计划内维护时间。这种“救火”式的维护工作分散了对战略性维护计划的规划和实施的注意力和资源。如果计划外维护的时间大大超过计划内维护的时间,那么实际上是工具在控制维护组织,而不是相反。实现季度出货目标的压力会增加制造团队的压力,而这并不总是有利于严谨地解决问题。结果就是对问题做出反应,导致停机时间延长、故障重复发生、工具可用性降低,最终影响晶圆产出。
除了工具性能、晶圆装载和质量之外,工具可用性也是影响OEE的关键因素之一。工具可用性有时会下降,但决策者对此的反应至关重要。
从理论上讲,决策者和实践者应制定并实施有效的计划维护时间表,随着时间的推移降低意外维护的频率。实际上,这样做很困难,因为流片中的各个步骤是相互依存和复杂的,设备也是如此。因此,麦肯锡观察到,在40%到70%的工具故障情况下,管理人员都会专注于“救火”故障排除工作。这种做法必然促使他们优先考虑短期效益。在其余的情况下,管理人员可能会尝试实施一项计划,但这些努力往往注定要失败,因为“救火”消耗了过多的资源。
改善晶圆厂的可用性
在大多数情况下,可以通过解决计划外维护来提高工具可用性。一个小时的计划内维护通常可以节省三到四个小时的计划外维护。
一流的半导体工厂维护计划包括三个基本要素:通过短环根本原因分析(RCA)快速解决问题、建立坚实的计划维护基础以及高效管理零件。
通过短环RCA快速解决问题
短环根本原因分析是一种敏捷的问题解决技术,可以帮助团队分解原因并生成解决方案,它可以帮助团队就工具停机的主要原因达成共识,并制定解决计划。这种方法可以解决中等复杂程度的维护问题,这些问题约占纠正性维护中出现的问题的一半。
半导体工厂团队可以利用短环RCA找到解决特定工具问题的最佳方法。
对于需要进行根本原因分析的每台设备,团队都将明确指出需要解决的问题,并评估其频率和影响。小组还将确定调查问题所需的内部和外部资源。
下一步是收集有关设备的历史数据,与相关机器技术人员再次确认问题的性质,并确定任何相邻的问题。
为了开展RCA,工作团队将聚集在一个专门的场所,提出假设,采用五项原因分析法(一种特殊的询问式问题解决技术,用于确定问题的根源),对可能的根本原因进行优先排序,并集思广益找出潜在的解决方案。这项工作的结果可能是一个可能成功的行动方案。如果不成功,团队可以重新使用历史数据来产生洞察力,从而转化为解决方案。
最后,团队将实施他们的解决方案并跟踪其效果。这里的记录至关重要,尤其是当团队了解到某台设备的问题是否是系统性的,以及是否会对其他业务领域产生影响(如工厂的战略备件)时。
模糊逻辑等分析框架(使用一组模糊设备注释来识别关键的工具停机问题)可以帮助团队根据停机时间和频率识别最常见的问题。必要时,还可召集包括供应商和工具供应商在内的特设团队召开研讨会,重点找出每个问题的根本原因。
实施这些习惯需要合适的专业知识、资源、纪律和执行力。拥有这种统一框架的一个好处是,晶圆厂团队可以利用已有的人才,它还有助于抵消有经验员工流失的影响。工厂团队可以分配资源,全面解决团队发现的任何问题,这样每个问题只需解决一次。从经验中获得的知识可用于培训员工和解决未来的问题。
打下坚实的计划维护基础
有效的计划维护项目可将工厂可用率提高5到7个百分点。虽然回报丰厚,而且步骤简单明了——规划、实施和持续改进,但在许多工厂,计划性维护计划很难持续建立。耗费资源的救火工作现状和过时的维护程序是一个障碍。
自上而下的承诺、问责制以及领导工作的利益相关者的支持,都有助于计划性维护项目的扎根。一个成功的计划性维护项目的基础是让制造团队有机会逐步采用正确的做法。每个流程节点都能让团队认识到其有效预防工作的影响。针对不同任务的标准和评级(如铜级、银级和金级)可以激励团队不断改进,实现更高水平的绩效。
最成功的项目每周都会召开团队会议,审查通过关键绩效指标衡量的进展情况,并进行反馈,帮助团队制定进一步改进的计划。在这些项目中,计划包括提前安排维护工作并通知相关利益者。最有效的团队会安排未来两周的维护活动,并至少提前十天通知利益相关者。
实施阶段的重点是与利益相关者进行沟通,消除计划维护活动的障碍。一流团队每班至少检查两项计划维护活动,并在30分钟内解决路障。
从那时起,持续改进就是一个不断采用或拒绝可能的改进的过程。效率最高的团队会在收到建议后一周内做出采纳或拒绝的决定,这样新建议就能迅速融入他们的工作方式。
有效管理
设备的零件管理可能是影响工厂可用性的隐形杀手,因为更换零件并不总是与严重问题相关联。但是,解决方案(这里指的是零部件)的延迟或不可用会延长或恶化最初的问题。采购团队可能需要寻找替代供应商,库存中的零件可能无法入账,多个团队或团队成员可能在没有协调或明确责任的情况下处理相同的问题。
一个零件的缺失或延迟可能导致工具停机,其停机时间比零件有库存时的预期停机时间长达六倍。在整个工厂中,零件管理是一项无止境的挑战,也是一项至关重要的挑战。
由于与零部件管理相关的挑战是多变的,而且往往是无止境的,因此必须重点识别正确的问题。由于许多不同的原因,经常会出现脱节。因此,采购团队最终可能会把重点放在采购非优先部件上,而关键的、阻碍工作的部件库存却仍未填补。
控制塔——一个利用实时数据快速做出决策的跨职能团队——可以帮助分析问题,创建和实施有关零部件管理的解决方案。控制塔可以透明地解决眼前的问题,并提供系统性的解决方案,这些解决方案随后将成为改善流程和管理供应商的战略工具集的一部分。由于半导体供应链的复杂性和地区特殊性,零部件管理风险团队将成为控制塔的重要操作人员。
半导体的需求将继续增长,晶圆厂也感受到了压力。缓解压力的方法之一,特别是对于生产8英寸及以下晶圆的工厂来说,就是从“被动灭火”转变为主动管理设备恢复、计划维护和零部件管理。整个工厂——更不用说全球半导体行业——都将从中受益。