【推手】三星Q2财报:利润暴增15倍 HBM成最大推手;

来源:爱集微 #芯片#
1.4w

1、三星Q2财报:利润暴增15倍 HBM成最大推手

2、鸿海6月销售额达4907.3亿新台币,同比增长16.1%

4、三星电子改组,新设HBM芯片独立研发团队

5、传特斯拉因资金压力,印度设厂计划陷入停滞状态

6、日韩半导体材料再次合作,韩国氟化氢进口额1~5月同比大增48%

7、定向FAST和旋转BRIEF(ORB)特征检测加速了视觉SLAM


1、三星Q2财报:利润暴增15倍 HBM成最大推手

坐上AI时代的列车疾行,三星终于迎来了扬眉吐气的时日。

在7月5日公布未经审计的第二季度初步财报显示,三星第二季度营收达到74万亿韩元,同比增长23.3%;营业利润为10.4万亿韩元(约合75亿美元),远远超出此前预期的8.3万亿韩元,较去年同期6700亿韩元更是暴增约15倍,创下了2022年三季度以来最高单季营业利润。

可以说,三星取得了多年来最好的营收和利润增长表现,亦反映出随着全球AI发展加速,三星凭借强劲复苏的存储器需求和代工业务的精进,有望在新一轮工业革命中再次上演新的“喜剧”。

存储器价格上扬成最强推手

2023年,三星可谓是全面承压。年报显示,全年营业利润为6.567万亿韩元,同比减少84.86%。这是三星全年营业利润自2008年全球金融危机以来时隔15年跌破10万亿韩元。这种下滑很大程度上是由于一直支撑其业绩的半导体业务因行业衰退而遭受了巨大损失,以及智能手机业务遭遇市场的逆风。

在4月份三星公布的第一季度财报也寒气袭人,第一季度营收约合476亿美元,同比下滑18%;利润仅约合4.78亿美元,同比暴跌95%;净利润约合11.7亿美元,同比暴跌86.1%。营收和利润双双大幅下挫,且创下14年以来新低,今年第一季度财报堪称是三星14年来最糟糕的季度业绩。

而到了第二季度,却统统一扫“阴霾”,终迎来了AI炽热市场下的暖意。

这一结果凸显出在AI的热潮推动下,全球内存市场正在从疫情后的严重低迷中反弹,价格在快速上涨。里昂证券估计,今年第二季度,数据中心和AI需求推动内存芯片的平均价格较上一季度上涨了15%,成为三星的最大“利润池”。

三星将于7月31日公布包括各部门明细在内的最终业绩报告。分析师预计,三星半导体(DS)部门第二季度的营业利润将在5万亿韩元左右,占据三星利润的半壁江山,并将是今年第一季度(1.91万亿韩元)的两倍多。

但从其他业务来看,扩大盈利仍面临一定的压力。分析认为,随着主要用于智能手机的半导体成本上升,三星移动和网络业务部门第二季度的营业利润将比第一季度(3.51万亿韩元)有所下降。此外,除存储器之外的其他半导体部门如代工和系统LSI,由于投资扩大以及客户拓展遇阻,盈利表现还需进一步观察。

仍面临内忧外患

尽管三星正受益于更广泛的行业复苏,但这家巨头并非高枕无忧。

在AI热潮中关键的HBM领域,三星就面临着SK海力士和美光的强劲竞争。要知道,HBM是AI芯片中占比最高的部分,根据外媒的拆解,H100的成本接近3000美元,而其中占比最高的是来自海力士的HBM,总计达到2000美元左右,超过制造和封装,成为成本中最大的单一占比项。

HBM经历了几代发展,已进入到第四代HBM3和第五代HBM3E。在目前一代的AI芯片当中,各家基本已相继采用了第五代HBM3E。三星由于跟进不力,使得老对手SK海力士在很长一段时间内成为英伟达HBM的独家供应商,在2023年SK海力士基本垄断了HBM3供应,今年其HBM3与HBM3E的订单也已售罄。加之美光也不断加码,于2023年9月宣布推出HBM3E,计划2024年大批量发货的同时透露英伟达是主要客户之一。

据TrendForce统计,2023年SK海力士、三星和美光分别占据了HBM市场的53%、38%和9%的份额。而目前的战况也更加激烈:SK海力士计划于第三季度提前量产12层HBM3E,旨在强化市场领先地位。三星已启动8层HBM3E的大规模生产,预计二季度末实现收益。美光正采取大胆的策略计划在2025年将占有率提高到20%至25%之间。三星如何应对SK海力士的攻势以及未来美光的反攻?

除HBM外,三星也在强力扩大DDR5等高附加值产品的开发与销售,以改进盈利。在DRAM业务方面,将量产1b纳米级DDR5产品。围绕NAND业务,将率先进入移动QLC市场,并引领Gen5 SSD市场在生成式AI方面的应用,满足客户对高密度存储的需求。

如果说存储器领域三星还能一振雄风,那在工艺层面三星的表现却相对黯然。三星虽在3nm先声夺人,但台积电以其稳健的技术策略以及良率的持续提升后来居上,在3nm市场三星已然处于下风,三星能否凭借后续的2nm、1nm以及在全力打造的AI平台方案,在未来的比拼中能否挽回颓势仍未可知。

随着先进封装也成为AI芯片提升算力和带宽的必备利器,三星也在积极开发其3D封装技术X-Cube,并表示将在2024年量产。同时,其为AI芯片开发的最新3D封装技术SAINT也渐行渐近。三星得天独厚的优势在于可通过整合工艺、HBM和先进封装提供一站式AI服务,有消息称三星有可能赢得AMD的下一代AI芯片订单,而且还在与英伟达对第五代高带宽内存HBM3E进行质量测试。但3nm的良率提升、2nm的研发、先进封装攻坚等等,仍需要三星持续输血。

此外,三星自身也存在管理方面的内忧:就在三星公布业绩的几天前,三星工会组织者计划在其28000多名成员中举行为期三天的罢工,其中包括主要芯片工厂的成员,原因是工资纠纷。上月,该公司发生了一场涉及少数员工的罢工,这是该公司成立55年来的首次罢工。

今年年初三星已开始全面“押注”AI。三星联合首席执行官兼副董事长Han Jong-hee(韩钟熙)在公司内部称,三星必须引领潮流,提供最直观、最便捷、最安全的Al技术。三星在生成式AI时代将诉说什么样的“芯”故事?


2、鸿海6月销售额达4907.3亿新台币,同比增长16.1%


7月5日公布数据显示,鸿海6月销售额达4907.3亿新台币,同比增长16.1%;预计第三季度将实现季度环比和同比增长;第二季度营收为1.55万亿新台币,同比增长19.1%。

鸿海表示,基于目前已经进入下半年旺季,营运将逐渐加温,展望第三季营运将会有季增及年增的表现。

值得提及的是,鸿海精密在近日举行的创立50周年股东大会上宣布,将积极进军纯电动汽车(EV)领域,并寻求与日本传统汽车厂商建立合作关系,鸿海将利用在为美国苹果生产iPhone的过程中培育起来的代工模式,为日本车企提供EV代工服务。

此外,鸿海还在人工智能(AI)服务器领域寻求增长机会。公司计划扩大在该领域的代工业务,并延伸至供应链领域,提供包括印刷基板、连接器和冷却装置等在内的关键零部件。AI服务器有望成为鸿海下一个重要的增长点。

4、三星电子改组,新设HBM芯片独立研发团队




据韩国业界消息,三星电子7月4日宣布进行大规模改组,新设一个全新的HBM(高带宽存储器)研发团队,力争在半导体领域保持领先地位。

三星负责半导体业务的DS(设备解决方案)部门当日宣布进行改组,新设HBM研发组。三星电子副社长、高性能DRAM设计专家孙永洙(音译)将担任该研发组组长,带领团队集中研发HBM3、HBM3E和新一代HBM4技术。这一举措旨在满足人工智能(AI)市场对高性能存储方案激增的需求。

据了解,2024年早些时候,三星电子已成立一个特别工作组来提升HBM竞争力,7月新设立的团队将整合并提升现有的努力。

三星电子自2015年以来,一直在存储其存储业务部门运营一个HBM开发组织。2024年2月,三星电子实现重要里程碑,开发出12层堆叠HBM3E存储芯片,该芯片拥有36GB容量。目前HBM3E 8层、12层产品已交给英伟达进行质量测试。

据业界消息,三星电子此次改组,还对先进封装(AVP)团队和设备技术实验所进行重组,以提升整体技术竞争力。

三星电子2024年5月21日宣布了一项重大人事变动,任命未来事业计划团部长(副会长)全永铉(Jun Young Hyun)为DS部门负责人,取代庆桂显(Kyung Kye-hyun)。据了解,近期,三星电子还面向HBM等新一代DRAM内存控制器开发、验证等800多个职务招聘有经验的员工。

5、传特斯拉因资金压力,印度设厂计划陷入停滞状态




7月5日,市场消息称,特斯拉马斯克推迟4月下旬印度访问后,其团队已停止与印度方面的沟通,特斯拉印度投资造车计划可能陷入停滞状态,报道援引印度政府方面消息报道称,目前特斯拉正面临资金压力,短期内无法在印度投资。

与推迟印度访问不同,马斯克于4月28日访华,分析称,马斯克此行主要讨论在中国的特斯拉汽车上允许启用“完全自动驾驶”(FSD)功能。

中国是特斯拉电动汽车的第二大市场,中国本土车企如小鹏汽车,均试图通过类似的自动/辅助驾驶功能与特斯拉竞争。特斯拉此前已采取措施,向中国有关部门保证将在中国推出自动驾驶汽车,包括在上海建立一个数据中心,根据相关法律处理中国消费者的数据。

截至目前,特斯拉仍是全球最赚钱的电动汽车公司,数据显示,特斯拉Q1归母净利润为11.29亿美元,同比下降55%;经营活动产生的现金流净额为2.42亿美元,上年同期为25.13亿美元,同比下降90%;现金及等价物合计268.63亿美元,同比增长20%。

在销量上,虽然面临中国同行的竞争,但特斯拉仍是全球最大的电动汽车制造商,特斯拉Q2合计交付新车44.4万辆,其中,Model 3和Model Y合计交付42.24万辆,其他车型交付2.16万辆;而比亚迪Q2纯电动乘用车销量为42.6万辆,略低于特斯拉。

6、日韩半导体材料再次合作,韩国氟化氢进口额1~5月同比大增48%




据日本业界报道,自从日本于2019年7月加强针对韩国的氟化氢(HF)、光刻胶等半导体材料出口管制以来,两国相关产品进出口贸易额持续低迷,部分曾降至零。不过随着2023年解除这一措施,2024年1~5月,韩国的氟化氢自日本进口额同比大增48%。

日资设备制造商表示,日韩关系改善,使得经营者和技术人员往来增加,公司营业收入也有所增加。

2019年,在日本实施出口管制措施的背景下,韩国推进半导体材料的国产化替代,部分半导体制造工序开始使用韩国本国产品。韩国半导体相关人士表示,2019年正是三星宣布在尖端半导体代工领域与台积电正面对决的时机,“由于越来越难以采购到日本生产的高品质材料,结果导致三星在尖端产品的量产技术等方面与台积电的差距扩大。”

根据韩国央行统计,2024年5月韩国国际收支经常项目顺差89.2亿美元,出口额同比增长11.1%,为589.5亿美元。其中,半导体出口额同比增长53%,半导体、运输设备、半导体制造设备等资本货物进口减少3.3%。

7、定向FAST和旋转BRIEF(ORB)特征检测加速了视觉SLAM




在智能边缘设备领域,信号处理和人工智能(AI)推断相互交织。传感需要强大的计算能力,以筛选出最重要的数据用于推理。同步定位和绘图(SLAM)算法,属于导航类型,需要在传感阶段进行复杂的图像处理,以检测特征。这些算法必须实时执行,并且需要快速完成特征检测。定向FAST和旋转BRIEF,即ORB算法,于2011年推出,是其中一种较快的特征检测算法。尽管如此,成本和功耗限制意味着底层硬件必须高效运作,软件必须同样经过优化,并且为了提高开发者的工作效率,必须易于使用。

SLAM(同步定位和绘图)在绘制环境地图的同时,还能评估移动代理的位置。自动驾驶汽车使用这种技术,其他设备,比如自主移动机器人(AMR)也可以使用,AMR是一种在仓库中移动物料的车辆。AMR是自动引导车辆(AGV)的后继技术,后者是一种较早的技术,沿着固定路径移动,例如由涂抹的条纹指定路径。与自动驾驶车辆类似,AMR也可以使用摄像头和其他传感器,为SLAM系统提供数据。



图 1.SLAM管线

前端的图像处理通过分析摄像头捕获的帧来识别特征点或兴趣点。算法或神经网络人脸或物体检测技术试图找到属于一组确定项目的事物,而视觉SLAM则不同,它没有这样一组预定义的项目。此外,SLAM会逐帧跟踪对象。这个过程很复杂,因为代理(可能也包括对象)是移动的,而且对象的外观在每一帧中都会发生变化,变得模糊、光照改变,或者出现缩放、平移或旋转。与此同时,前端处理必须跟上帧率。

特征检测是视觉SLAM的关键

视觉SLAM前端的三步核心挑战是在两帧之间找到对应关系。第一步是特征检测。特征也称为关键点或兴趣点,是图像中的一部分,其独特性足以从众多备选图像中识别出特定对象。特征检测的方法包括使用高斯差分识别最大值/最小值图像位置、使用角点检测器以及应用区域检测器。

要做到有效,特征检测必须在不同的图片中找到相同的兴趣点。类似的,第二步是生成表示相关特征的特征向量,这个过程必须产生一个独特的描述符,这个描述符在帧与帧之间的外观变化中要保持稳健性。第三步是匹配图像之间的描述符,具体方法是从第二幅图像中选择与第一幅图像中每个特征向量的数学差异最小的特征向量。

开创性的尺度不变特征变换(SIFT)方法实质上是将特征检测和描述符向量创建合并为单一的SIFT关键推导步骤。为了创建这些关键点,SIFT采用高斯差分,对一个图像进行多次卷积,这涉及到每个像素的浮点乘法和加法操作。进一步的操作包括计算梯度和旋转,以增强对光照和方向变化的稳健性。为了实现尺度不变性,SIFT复制并多次调整图像大小,构建金字塔结构,在每个金字塔级别上重复图像处理操作。

对于匹配步骤,SIFT比较每个关键点与第二幅图像中数百个相邻点,对位置、方向和比例预测相似的关键帧进行聚类比较。SIFT随后处理每个包含至少三个条目的聚类,使用线性代数(更多浮点运算)来验证聚类中的关键点确实匹配,即使第二幅图像中的物体出现明显的旋转、缩放或拉伸。

加速稳健特诊(SURF)方法旨在优化SIFT方法的速度,同时保持足够的稳健性和可重复性。在特征检测方面,它用一种更简单的盒式滤波器取代了高斯差分技术。而且,这种方法无需构建图像金字塔,只需通过应用不同尺寸的滤波器,不需要复制和调整图像大小,从而降低了计算复杂度。为了生成一个特征向量,SURF将图像分成以每个兴趣点为中心的区域,并为每个区域计算四个差值之和,然后将具有相似差值之和的区域聚类。在匹配步骤中,SURF通过检查从初始兴趣点开始沿半径的像素来解决旋转问题,从而进一步降低了复杂性。

ORB(定向FAST和旋转BRIEF)改进了特征检测

总体而言,SURF的计算需求比SIFT低。还有一种更高效的方法,那就是定向FAST和旋转BRIEF(ORB)。其开发者报告称,ORB比SURF快14倍,而SURF比SIFT快24倍;新算法的性能也差不多,在某些情况下甚至更好。对于特征检测,ORB采用了角点检测算法,即FAST(加速分段测试的特征)。

FAST算法简单快捷,它将一个像素与其周围的布雷森纳姆圆圈上的像素进行比较,首先对比该像素与圆圈上的N个连续像素相比,亮度是否有明显差异。若存在明显的亮度差异,则这是一个角点。为了优化关键点的选择,该算法使用非极值抑制(NMS)来识别和保留最独特的关键点。执行亮度比较所需的操作远少于计算高斯差分和应用盒式滤波器的总和。NMS的第二步只需处理特征清单,而不是图像中的所有像素,这也减少了计算量。为实现尺度不变性,ORB构建了一个图像金字塔,并对每一层应用FAST。在考虑特征点的方向时,ORB算法将像素的上下左右强度值相加,并进行比较。

ORB算法使用旋转BRIEF来计算特征描述符。在ORB中,BRIEF描述符是256位的向量。每一位表示在同一个31×31像素区域内,两个5×5像素窗口的平均强度之间的比较结果。在一个像素区域内有676个这样的窗口,因此可能的成对比较超过20万次。为了最大限度地提高描述符的区分能力,ORB从这20万个对比结果中选出离平均值最远、相互关联度最小的256个对比结果。与FAST类似,ORB算法修改了原始的BRIEF方法以实现方向不变性。为了简化这个任务,一旦确定了每个描述符所属特征的方向,ORB使用这些值来规范化描述符的方向。

在匹配阶段,ORB采用基于描述符位子集的简单哈希函数。算法将图像中的每个描述符分配到多个哈希桶中。为了匹配新帧中的描述符,ORB计算它将映射到哪些桶,并将其与每个桶中包含的描述符进行比较。

在Ceva平台运行的ORB特征检测

虽然听起来很复杂,但ORB速度快,因为它使用整数和逻辑运算代替浮点运算。许多操作可以进行向量化,例如比较5×5像素窗口和256位描述符。如果开发人员希望在PC或类似系统上运行的软件中加入ORB算法,会发现OpenCV中已经包含了该算法,Python中也有该算法。

像自动移动机器人(AMR)或其他车辆这样的生产系统,通常会使用定制芯片来取代PC,以降低功耗和成本。用C语言编译实现的ORB可以在芯片的CPU内核上运行,但并不实用,因为这要么需要与PC类似的强大硬件能力,要么无法满足实时要求。另一种方法是采用矢量DSP。矢量DSP专门设计用于移动数据和运行计算密集型算法(如ORB),效率更高。要实现这种优势,需要调整软件,同时注意保持算法的正确性。

幸运的是,Ceva的Vision AI DSP和SLAM SDK包含了一个针对其矢量DSP的ORB库。它提供一个与OpenCV实现类似的API,使用起来非常简单。而且,速度快。我们用Ceva Vec-C语言构建了该库,采用标准C代码和内置函数来提升性能和可维护性。在集成了Ceva SensPro DSP的SoC(系统片上集成电路)上运行时,基于ORB的SLAM实现比仅仅使用该芯片中集成的CPU运行快30倍。

在2024年的消费电子展(CES)上,我们展示了一款Van Gogh Imaging公司采用我们的ORB库并在SensPro上运行的视觉SLAM解决方案。如欲了解更多有关如何在您的计算机视觉项目中使用我们的ORB库、Ceva SLAM SDK或SensPro系列DSP的信息,请联系我们



责编: 爱集微
来源:爱集微 #芯片#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...