台積電的 7nm 製程曾一度陷入尷尬的處境,不過今年的 AI 熱潮解決了這一問題。本文源自遠川科技評論研究員葉子凌,由 元宇宙日爆 整理、重新撰稿。
(前情提要:摩爾定律掰!Nvidia宣告「黃氏定律」:AI晶片性能十年成長1000倍 )
(背景補充:解決AI晶片危機!OpenAI有意自研晶片,正評估潛在收購公司 )
今年 8 月,The Information 爆料了蘋果和台積電之間的 「甜心交易」(sweetheart deal): 蘋果下單了台積電 3nm 工藝,但台積電必須獨自承受報廢晶片的良率損失,這一舉措能為蘋果省下幾十億美元的成本 。
曾經蘋果和台積電被稱為 「最完美的合作關係」:藉由規模龐大的研發投入和資本開支,台積電在晶片製造上始終保持領先,蘋果則用大規模的訂單給台積電報銷開發成本,幫助其進一步擴大領先優勢。
然而,這個雙贏合作卻在這兩年出了些問題。
一方面,先進製程的開發成本越來越高,台積電也有點扛不住。另一方面,由於手機市場的萎靡,最爽快的兩大客戶蘋果和高通也難免囊中羞澀。
面對巨大的利潤壓力,台積電選擇先漲為敬。根據媒體報導進行估算,2023 年台積電的晶圓代工價格與兩年前相比大約上漲了 16%(先進製程)到 34%(成熟製程)。在過去十多年裡,台積電都從未大幅提價。
在台積電宣佈漲價後,蘋果曾以一貫的強勢態度表示堅定拒絕,幾經博弈之下,才有了那份 「按良率付費」 的協議。
去年 10 月,台積電還頗有先見之明的表示,預計 2023 年整個半導體行業可能會下滑,於是下調資本開支至 360 億美元。
結果兩個月後 ChatGPT 橫空出世,全世界的 AI 晶片公司又把台積電送上了神壇。
昂貴的進步
今年 9 月蘋果釋出會結束,頂著 「首個 3nm 製程晶片」 的 A17 pro 問世,10% 的 CPU 效能提升讓人忍不住感嘆牙膏還能這麼擠。臺灣媒體第一時間出來為台積電甩鍋,表示主因在於蘋果的設計過於保守,加上 iPhone 散熱效率太差,影響了 3nm 製程的發揮。
為了 3nm 工藝節點,台積電不可為不盡力,創下歷史新高的資本開支就是最好的證明。
一般來說,晶片製程越先進,需要的生產環節也就越多,成本自然水漲船高。在一些特殊節點,由於生產工藝的徹底改變,原本的裝置和產線會被徹底淘汰,成本瞬間被拉高。
前者的代表就是刻蝕環節的增加:
所謂刻蝕,就是將光刻標記出來的區域,通過物理或化學方法去除,精準雕刻出設計好的功能外形。由於光刻技術受波長限制,單憑光刻機很難滿足 5nm、3nm 及更先進的工藝,只能通過反覆的刻蝕來實現更小的尺寸。
現階段先進製程工藝的提升,相當程度上源於刻蝕步驟的疊加。因此近兩年刻蝕和薄膜沉積(刻蝕的逆過程)在裝置行業的市場份額極速上升,甚至超越了光刻機。
後者則創造了 14/16nm 這個經典制程: 在 14/16nm 之前,晶片製造的主流工藝是 HKMG(High-k Metal Gate),2014 年,三星依靠梁孟鬆團隊搶先台積電攻克 14nm。當時,梁孟鬆用了 FinFET 工藝解決了生產問題,但工藝變化也意味著裝置、產線的大手術。
一些晶圓廠在 14nm 的生產良率反而超過 28nm,也是工藝變化的原因。
而由於 DUV 光刻機的精度限制,晶片製造深入到 7nm 製程後,就需要用 EUV 光刻機,價格是 DUV 光刻機的至少 3 倍。台積電曾嘗試利用 DUV 光刻機 + 多重曝光的方式生產 7nm 晶片,但扛不住低良率的鉅額成本,最後還是老老實實買 EUV 光刻機。
這個昂貴的技術爬坡之所以多年來行之有效,是因為以蘋果為首的一大批晶片設計公司,每年會排著隊給台積電下訂單。但當財大氣粗的蘋果都嫌貴的時候,這個迴圈就會出現問題。
根據 IBS 的測算,10nm,7nm 和 5nm 晶片的 IC 設計成本分別 1.7 億、3.0 億和 5.4 億美元,而 3nm 晶片的設計成本則達到驚人的 5 億至 15 億美元。
由於晶片架構和 IP 複用等因素影響,業界對晶片設計成本的測算常常被高估。但即便排除這些影響,這也是個天文數位。任何晶片設計公司下單之前都得掂量掂量,自己有沒有那麼大的出貨量。
越來越貴的成本只是台積電的焦慮之一。過去幾年,台積電面臨的問題有兩個:
- 一是先進製程的高成本,導致錢砸的越來越多客戶反而越來越少。
- 二是幾個耗資巨大的工藝節點,產能高峰也就一兩年,難以持續造血。
前者在業內被反覆提及,後者則常常被忽略。
延伸閱讀:Nvidia向台積電放「晶片業核彈」!AI加速晶圓製程、台積電6月導入
7nm:既不先進,也不落後
2019 年,台積電痛失大客戶華為,結果蘋果、AMD 這些大客戶立馬承包了閒置的產能,所以台積電一邊說 「影響不大」,一邊宣佈 2021 年起,臺灣地區工作的 5 萬名員工的通通漲薪 20%。
由於眾所周知的原因,7nm 的熱度在今年又被炒了起來。不過在台積電,7nm 製程的處境一度尷尬。
台積電的 7nm 工藝創造了很多經典產品,比如蘋果的 A12 晶片,AMD 的 Zen 2/3 架構處理器,以及海思的麒麟 985 晶片。
一般來說,當一個新制程量產後,蘋果和高通是第一個吃螃蟹的。而隨著工藝升級,蘋果和高通、AMD 會更新到下一代製程,上一代製程的產能會降價,留給 AMD 等晶片公司。隨著製程繼續升級,成熟製程就會慢慢留給伺服器晶片、汽車晶片等等產品代工。
對台積電來說,老製程雖然已經落後了,但產能不會被浪費。隨著產線的成本慢慢折舊完,持續開動的產線反而能貢獻可觀的利潤。 在台積電的營收裡,將近 1/3 都是 40/45nm 以上的成熟製程貢獻的。
瞭解了這個背景,就能看出 7nm 的尷尬之處: 說它是先進製程,也沒有那麼先進;說它是成熟製程,也沒有那麼成熟。
隨著蘋果和高通已經用上了更先進的 5nm 甚至 3nm,作為關鍵替補隊員的汽車晶片,卻仍在使用成熟製程。截至 2021 年,14nm 以下的車用晶片比例僅為 6%。
從台積電的年報中也可以發現,從 2020-2022 年,5nm 份額逐年增加,但 16nm 以上的產品佔比卻變化不大。 理論上的 「末位淘汰」 邏輯並未發生,真正遭到擠兌的是上一代冠軍:7nm。
2020-2022 年,台積電 7nm 的收入佔比從 33% 下降至 27%。根據臺灣媒體爆料,台積電 7nm 的產能利用率在 2021 年一度超過 100%,到 2022 年底跌到了不足 50%,今年年初更是一度跌至 30%。
原因也很簡單,對於替補隊員們來說,7nm 還是太貴了。
正如前文所述,7nm 是由 DUV 光刻機換為 EUV 光刻機的重要節點,也成了成本激增的起點。另外,7nm 流片時,用於對向矽片上投影晶片影象的耗材掩膜版急劇增加,這一項就能花掉一千多萬美元。
和前兩代的 16nm 相比,7nm 的設計成本增至將近 3 倍。這些成本最終傳導到下游客戶的報價上,物聯網、汽車等裝置等晶片出貨量遠低於動輒年產十幾億的智慧手機,面對高昂的價格自然望而卻步。
所以蘋果、高通、AMD 陸續在 7nm 節點短暫停留後,長期為台積電 7nm 貢獻收入的產品只有輝達的車載晶片 Orin X 和 A100 GPU。
如果沒有新的增量市場,7nm 大概率不會是唯一尷尬的一代,5nm,4nm 甚至 3nm 都很快就會步其後塵。
但 ChatGPT 的橫空出世改變了這一點。
躲得過輝達,躲不過台積電
今年 9 月,臺灣媒體 DigiTimes 傳來捷報,台積電各製程產能集體回升:6/7nm 製程的產能利用率自 10 月起,有望逐步回到 60% 以上,4/5nm 製程的產能則將回升至 80% 左右。
瘋狂下單的除了老客戶蘋果和高通,還有兩個關鍵角色:輝達和輝達的客戶。
輝達的熱情不難理解,目前追夢大模型的硬通貨 H100 就採用了台積電 N4(5nm)工藝,順便帶火了台積電的 CoWoS 先進封裝產能。
按照分析師 Robert Castellano 的測算,一片 N4 工藝的 12 寸晶圓價格為 13400 美元,理論上可以切割 86 顆 H100 晶片。如果不考慮生產良率,那麼每生產一顆 H100,台積電就能獲得 155 美元的收入。但封裝一塊 H100,台積電可以入帳 723 美元。
也就是說,每顆 H100 給台積電帶來的收入很可能超過 1000 美元。
延伸閱讀:Nvidia的AI晶片H100有多神?為何一片難求?
同時,AMD 的 MI300、英特爾的 Gaudi 3 也都採用了台積電 5nm 工藝。
一直以來,面向 AI 訓練和推理的高效能 GPU 市場並不算大,但 ChatGPT 引發了科技公司和雲服務商的恐慌性搶購,導致產能不足反而成了限制輝達的問題。考慮到輝達敢於把 H100 按照物料成本直接加個零賣,就算台積電漫天要價,輝達也有能力照單全收。
處境尷尬的 7nm 則在同一時期等來了關鍵的替補隊員:輝達的客戶。
Google從 2016 年開始投入使用的自研 AI 晶片 TPU,就一直交由台積電代工。2015 年 「內測」 階段的 AlphaGo 還需要輝達的顯示卡訓練,到了 2016 年酣戰李世石,就已經換上了自家的 TPU。
目前,最新的第四代 TPUv4 就採用了 7nm 工藝。英國明星初創公司 Graphcore 的 IPU 晶片,同樣採用了 7nm 製程,還用上了台積電的 WoW 矽晶圓堆疊技術。
7nm 的另一個大客戶是特斯拉:2021 年 8 月,馬斯克在特斯拉 AI Day 活動上公佈了 Dojo ExaPOD 超級電腦,內建自研 7nm 工藝的 D1 晶片,由台積電代工。
Dojo ExaPOD 由 120 個訓練模組組成,每一個訓練模組包含 25 塊特斯拉自研的 D1 晶片,總晶片數量達到了 3000 塊,直接讓 Dojo 以 1.1 EFLOP 的算力,成為全球第五大算力規模的電腦。
早在幾年前,特斯拉還曾被黃仁勳視為標杆客戶。但隨著 Dojo 的問世,兩家公司的塑料友誼暴露無遺。
一方面,D1 晶片是特斯拉為了適配自家產品,專門針對汽車、機器人等應用場景的研發,強調視覺處理等功能。和輝達的通用 GPU 相比,製程要求略低,同時不會造成算力的浪費。另一個目的就是省錢,根據摩根士丹利的測算,晶片自研讓特斯拉足足省下了 65 億美元。
時至今日,全球主要的 AI 晶片中,超過 80% 都由台積電生產,既有Google和輝達這類老牌列強,也有 Graphcore 這類初創公司,中國大陸的 GPU 設計公司,目前也依賴台積電的產能。
台積電能照單全收的另一個原因,恐怕也是老對手三星的掉隊。雖然三星在每個節點都沒落後太多,甚至率先宣佈量產了 3nm 工藝。但由於良率和功耗控制等原因,不僅沒等來大客戶,反而接連坑哭了高通和輝達。這也難怪 SemiAnalysis 在報告裡陰陽怪氣的說:就連英特爾也能搶走三星的客戶了。
要知道去年 10 月,台積電總裁魏哲家在內部溝通時,還罕見地鼓勵員工休假。沒想到一年過去,訂單就擠滿了台積電十八廠的 N4/N5 產線。
躲過了輝達的算力稅,終究沒躲過台積電的寶刀。
📍相關報導📍
Nvidia力挺,四年估值80億美元!Coreweave到底是何方神聖?