自由時報 2023/09/06 台積電董事長劉德音今指出,半導體技術是新人工智慧(AI)能力和應用的關鍵推動力,AI也將對人類的生活和工作帶來重大改變,也會為半導體產業帶來龐大的商機;過去半導體技術的發展就像走在不斷微縮電晶體的隧道裡一樣,隨著AI時代來到,半導體技術已抵達隧道的出口,未來充滿更多可能性,「我們不再受隧道的束縛」。
: J- D3 y0 @; l3 G+ r ~' d, }: U9 z9 f3 v/ Z
劉德音今出席SEMICON Taiwan 2023大師論壇並開講,他演講全文如下:「90 年代後期 ,由IBM開發的深藍(Deep Blue)超級電腦擊敗了世界西洋棋冠軍加里·卡斯帕洛夫(Garry Kasparov),展現了超級電腦技術的突破性發展,也讓我們首次看到高效能運算有朝一日超越人類智慧的可能性。
" @' t9 j, I% J
8 \9 ?2 [' f' I& }" _$ B1 f接下來10年,人工智慧(AI)應用於許多實際任務,例如臉部辨識、語言翻譯、電影和商品推薦。再接下來的10年,AI 進步到另一個層次,能夠「匯整合成知識」。
( c3 P9 M8 a" L7 ^
& R4 F: Z8 J2 p8 j& G. w6 {
生成式AI(例如 ChatGPT)可以創作詩詞及藝術品、診斷疾病、撰寫報告和電腦代碼。甚至可以設計出與人類打造的積體電路相媲美的相似產品。AI為人類的生活和工作帶來重大改變,也為半導體產業帶來龐大的商機。
& ?' g+ ^$ @3 l5 a4 @* H" j( B3 w5 e
6 v3 V* L7 K. }+ J Z$ D
AI應用的突破性發展來自三個因素。首先是高效深度學習演算法的創新;其次是透過網路取得的大量訓練資料;第三是半導體技術的發展提升了節能運算的能力。
1 c b [3 B2 | g9 W; u; `6 u! v" S8 G
AI發展過程中的幾個重要里程碑是由當時領先的半導體技術實現的。例如深藍超級電腦採用0.13微米技術,深度神經網路的初始圖像辨識採用45奈米技術,著名的AlphaGo採用28奈米技術,最初用於訓練ChatGPT 伺服器採用5奈米技術,最近的ChatGPT則是由採用台積公司4奈米技術生產的伺服器提供支援。
1 p, Y& D& U' _
8 w- {1 ^. c/ e. o) G+ z& _2 BChatGPT 已廣泛應用於日常生活中,展現了AI普遍使用於高效能運算技術,為社會中的每個人帶來助益。
1 o! [$ l, o" E* L; \
; f! S) u$ u$ ~ M在過去的5年,AI 訓練所需的運算能力和記憶體容量增加了好幾個數量級。例如,GPT-3 模型需要超過 5,000 peta-FLOP-days(5E18 Flop-days)的運算量、3兆位元組(3E12 位元組)的記憶體容量。
* S% R j( ]% W2 V8 S
( w) k5 k p, \9 J1 O! L生成式AI應用所需的運算能力和記憶體仍在快速增長,半導體技術要如何以如此快的速度發展呢?自從積體電路發明以來,半導體技術一直在進行尺寸微縮,試圖將更多的半導體元件(或電晶體)置入指甲般大小的晶片中。現今,整合技術已往上提升了一個層次,將許多晶片整合到一個緊密且大規模互連的系統中。這是10多年來見證到的半導體技術整合中的「典範轉移」。超越了2D微縮,進入到3D系統整合。
9 I3 u/ w+ Z5 y, H2 T2 H5 s" a4 p+ z7 H
7 D( t4 G" ?8 Z+ W" U7 A8 }
在人工智慧時代,系統的能力與系統中整合的元件(或電晶體)數量成正比。我們可以利用中介層將整合系統的尺寸擴展到曝光光罩尺寸之外,整合系統晶片比單晶片容納更多的元件。台積公司基於CoWoS 技術開發的超級載體中介層能夠容納高 6個光罩曝光面積的運算晶片,以及12個 HBM3高頻寬記憶體堆疊。
; |' Q) s: r% v
' r- K5 v( _! _; z! F
對人工智慧來說,3D SoIC是另一項越來越重要的關鍵技術。現今傳統的高頻寬記憶體(HBM)依賴矽穿孔(TSV)和焊接凸塊進行堆疊。台積公司的3D SoIC 技術可以為現今的HBM技術提供替代方案。HBM 測試結構中,有12 層面對背堆疊(F2B)在低溫下接合,置於更大的基礎邏輯晶片之上,總厚度 600 微米。
n/ @: E; p" Y; G7 f1 \2 \
& N+ A6 ]/ C0 z2 x藉由 CoWoS 或 SoIC 技術,系統整合晶片中的總元件(電晶體)數量遠大於一個單晶片容納的數量。AI 訓練使用的GPU晶片已達到光罩曝光面積限制,其電晶體數量約為1千億個。電晶體數量增加趨勢的延續需要由多個與2.5D 或 3D 整合互連的晶片來執行運算。
2 \+ ^- h: f' W3 k: a% X( f6 X
& I4 Z8 E' E9 [& g
10年內,多晶片GPU預估將由超過 1 兆個電晶體組成。透過互連間距的微縮,將有足夠的空間容納更多比目前更大的SoIC互連數量。將互連密度進一步提高1個數量級或甚至更高並沒有基本限制。
9 w7 m+ R0 F! X% s' V* h# r( E/ ]
& H/ K4 h! {- w6 W8 g' m
這些創新的硬體技術如何對系統的效能做出貢獻呢?針對伺服器 GPU的能源效率(EEP)趨勢,在過去的 15 年中,半導體產業約每兩年將能源效率提高了3次,此趨勢必將延續下去,也會受到許多創新的驅動,包括新材料、元件和整合技術、極紫外光(EUV)和設計技術協同優化(DTCO)的進步、電路設計和系統架構設計。特別的是,CoWoS和SoIC的發展將協助提高能源效率。此外,系統技術協同優化(STCO)等概念將變得越來越重要。
; |5 E, `& s: u c5 ^9 G9 U
( A1 i" `: F( O/ ]. M1 @" e n8 ?由於高效能運算系統由大量執行大型AI模型的晶片組成,高速有線通訊可能很快將會限制運算速度。現今,光互連已經用於連接資料中心的伺服器機架,光學介面可望很快與GPU和CPU配置在一起,為GPU到 GPU的通訊提供能量和區域效率擴展頻寬。因此,數百台伺服器將成為具有統一DRAM的單一巨型GPU。
0 p' M0 A0 X' C2 V
9 p) g4 \9 e5 E9 J
在此領域,台積公司的緊湊型通用光子引擎(Compact Universal Photonic Engine)技術將扮演重要的角色,利用SoIC 技術來整合在GPU和路由器交換器旁邊的積體電路(EIC)及積體光路(PIC)。
2 w+ j, ?7 c q. H6 P* @! y
+ R6 f( I( a7 ]
在AI應用的推動下,矽光子技術將成為半導體產業的關鍵技術。1980 年,加州理工學院的卡弗·米德教授(Prof. Carver Mead)和林恩·康威教授(Prof. Lynn Conway)發明一種電腦輔助設計積體電路方法,使用一套設計法則來描述晶片微縮製程技術,因此電路設計人員無需具備太多製程技術知識即可輕鬆設計VLSI電路。
! e! G/ k8 z3 P2 [0 [+ b; D: c- a% ?! B! R
在現今3D IC的領域,設計的部分包括VLSI 設計、系統架構設計和軟體/硬體優化設計。製程技術的部分包括晶片微縮技術、3DIC 技術和先進封裝技術。同樣的,我們需要一種描述語言來定義所述技術,並將其轉換為 EDA 技術檔,以便設計人員設計3D IC系統。這正是最近台積公司推出3D Blox(一種硬體描述語言)的目的,它使用通用的解釋標準來描述各種3D IC 技術。
- ?$ y) ~2 u& Q8 n7 Z# ~' \+ O2 \4 D) R& n$ F- Z
設計人員可以自由地進行3D IC系統設計,無須理會基本的3D IC技術。3D Blox 已被現今大多數科技公司和 EDA 公司所接受。在人工智慧時代,半導體技術是新 AI 能力和應用的關鍵推動力。新的半導體產品不再受限於晶片尺寸及新世代電晶體微縮。整合式AI系統涵蓋數量最大化的節能電晶體、專為運算工作負載設計的高效系統架構、以及軟體和硬體優化。
% w% l. r% T, B0 Y( o
7 G3 W! G* j6 v( S/ _+ i* x在過去的50年,半導體技術的發展就像走在隧道裡一樣,前方有明確的道路,每個人都知道做什麼,那就是縮小電晶體。如今,我們已經抵達隧道的出口。半導體技術的開發日趨艱難,然而,在隧道之外,未來充滿更多可能性,我們不再受隧道的束縛」。
6 {3 y5 W5 t7 H+ m# ?) {( o1 J) ?. _& r0 R8 h% {