Web Interstitial Ad Example

半導體如何塑造新一代AI創新格局

15-10-2025
a20251015cfa

人工智能(AI)依然是當今最具革命性的技術,並由一眾半導體公司主導和引領突破性進展。在邏輯和記憶晶片需求的帶動下,全球半導體市場預計今年將延續2024年的強勁復甦,全年增長18%,總收入達到8,000億美元,其中美洲及亞太區預期將會錄得最高增長。數據中心的擴張繼續帶動顯著增長,專注於AI和半導體創新的公司尤其受惠。

資料來源:美國半導體行業協會。截至2025年9月5日。

AI維持強勁增長

儘管面臨關稅上升及經濟阻力增加等挑戰,隨著AI驅動的變現機會逐步浮現,超大規模雲端服務商(hyperscalers)的資本支出繼續維持上升趨勢。2025年第二季度,全球數據中心資本支出按年飆升43%。微軟、亞馬遜和Google均表示,AI工作負載需求持續超出現有基礎設施的承載能力,預計全年將繼續擴大新增容量以應對需求增長。OpenAI擬斥資約4,000億美元,聯同甲骨文及軟銀集團,在美國興建五個全新數據中心據點。這些新據點最終將具備7吉瓦(gigawatts)的電力容量,顯著提升OpenAI的運算能力,以支援其各項服務。Meta亦正在建設多個多吉瓦級數據中心集群,以加速實現其AI目標。其中首個數據中心預計將於明年啓用,屆時其2026年的資本支出將進一步上升。Meta將AI作為其廣告策略重心,並計劃在明年年底前讓品牌客戶能夠全面使用AI工具來設計和制定具針對性的廣告活動。根據客戶的預算,這些新工具將可生成整個廣告,包括圖片、影片和文字,並發送給目標受眾。

過往,AI的需求主要集中於訓練工作負載,尤其是前沿AI模型。在繼續投入資源建設更龐大AI模型的同時,科技巨頭亦將轉為重新分配更多的投資於推理(inference)領域。推理是指已完成訓練的AI模型處理新數據,從而產生灼見、進行預測或支援決策的階段。訓練模型基本上是一次性支出,對模型進行指示(推理)生成詞元(token),而每個詞元皆附帶成本。在Google I/O 2025大會主題演講中,Alphabet行政總裁桑德爾·皮查伊(Sundar Pichai)透露,2025年4月,Alphabet所有產品和應用程序編程接口(API)處理高達480萬億個詞元,較去年同期激增50倍。詞元(token)量快速攀升反映AI模型的應用日益普及,預示對運算能力將有更大需求,並帶動對晶片的需求增長。

AI推理時代

隨著新推理模型面世,投資也加速轉向推理領域。傳統的AI模型雖然能快速回應,並擅於識別模式,卻往往無法理解更廣泛的背景,且難以處理複雜的推理任務。推理模型旨在將複雜的問題分解為更小、更易處理的步驟,再透過明確的邏輯推理解決問題。此類模型能夠展示其推理過程,並遵循結構更加清晰的思考流程,因而在處理用戶查詢時需要更長的運算時間。這些模型在推理過程中需要使用明顯較多的運算資源進行推理,以處理複雜的問題。從基本模式識別演進至結構化推理對AI的發展至關重要,可釋放AI有效應對各種現實世界複雜挑戰的潛能。隨著AI應用範圍快速擴大,對推理能力的需求亦將相應激增。