
The Global Arms Race for AI Supremacy is Underway 中國新創 AI 模型 DeepSeek 以低成本、高效能優勢迅速竄起,挑戰美國「算力為王」的發展邏輯,讓中美 AI 競爭更加白熱化。 全球 AI 競爭進入新一章 全球首富伊隆·馬斯克 ( Elon Musk ) 旗下的 xAI 人工智慧新創公司在今年 2 月 17日推出最新AI 模型 Grok, 標榜是「地表最聰明的AI」,採用高達 20 萬個輝達 ( NVIDIA ) H100 繪圖晶片 ( Graphics Processing Unit、 GPU ), 標誌著其在算力上的巨大投入。以每個 GPU 單價約 2.5 萬美元,總成本超過 50 億美元。 過去幾年,人工智慧 Artificial intelligence ( AI ) 發展圍繞在模型的計算能力 ( 簡稱算力 ) 展開,AI 模型採用的 GPU 數量越多、規格越好, 其算力和效能越高。因此全球AI企業掀起算力競賽, 每年砸下數十億甚至數百億美元購置 GPU,興建運算中心。微軟 ( Microsoft ) 和 Meta ( Facebook ) 也宣布今年將分別斥資 800 億和 600 億美元擴增 AI 基礎設施。 然而,就在 xAI 的 Grok3 發布的三個星期前,一間成立於 2023 年 10 月,至今發展不到兩年的中國 AI 新創公司「深度求索 ( DeepSeek )」推出旗下的開源 AI 模型 DeepSeek R1, 宣稱僅使用 2,048 個輝達較低階的 H800 晶片 ( 有一說法是使用 5 萬個高階的 A100 晶片),僅花費 578 萬美元的推理成本 ( 另一說法是總成本 13 億美元 ), 卻在數學推論、程式碼生成等領域,和去年 12 月問世的 OpenAI o1 模型有不相上下的表現,引發市場熱議。 雖然 DeepSeek 在成本和規格上有許多爭議,但這款低成本高效能的 AI 模型的橫空出世,證明 AI 模型的強弱並非單靠算力,藉由優化演算法也能有優異表現。 這對動輒需要耗資數十億甚至上百億美元來建置算力的美國企業,無異是狠狠敲響「一記警鐘」,也為白熱化的中美 AI 競爭注入新的變數。 美國算力強大,在應用端卻難施展身手 一直以來,美國靠著在互聯網及半導體產業無法無天的高市占率,加上 AI 企業不停砸錢建置算力,在 AI 發展處於領先地位。根據史丹佛大學的數據, 2023 年美國私人企業在 AI 產業的投資金額高達 672 億美元,是中國的 8.7 倍。然而,如此龐大的投資金額至今沒有產生相對應的報酬。 以 OpenAI 為例,根據《華爾街日報》的報導,公司 2024 年營收約 40 億美元,虧損達 50 億美元, 並預期 2023 年至 2028 年的累積虧損將達到 440 億美元。大型雲端服務商如谷歌 ( Google ) 和亞馬遜 ( Amazon ) 最近也面臨到雲端服務營收成長放緩的問題。 除此之外,AI 模型目前僅在內容生成、聊天機器人、和搜尋等初淺應用有所發展,在自動駕駛、醫療診斷等高端應用尚未有明顯突破。 出於對數據安全的疑慮,隱私權的擔憂,和人工智慧的幻覺 - 因數據輸入的偏差,使 AI 模型導出虛假或不準確的結論, 多數的企業也不願意輕易投入資源發展相關技術和應用。再者,美國 AI 模型多屬於封閉式模型,開發門檻和費用都很高。 根據美國軟體開發公司 Sphinx Solutions 的數據,依照設計和功能複雜度,開發一款 AI 應用的成本上看 300 萬美元。 中小企業很容易因為欠缺 AI 技術人員或資金問題而怯步。根據美國人口普查局 ( Bureau of the Census ) 今年 2 月的調查, 全美僅有 6% 的企業過去兩週使用 AI 技術進行產品生產或服務,僅 10% 在未來 6 個月有意願使用 AI技術。 即使面對這些爭議,美國 AI 企業仍然堅持「算力為王」的發展思維,持續砸錢購置 GPU,興建大型運算中心。根據彭博的數據, 微軟、亞馬遜、Alphabet、和 Meta 四間大型雲端服務商 2025 年的總資本支出高達 3,024 億美元,比去年高出 38% , 多數資金將用來蓋運算中心。然而,居高不下的龐大資本支出最終是否會侵蝕公司的獲利能力,已讓投資人感到不安,也對美國 AI 企業是否值得高估值產生質疑。 中國的成本和開源優勢,能否補足硬體短版 不同於美國主攻算力,中國則從成本和應用端著手。一方面是因為美國對半導體晶片和設備設下各種出口管制,中國在算力的成長受到限制,再者企業習於成本導向思考, 先開發出高性價比的 AI 模型,透過龐大內需市場加速終端應用發展,再藉此切入全球市場。從太陽能、網路通訊、智慧型手機、到電動車, 都是依循這般模式,中國甚至成為市場最大玩家。如今人工智慧也不例外。以DeepSeek 為例, 是透過導入知識蒸餾技術 ( Knowledge Distillation ) 和多頭潛在注意力架構 ( MLA )等多種創新技術,並專研於某幾個領域來實現高效能的運算和成本效益, 使其得以以遠低於同業的價格來吸引用戶。根據 Artificial Analysis 研調機構的比較, DeepSeek R1 效能和 OpenAI o1 模型的效能差異不大,但 DeepSeek R1 每百萬 token 輸出價格僅 2.2 美元,而 OpenAI o1 則要 15 美元。 另外,中國擁有超過 11 億個網際網路用戶以及接近 70% 的 5G 普及率,加上對於資訊隱私權重視程度不高,AI 企業能輕易取得數據來訓練模型,而且成本很低。 政府還提供各種補助,鼓勵終端企業採用 AI 技術,使 AI 企業從市場端獲取更多數據來優化模型,形成了一個良性循環。此外,相較於美國 AI 企業多採用封閉式平台以保護自身技術和利潤, 中國則多選擇開源模式,公開技術細節和原始程式碼,並允許用戶依照自身需求修改模型。此舉雖然有技術外流的風險,但能降低用戶開發應用的門檻, 更重要是能夠大幅提升中國 AI 企業在全球市場的滲透度。根據《路透社》的報導,不少歐美 AI 新創公司已經從 OpenAI 轉向 DeepSeek, 因為開發成本和技術門檻更低。這股壓力讓 OpenAI 首席執行長兼聯合創始人山姆·阿特曼 ( Sam Altman ) 向媒體坦承,在開源這件事上,他們或許選錯邊了。 不過,美國在先進晶片和半導體的管制,仍然是中國 AI 發展路上最大的絆腳石。DeepSeek 執行長梁文峰曾在 2024 年對媒體表示, 先進晶片的出貨禁令仍是公司發展的最大挑戰。政府已投注龐大資源發展先進半導體和晶片, 但技術發展無法一蹴可幾,短時間內難以自給自足。美國在看到 DeepSeek 的崛起後,是否會祭出更嚴格的出口管制措施,進一步緊縮對中國晶片和 AI 產業的限制,還需要觀察。 AI競賽是場馬拉松,不到最後,勝負難分 在 AI 發展路上,算力依然是核心競爭力。美國總統唐納·川普 ( Donald Trump ) 在今年 1 月 20 日正式回鍋白宮隔天, 旋即宣布「星際之門計畫 ( The Stargate Project )」,由美國 OpenAI 和軟體巨頭甲骨文 ( Oracle ) 、日本的電信巨頭軟銀集團 ( SBG ) 及 阿聯酋國旗下的 AI 技術投資公司 MGX Fund Management Limited 共同合資設立 Stargate 企業, 計劃至 2029 年分階段投入共 5,000 億美元,大力發展 AI 基礎設施。第一期將投資 1,000 億美元於德州興建 10 座資料中心,未來將擴充至更多州。 不過,DeepSeek 的出現,代表這場競爭不能單拼算力,還需要在演算法和應用生態等各個層面持續創新,才有機會脫穎而出。 這場技術、資本、和產業戰略的 AI 馬拉松競賽,美國能以算力壟斷領先到最後,還是中國能以成本優勢以及開發靈活度後發先至,不到最後一刻,誰都不知道最終的贏家會是誰。 編按 1. 知識蒸餾技術 ( Knowledge Distillation ) - 從更成熟、強大的 AI 模型中提煉數據來訓練新的模型。 2. 多頭潛在注意力架構 ( Multi-Head Latent Attention,MLA ) - 降低快取記憶體用量,讓模型能使用較少的算力來運算,以降低成本。