中國 AI 公司 DeepSeek 宣布推出新型推理人工智能模型 DeepSeek-R1-Lite-Preview,據稱其性能可與 OpenAI 的 o1-preview 模型相媲美甚至超越。這款模型專注於加強「推理」能力,具備規劃和逐步解決問題的功能,並計劃開放源碼。
DeepSeek-R1-Lite-Preview 模型旨在模擬人類的思考過程,能逐步構建推理鏈條,並詳細解釋答案的邏輯。相較於 OpenAI 的 o1-preview,該模型在處理複雜問題時雖需較多時間,但能夠提供更可靠的結果。DeepSeek 表示,其模型在 AIME 和 MATH 兩項 AI 基準測試中取得了與 o1-preview 相似的成績。AIME 測試其他 AI 模型的性能,而 MATH 則專注於解決複雜的數學題目。
然而,該模型仍有一些不足之處。有評論指出,DeepSeek-R1 在某些邏輯遊戲如井字棋上的表現不佳,且容易被繞過安全限制。此外,模型拒絕回答政治敏感問題。TechCrunch 的測試顯示,針對某些問題,模型回覆「抱歉,未能思考此類問題」。
DeepSeek 與 OpenAI 的 o1-preview 等推理模型一樣,採用了「測試期運算」技術,為模型提供額外運算資源以處理任務,突破依賴大量數據和計算資源提升性能的限制。Microsoft CEO 納德拉也指出,這類推理模型展示了 AI 擴展的潛力。
DeepSeek 背後的高飛資本管理公司是一家中國依賴 AI 技術進行量化交易的對沖基金。該公司投入約1億日元(約港幣7.8億元)購買了10,000台 Nvidia A100 GPU,建設伺服器集群進行模型訓練。DeepSeek 計劃開放 R1-Lite-Preview 的源碼及 API,以吸引更多開發者參與。