GPT-4.5 發表帶來的影響 |

GPT-4.5

GPT-4.5：通用型模型進化中的策略轉折點 🔍

從 OpenAI 最新釋出的系統卡片來看，GPT-4.5 代表了一次明顯的策略轉向—從專注於 STEM 的推理模型，轉為打造更通用、全面的 AI 系統。這一轉變值得深入探討，尤其是考慮到目前 GPT-4.5 僅對每月支付 200 美元訂閱費的 Pro 用戶開放使用。

核心技術進步主要體現在兩個方向：

然而，根據內部分析資料，GPT-4.5 似乎未能在基準測試中展現出突破性進展：

“OpenAI 和山姆·阿特曼（Sam Altman）也坦承，GPT-4.5 在基準測試中，即便與最小版本的 Claude 3（Claude 3 Mini）相比，也不會勝出。GPT-4.5 在科學、數學和大多數程式碼編寫基準測試中表現不佳，在深度研究方面更是遠遠落後。”

綜合官方數據與實際測試結果，GPT-4.5 呈現出複雜的能力圖譜：

能力指標	表現評估	與競品比較
幻覺率	從 52% 降至 19%	進步明顯但未提供與 Claude 等直接比較
知識截止日期	2023 年 10 月	比 Claude 3.7 落後整整一年
情感智能	官方宣稱提升	實測表現不及預期，在配偶虐待辨識等案例中弱於 Claude 3.7
創意寫作	有所進步	但，Claude 3.7 在創意寫作方面更勝一籌

價格與性能比較尤為值得關注：

“值得注意的是，GPT-4.5 的價格比 GPT-4 Turbo 貴 15 到 30 倍。由於成本高昂，OpenAI 正在評估是否繼續在 API 中提供 GPT-4.5。”

GPT-4.5 揭示了大型語言模型發展的重要轉折點：

🔸 規模擴張瓶頸顯現 - 文件中提到：“最近一兩年間，大型語言模型的發展方向幾乎都集中在擴大規模上，也就是透過增加模型參數、餵入更多數據，以及使用更強大的 GPU 來提升模型能力。” 這一路線似乎已達瓶頸

🔸 單純參數增長效益遞減 - 即使耗費巨資，GPT-4.5 的表現也未能達到預期突破

🔸 創新路徑需求增加 - “隨著擴展思考時間等創新技術的出現，GPT-4.5 也讓我們得以一窺，如果沒有這項技術，LLM 會變成什麼樣子。”

雖然 GPT-4.5 未能在基準測試中勝出，但在特定領域仍展現出一定優勢：

GPT-4.5 的發布標誌著 AI 產業可能正進入新階段：

GPT-4.5 代表了 OpenAI 在尋找平衡點的嘗試—在保持通用能力的同時，尋求差異化競爭優勢。從技術演進角度，這次發布更像是一次策略性的過渡，而非革命性的突破。

對於企業決策者與技術實踐者，建議：

不管怎麼說，GPT-4.5 的發表提醒了一件事：AI 發展已進入更加注重質量而非單純追求規模的新階段，未來的競爭將更加多元化且精細化。(用外來語就是：卷到不行)