AI 模型發展新趨勢：OpenAI 推出 GPT-5.2，Google 主打低成本 Gemini 3 Flash

2025/12/24 約 4 分鐘 319 次閱讀

全球人工智慧（AI）產業急速成長，Google近日擴展 Gemini 3 家族，推出Gemini 3 Flash。Google表示，這款模型結合 Pro 級推理能力與 Flash 的低延遲、低成本特性，能為日常任務與代理式工作流程帶來重大升級。與此同時，OpenAI 也推出新一代旗艦模型 GPT-5.2，顯示全球 AI 供應商正加快模型升級與產品布局的腳步。

Google 表示，Gemini 3 Flash 結合 Pro 級推理能力與 Flash 系列的低延遲、低成本特性，能為日常任務與代理式工作流程帶來顯著升級。在多項博士級推理與知識基準測試中，Gemini 3 Flash 展現出領先效能，包括 GPQA Diamond 測試達 90.4%，以及在不使用工具情況下於 Humanity’s Last Exam 取得 33.7% 的成績，整體表現足以媲美更大型的前瞻模型。

此外，Gemini 3 Flash 在 MMMU Pro 測試中獲得 81.2%，達到業界領先水準，表現與 Gemini 3 Pro 相當，並顯著超越前代最強的 Gemini 2.5 Pro。

Google 指出，Gemini 3 Flash 的設計核心在於極致效率，挑戰「品質、成本與速度」三者的帕雷托前沿（Pareto frontier）。模型能依任務複雜度調整思考量，在處理日常任務時，平均使用的詞元數比 2.5 Pro 減少 30%，同時維持更高效能與準確度。

在速度方面，根據 Artificial Analysis 基準測試，Gemini 3 Flash 的處理速度較 2.5 Pro 提升約 3 倍，且僅需原本極小比例的成本。其定價為每百萬輸入詞元 0.50 美元、每百萬輸出詞元 3 美元，音訊輸入則維持每百萬詞元 1 美元。

目前，Gemini 3 Flash 已成為 Gemini 應用程式的預設模型，取代 2.5 Flash，意味著全球使用者皆可免費體驗 Gemini 3 帶來的效能升級。至此，Gemini 3 模型家族已包含 Gemini 3 Pro、Gemini 3 Deep Think 與 Gemini 3 Flash。

另一方面，OpenAI 發表新一代旗艦模型 GPT-5.2，並同步推出三個版本，包括強調即時回應的 GPT-5.2 Instant、具備深度推理能力的 GPT-5.2 Thinking，以及用於處理複雜任務的 GPT-5.2 Pro。

OpenAI 表示，GPT-5.2 在建立試算表、製作簡報、編寫程式碼、解讀圖像、理解長篇上下文、工具整合，以及多步驟專案處理等方面均有顯著提升。根據專家評審，GPT-5.2 Thinking 在 70.9% 的 GDPval 知識工作任務中，表現已達到或超越頂尖業界專業人士水準。

此外，GPT-5.2 Thinking 在上述任務中的輸出速度超過人類專業人士 11 倍，成本則不到 1%，顯示在有人類監督的情境下，GPT-5.2 可大幅提升專業工作的效率。

回到文章列表

技術文章