跳至主要內容

AI 模型發展新趨勢:OpenAI 推出 GPT-5.2,Google 主打低成本 Gemini 3 Flash | 三建產業資訊

技術文章

AI 模型發展新趨勢:OpenAI 推出 GPT-5.2,Google 主打低成本 Gemini 3 Flash

AI 模型發展新趨勢:OpenAI 推出 GPT-5.2,Google 主打低成本 Gemini 3 Flash

全球人工智慧(AI)產業急速成長,Google近日擴展 Gemini 3 家族,推出Gemini 3 Flash。Google表示,這款模型結合 Pro 級推理能力與 Flash 的低延遲、低成本特性,能為日常任務與代理式工作流程帶來重大升級。與此同時,OpenAI 也推出新一代旗艦模型 GPT-5.2,顯示全球 AI 供應商正加快模型升級與產品布局的腳步。

Google 表示,Gemini 3 Flash 結合 Pro 級推理能力與 Flash 系列的低延遲、低成本特性,能為日常任務與代理式工作流程帶來顯著升級。在多項博士級推理與知識基準測試中,Gemini 3 Flash 展現出領先效能,包括 GPQA Diamond 測試達 90.4%,以及在不使用工具情況下於 Humanity’s Last Exam 取得 33.7% 的成績,整體表現足以媲美更大型的前瞻模型。

此外,Gemini 3 Flash 在 MMMU Pro 測試中獲得 81.2%,達到業界領先水準,表現與 Gemini 3 Pro 相當,並顯著超越前代最強的 Gemini 2.5 Pro。

Google 指出,Gemini 3 Flash 的設計核心在於極致效率,挑戰「品質、成本與速度」三者的帕雷托前沿(Pareto frontier)。模型能依任務複雜度調整思考量,在處理日常任務時,平均使用的詞元數比 2.5 Pro 減少 30%,同時維持更高效能與準確度。

在速度方面,根據 Artificial Analysis 基準測試,Gemini 3 Flash 的處理速度較 2.5 Pro 提升約 3 倍,且僅需原本極小比例的成本。其定價為每百萬輸入詞元 0.50 美元、每百萬輸出詞元 3 美元,音訊輸入則維持每百萬詞元 1 美元。

目前,Gemini 3 Flash 已成為 Gemini 應用程式的預設模型,取代 2.5 Flash,意味著全球使用者皆可免費體驗 Gemini 3 帶來的效能升級。至此,Gemini 3 模型家族已包含 Gemini 3 Pro、Gemini 3 Deep Think 與 Gemini 3 Flash。

另一方面,OpenAI 發表新一代旗艦模型 GPT-5.2,並同步推出三個版本,包括強調即時回應的 GPT-5.2 Instant、具備深度推理能力的 GPT-5.2 Thinking,以及用於處理複雜任務的 GPT-5.2 Pro。

OpenAI 表示,GPT-5.2 在建立試算表、製作簡報、編寫程式碼、解讀圖像、理解長篇上下文、工具整合,以及多步驟專案處理等方面均有顯著提升。根據專家評審,GPT-5.2 Thinking 在 70.9% 的 GDPval 知識工作任務中,表現已達到或超越頂尖業界專業人士水準。

此外,GPT-5.2 Thinking 在上述任務中的輸出速度超過人類專業人士 11 倍,成本則不到 1%,顯示在有人類監督的情境下,GPT-5.2 可大幅提升專業工作的效率。