立即與 GPT-5 聊天

GPT-5：OpenAI 的進階多模態語言模型

GPT-5 是 OpenAI 的最新一代大型語言模型，於 2025 年 8 月 7 日正式發布。它具備進階的推理能力、多模態輸入處理（文字和圖像）以及統一的模型架構，可為任務動態選擇最佳子模型。

GPT-5 可以執行多步驟邏輯推理、修正結論並證明輸出，使其更適合執行簡單對話以外的複雜工作流程。

OpenAI 發布的主要 GPT-5 變體包括：

此外，還有 GPT-5 Pro 變體，提供更高的推理深度和峰值效能，可透過如 ChatGPT Pro 等付費訂閱服務存取，具有增強的計算能力，但成本和延遲較高。

GPT-5 的主要功能和改進包括：

GPT-5 捏造資訊的傾向顯著降低，與 GPT-4o 相比，在某些測試中事實錯誤減少高達 45%，並且經過訓練，能在無法進行推理的情況下發出信號。

GPT-5 整合了進階的推理模型與多模態輸入（文字、圖像和語音），無需在專用模型之間切換，即可無縫處理複雜的多步驟工作流程。

GPT-5 整合了 o3 模型等先前版本的結構化邏輯，能夠進行多步驟思考、修正結論並證明輸出，以提高準確性，尤其是在事實和分析任務中。與早期版本相比，這能大幅減少幻覺（在某些測試中事實錯誤減少 45-80%）。

GPT-5 支援大型輸入，輸入限制約為 272,000 個 token，輸出限制約為 128,000 個 token，使其能夠在長時間對話中保持連貫性並處理大型文件。

在推理、編碼、可靠性和多模態能力等多數關鍵指標上，GPT-5 的表現顯著優於 GPT-4o。

以下是詳細比較：

功能	GPT-5	GPT-4o
推理效能	更強的多步驟推理；在啟用擴展「思考」後，在科學基準測試（GPQA Diamond）上得分約為 85.7%-89.4%	效能較弱，在相同基準測試上約為 70.1%；在複雜科學推理方面遇到困難
編碼能力	在 SWE-bench Verified（74.9%）和 Aider Polyglot（88%）等基準測試中名列前茅，並啟用思維鏈；迄今為止最佳的編碼模型	在這些學術編碼和程式碼編輯基準測試中的表現最弱
錯誤率與可靠性	擁有最低的幻覺和錯誤率（開源下低於 1%，難度較高的醫療任務上為 1.6%）；推理模式將錯誤率降低一半以上	幻覺和錯誤率較高（HealthBench 上高達 15.8%，流量提示上為 22%）
模型架構	統一的架構，具有動態子模型切換、多模態輸入（文字和圖像）、代理功能和工具整合	獨立的舊版模型，多模態能力較弱
使用與可用性	提供標準版、迷你版和 Pro 版，具有不同的推理深度和 API 存取權限；由 Microsoft 整合	舊版，截至 2025 年 4 月在 ChatGPT 中已棄用，仍可透過 API 存取
多模態與工具整合	對文字和圖像進行強大的即時處理，計畫支援影片，並與生產力工具和編碼環境整合	多模態能力有限，無計畫支援影片理解

您可以在幾個地方存取 GPT-5。

HIX AI（推薦）：這可能是體驗 GPT-5 最簡單、最順暢的方式。在 HIX AI 上免費試用，無需登錄。我們為來自世界各地的使用者提供此模型的無限制存取。
ChatGPT 網頁介面：GPT-5 可供所有 ChatGPT 使用者使用，包括免費、Plus、Pro 和 Team 訂閱者。免費使用者在使用量達到上限後，可有限度使用，並會自動切換到 GPT-5 mini；Plus 使用者享有更高的使用量上限；Pro 使用者可存取 GPT-5 Pro，擁有最高的能力和無限使用量。
API 存取：GPT-5 可透過 OpenAI 的 API 平台供開發人員使用，提供 GPT-5、GPT-5-mini 和 GPT-5-nano 等不同的模型變體，以滿足成本和延遲需求。

GPT-5 提供了更強大的結構化推理能力、更佳的多模態能力、更少的幻覺（最多可減少 45%），以及一個統一的模型，無需在各個特定版本之間切換。它還引入了代理功能，以更好地執行任務並整合生產力工具。

是的，GPT-5 支援即時多模式輸入，包括文字和影像，未來計劃實現原生視訊處理和改進跨輸入模式的轉換。

GPT-5 在編碼效能方面處於領先地位，並且可以深入分析程式碼庫，這使其對於程式設計和軟體相關任務非常有效。

GPT-5 支援約 272,000 個令牌的輸入限制和 128,000 個令牌的輸出限制。