
Google 已經提出 雙子座3其新一代人工智慧模型旨在融合高階推理、上下文理解和多模態能力。該公司將其定位為迄今為止功能最強大的系統,旨在解讀細微差別並以更少的反覆互動解決複雜任務。
在初始部署中, 雙子座應用程式 開發者工具已經整合了這個版本,而 搜尋中的 AI 模式 該服務首先在美國推出。在西班牙和歐洲其他地區,Google優先透過應用程式、API 和雲端服務提供存取權限,同時還將擴展語言支持,包括加泰羅尼亞語、巴斯克語和加利西亞語。
雙子座3號星帶來了什麼?它為何如此重要?
Gemini 3 將前幾代產品累積的經驗和飛躍性進步融合在一個系統中 對語境的推理與理解該公司堅稱,該模型能夠“捕捉創意中的微妙線索”,並將複雜的問題分解成多個層次,從而提供更準確的答案,並減少重新表述問題的需要。
這種方法可以得到更簡潔的答案,並優先考慮以下方面: 實用資訊與陳腔濫調谷歌一直在測試這種行為,旨在減少奉承行為並提高事實準確性。此外,該模型的多模態特性允許在同一互動中處理文字、圖像、音訊和視訊。
獨立測試和比較測試中的表現
根據Google公佈的指標和公開排名, 雙子座3專業版 他在LMArena以1.501分的ELO積分領先,超越了他的前任。在學術評估方面,他在「人類最後的考試」(Humanity's Last Exam)中未使用任何工具的情況下獲得了37,5%的分數,在GPQA Diamond中獲得了91,9%的分數;在數學方面,他在MathArena Apex中獲得了23,4%的分數。
強化推理模式 深度思考 這項測試結果更進一步,在「人類最後的考試」中取得了 41,0% 的成績,在 GPQA 鑽石測試中取得了 93,8% 的成績。 ARC-AGI-2程式碼執行率達到 45,1%,顯示抽象推理和視覺理解能力有所提升。
Gemini 3 的多模態和巨大的上下文窗口
其中一項重大變更是上下文窗口 1萬個代幣這有助於分析大量的程式碼庫、論文或長影片。例如,該模型可以翻譯和統一手寫食譜,創建家庭食譜,或將複雜的材料轉換為可視化圖表和互動式卡片。
多模態閱讀體現在以下測驗中 MMMU-Pro(81%) 在 Video-MMMU(87,6%)和 SimpleQA Verified(72,1%)中,使用者對事實的準確性要求更高。在整合到搜尋的 AI 模式下,Google 會訓練互動式元素(例如小部件和模擬)來即時解釋概念。
程式設計與代理:反重力的動力
在開發任務中,Gemini 3 領先 WebDev Arena 的 ELO 分數為 1.487。它在 Terminal-Bench 2.0 中取得了 54,2% 的成績,在 SWE-bench Verified 中取得了 76,2% 的成績,這意味著它在生成程式碼、使用工具和操作終端環境方面具有更高的能力。
對於樓宇代理商而言,最值得關注的新功能是 Google反重力該平台使代理程式能夠存取編輯器、終端和瀏覽器。借助該平台,系統可以規劃和執行端到端的軟體工作流程,驗證自身程式碼,並將最終的審查和審計工作留給開發人員。
安全、外部測試和負責任的部署
谷歌聲稱這是它的 迄今為止最安全的型號它能有效抵禦奉承,更能抵禦快速注入和濫用(例如網路攻擊)。該評估是其前沿安全框架的一部分,並已由包括以下機構在內的外部專家進行審查: 英國鋼鐵協會 以及 Apollo、Vaultis 和 Dreadnode 等公司。
模式 深度思考 由於其規劃能力和工具使用範圍廣泛,該功能在針對 Google AI Ultra 訂閱用戶推出之前,需要經過額外的驗證。該公司強調將在各個產品和地區採取循序漸進、穩步推進的方式進行推廣。
雙子座3號的可用性
El Gemini 3 Pro 預覽 該功能可透過 Gemini 應用以及 AI Studio 和 Vertex AI 的開發者 API 存取。此介面新增了 30 種語言,包括 加泰隆尼亞語、巴斯克語和加利西亞語這有助於它在當地環境中得到應用。
El 搜尋中的 AI 模式 它首先在美國推出,然後逐步擴展;同時,企業和技術團隊可以將 Gemini 3 整合到他們的工作流程中。 Vertex AI 與 Gemini Enterprise此外,還有新的 CLI 和 Antigravity 代理平台。
應用案例:從更好地學習到自動化任務
除了聊天之外,該模型還可以將複雜的內容轉化為 互動體驗 它利用圖表、計算器或模擬工具,可用於學習技術概念、分析體育比賽、制定訓練計劃,或分解論文並產生易於理解的指南。
在日常工作中,經紀人可以 將 Gmail 電子郵件進行分類透過結合推理、工具呼叫和瀏覽器控制來規劃行程或執行多步驟任務,始終在人工監督下保持控制。
谷歌堅稱 Gemini 的影響力正在不斷擴大:「AI 驅動的視野」即將推出 每月2.000億用戶Gemini 的應用程式每月下載量超過 650 億次,70% 的雲端客戶使用其人工智慧功能,13 萬開發者利用其模型建立解決方案。這些數據為 Gemini 3 在產品生態系統中的部署奠定了基礎。
它專注於推理、多模態和智能體, 雙子座3 它正在成為Google人工智慧策略的共同基礎:一個更直接、更少妥協、更具上下文的平台,在西班牙,您可以從 Gemini 應用開始使用它,如果您是開發者,還可以從 AI Studio 和 Vertex AI 開始使用它;AI 模式搜尋將根據市場狀況啟動。
