原標題:馬斯克帶領xAI團隊發(fā)布Grok 4,“全球最強模型”含金量如何?
7月10日中午12點,經歷了前一代模型的延期和此次直播推遲,埃隆·馬斯克終于現身Grok 4發(fā)布會進行開場,畫面中的他略顯憔悴,一周前提及“和xAI團隊通宵打磨模型”,看起來為這次發(fā)布準備已久。
在帖子中,官方稱此次發(fā)布的Grok 4是 “全球最強大的AI模型”,馬斯克則在直播中表示,“Grok 4幾乎在所有學科上都比人類研究生更聰明” ,具體含金量如何?
數據顯示,Grok 4的多項基準測試很能“打”,實現了對現有頂尖模型的超越。在AIME25數學競賽上,Grok 4拿下了滿分,在“人類最后的考試”(HLE)測試中,不用工具的情況下拿下了26.9%的高分,該測試包含 2500 個專家級問題,涵蓋上百個學科。
測評機構Artificial Analysis獲得早期訪問權限并在發(fā)布會后公布了 Grok 4 基準測試,官方提到,Grok 4的人工智能分析指數達到73,“是我們的智能指數首次將 xAI 列為第一名”。從數據來看,Grok 4領先于 OpenAI o3(70)、谷歌Gemini 2.5 Pro(70)、Anthropic的 Claude 4 Opus(64)和國內DeepSeek R1 0528(68)。

根據Artificial Analysis 的測試,在“人類最后的考試”中Grok 4則取得了24%的歷史最高分,超過了谷歌Gemini 2.5 Pro 之前21%的歷史最高分。不過,測試分數只是一方面,Grok 4模型的能力還需要看后續(xù)開發(fā)者們實際使用的效果,目前模型剛推出不久,實測案例并不多。
xAI團隊在直播中透露,Grok 4的訓練量是Grok 2的100倍,在強化學習(RL)階段投入的算力,是市面上其他任何模型的10倍以上。發(fā)布會介紹,Grok 4 的訂閱費為 30 美元/月,更強大的Grok 4 Heavy 版本的費用為300 美元/月,Grok 3 維持免費開放。
值得一提的是,此次直播比原定的時間推遲了約一小時。xAI準點發(fā)布帖子稱“Grok 4 直播即將開始”,但1小時過去直播仍未推出,評論中網友們一邊催更,一邊質疑是否“又是炒作”。
在這之前,馬斯克在X上頻頻為Grok模型預熱,但Grok 3.5模型最終跳票,一度引發(fā)對模型能力的懷疑。4 月底,馬斯克就在 X上預告,Grok 3.5Beta版下周將上線,主打專業(yè)問答能力,特別是工程、編程類問題。但直到5月中旬,馬斯克才出來回應稱,“還有點粗糙,再打磨一周。”
馬斯克在6月27日再次提到Grok,表示在和xAI團隊通宵打磨模型,進展不錯,即將發(fā)布的模型被命名為Grok 4。也就是說馬斯克和團隊選擇跳過Grok 3.5,“端”出更高的迭代版本,針對模型跳票后外界的質疑,看起來是一個很好的挽救方案。
從這次遲到看,發(fā)布顯得有些倉促,不過從性能測試看沒有讓行業(yè)失望。xAI整個團隊為這次Grok 4的發(fā)布熬了不少夜,此前有博主訪問了xAI的辦公室,畫面顯示辦公區(qū)走廊兩側全是帳篷,這意味著不少核心員工近段時間可能都睡在辦公室。
馬斯克在2023年7月才成立xAI,兩年時間就追上了行業(yè)最頂尖的水平,充足的資金和算力是他的籌碼。
為了支持Grok的開發(fā)和訓練,馬斯克在美國田納西州孟菲斯建立了超級計算中心“Colossus”,在2024年7月啟動時配備了10萬塊英偉達H100 GPU,到 2025 年 2 月,GPU 數量已翻倍至 20 萬塊。馬斯克計劃將孟菲斯超級集群的規(guī)模擴展到 100 萬塊 GPU,并且正在為此籌集資金。
就在上周6月30日,華爾街大行摩根士丹利在X上發(fā)布聲明稱,xAI已完成總計100億美元的新一輪融資,其中包括50億美元債務融資和50億美元股權融資。這是xAI繼去年兩輪各60億美元的融資后、又一輪大額融資,2024年以來xAI公開的總融資額已達220億美元(約為人民幣1579億元)。
目前尚不清楚本輪融資后xAI的具體估值,此前3月xAI與X合并后估值高達1130億美元。其中xAI估值為800億美元,X的估值為330億美元。
但如此龐大的融資,也很難支撐大模型公司的巨額花銷。據媒體援引消息人士報道,xAI目前每月消耗高達10億美元,截至2025年3月底,公司賬面現金僅剩40億美元。此次融資后,xAI或許能支撐一段時間,但明年還需繼續(xù)籌資,目前其收入遠遠小于其成本。
馬斯克曾公開表示,像xAI這類巨額虧損在整個AI行業(yè)并不罕見,主要源自高昂的服務器建設和芯片采購成本。
xAI在商業(yè)化進展方面的表現還落后于一些競爭對手,xAI的主要營收來源是X Premium的訂閱服務,預計2025年營收僅為5億美元,明年預計可達到20億美元。對比來看,OpenAI預計2025年營收將達127億美元,且業(yè)務更加多元化。
雖然此次Grok 4短暫領先了,但今年夏天OpenAI也將發(fā)布其最新旗艦模型GPT-5,這一領先優(yōu)勢能保持多久并不確定。海外大廠對于AI模型也是勢在必得,微軟、亞馬遜、谷歌和Meta四大巨頭去年的總資本支出為2300億美元,2025年這些公司的投資計劃則高達3200億美元,在財報中管理層紛紛表示,計劃增加對AI技術和數據中心建設的投資。
xAI對未來較為樂觀。在與X合并后,xAI團隊希望,能夠利用X上龐大且不斷更新的數據檔案來訓練其模型,從而避免像其他公司那樣支付昂貴的數據費用。xAI樂觀地預計將在2027年實現盈利,相比之下,OpenAI據悉預計要到2029年才能實現現金流轉正。
編程和更強大的多模態(tài)智能體是xAI接下來的看點。在此次直播中,團隊定下目標,在8月發(fā)布編程模型,9月發(fā)布多智能體,10月發(fā)布視頻生成模型。不過,結合此前多次的延期,這個時間點是否靠譜還需要打個問號。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://www.dstuf.com/