你好,歡迎來(lái)到川北在線
微信
騰訊微博
新浪微博
ChatGPT Agent 正式發(fā)布,最卷 AI 打工人來(lái)了!
時(shí)間:2025-07-19 14:57   來(lái)源:必應(yīng)   責(zé)任編輯:曉鋒
  原標(biāo)題:ChatGPT Agent 正式發(fā)布,最卷 AI 打工人來(lái)了!
 
  當(dāng)下,Agent 作為人工智能領(lǐng)域最熱門(mén)的方向,OpenAI 自然不會(huì)缺席。
 
  7月18日凌晨,OpenAI 正式發(fā)布 ChatGPT Agent。20多分鐘的演示,將 ChatGPT 從單一的對(duì)話工具升級(jí)為具備真實(shí)任務(wù)執(zhí)行能力的全能 Agent。
 
  “這讓我第一次真正感受到 AGI的存在,” Sam Altman在演示中感嘆,“觀看它思考、規(guī)劃再行動(dòng)的過(guò)程令人震撼。”
 
  從對(duì)話到行動(dòng):六大核心技術(shù)打造全能Agent
 
  ChatGPT Agent 的核心突破在于將 OpenAI 此前分散的能力—— Operator的網(wǎng)頁(yè)交互能力、Deep Research的信息綜合能力,以及ChatGPT的智能對(duì)話能力,融合為一個(gè)統(tǒng)一的任務(wù)執(zhí)行系統(tǒng)。這背后是六項(xiàng)關(guān)鍵技術(shù)能力的協(xié)同:
 
  云電腦沙盒環(huán)境:Agent 擁有完整的虛擬桌面,包含可視化瀏覽器(能點(diǎn)擊按鈕、拖動(dòng)圖片)、文本瀏覽器(高效掃描網(wǎng)頁(yè)內(nèi)容)、終端工具(運(yùn)行代碼、調(diào)試腳本)和文件編輯器。這相當(dāng)于給AI配備了一臺(tái)專屬工作電腦。
 
  多工具智能協(xié)作:Agent 能自主判斷何時(shí)使用文本爬蟲(chóng)快速收集信息,何時(shí)切換到可視化瀏覽器操作復(fù)雜界面,以及何時(shí)調(diào)用API直接獲取數(shù)據(jù),無(wú)需用戶指示工具切換。
 
  自主編程執(zhí)行能力:內(nèi)置的Codex引擎讓Agent能夠讀取代碼庫(kù)、編寫(xiě)測(cè)試、修復(fù)bug,并實(shí)際運(yùn)行腳本處理數(shù)據(jù)。Pro用戶每月可觸發(fā)高達(dá)400次Agent任務(wù)。
 
  一鍵交付工作成果:根據(jù)提示,Agent 直接生成可下載使用的文件。在發(fā)布會(huì)上,它僅用25分鐘就完成了英偉達(dá)財(cái)報(bào)分析并生成演示PPT。
 
  多步驟任務(wù)閉環(huán):從理解需求到最終執(zhí)行,Agent能編排完整工作流。演示中,它在處理婚禮禮物時(shí)被臨時(shí)要求“買(mǎi)雙黑皮鞋”,立即響應(yīng):“確認(rèn)中斷,已加入新任務(wù):查找9.5碼男士黑色正裝鞋。”處理完后又無(wú)縫返回原任務(wù)。
 
  三層安全防護(hù)機(jī)制:訓(xùn)練階段屏蔽可疑網(wǎng)頁(yè)指令;運(yùn)行時(shí)實(shí)時(shí)監(jiān)控異常行為;執(zhí)行登錄、支付等敏感操作前強(qiáng)制用戶手動(dòng)接管。OpenAI甚至為它激活了**最高級(jí)別的生物化學(xué)安全防護(hù)**,防止?jié)撛跒E用。
 
  真實(shí)場(chǎng)景演示:看Agent如何主動(dòng)幫你干活
 
  發(fā)布會(huì)上,OpenAI 成員演示了令無(wú)數(shù)職場(chǎng)人共鳴的場(chǎng)景:為朋友婚禮做準(zhǔn)備——選服裝、挑禮物、訂酒店。傳統(tǒng)流程需耗費(fèi)半天的時(shí)間,而Agent只需要一條提示,即可高效完成全套任務(wù):
 
  一、主動(dòng)澄清需求
 
  Agent 啟動(dòng)虛擬環(huán)境后,沒(méi)有直接給出答案,而是先打開(kāi)婚禮官網(wǎng)查找關(guān)鍵信息,并主動(dòng)詢問(wèn):“婚禮的確切日期是什么時(shí)候?”——這種澄清意圖的能力標(biāo)志著AI行為模式的根本轉(zhuǎn)變。
 
  二、真實(shí)操作網(wǎng)頁(yè)
 
  在男裝電商網(wǎng)站,觀眾清晰看到 Agent 的 “鼠標(biāo)”在頁(yè)面上移動(dòng):點(diǎn)開(kāi)詳情頁(yè)、閱讀面料說(shuō)明、篩選合適尺碼。當(dāng)選中一套深灰色西裝時(shí),它在旁邊標(biāo)注:“這套比較適合當(dāng)天的天氣。”這并非基于文字描述的判斷,而是真實(shí)視覺(jué)瀏覽后的決策。
 
  三、自主延伸任務(wù)
 
  搞定服裝后,Agent未停歇,自動(dòng)延伸至酒店預(yù)訂。它打開(kāi)Booking.com,比較位置、價(jià)格和評(píng)分,最終篩選出三家最優(yōu)選項(xiàng),并提示:“如需下單,我可繼續(xù)。”整個(gè)過(guò)程沒(méi)有用戶額外指令,完全基于初始任務(wù)意圖。
 
  更驚人的是第二個(gè)演示:用手機(jī)發(fā)出一條指令:“為團(tuán)隊(duì)吉祥物設(shè)計(jì)500張貼紙,動(dòng)漫風(fēng)格”。
 
  Agent 隨即調(diào)用圖像API生成設(shè)計(jì)稿,自動(dòng)打開(kāi)貼紙定制網(wǎng)站,將成品加入購(gòu)物車(chē),最后彈出提示:“請(qǐng)確認(rèn)是否付款。”
 
  傳統(tǒng)需多次跳轉(zhuǎn)的復(fù)雜流程,被壓縮為一句自然語(yǔ)言指令。
 
  商業(yè)生態(tài)重構(gòu):AI從工具升級(jí)為交易平臺(tái)
 
  ChatGPT Agent的野心不止于提升效率。當(dāng)它能完成“搜索商品→比價(jià)→加入購(gòu)物車(chē)→生成訂單”的全流程時(shí),OpenAI正在構(gòu)建全新的商業(yè)模式。
 
  據(jù)披露,OpenAI正在測(cè)試平臺(tái)內(nèi)集成結(jié)賬系統(tǒng)。未來(lái)當(dāng)用戶通過(guò)Agent完成交易,OpenAI可能向商家收取傭金。Altman在接受Stratechery采訪時(shí)坦言:“如果你通過(guò)Deep Research發(fā)現(xiàn)并購(gòu)買(mǎi)商品,我們會(huì)抽取約2%的聯(lián)盟費(fèi)用。”
 
  這徹底改變了互聯(lián)網(wǎng)商業(yè)邏輯:
 
  傳統(tǒng)搜索(Google模式):提供信息→用戶跳轉(zhuǎn)至商家→平臺(tái)賺取廣告費(fèi)
 
  Agent新模式:理解需求→直接完成交易→平臺(tái)收取傭金
 
  當(dāng)用戶對(duì)Agent說(shuō)“幫我訂周五晚餐”,它不僅推薦餐廳,還能直接完成OpenTable預(yù)訂;當(dāng)要求“分析Q3財(cái)報(bào)數(shù)據(jù)”,它直接生成帶圖表和洞察的PowerPoint文件。
 
  每一次任務(wù)執(zhí)行,都可能是一次商業(yè)轉(zhuǎn)化。
 
  安全與邊界:可協(xié)作的智能體才是未來(lái)
 
  能力越大,責(zé)任越大。Agent能真實(shí)操作系統(tǒng)和支付,也讓風(fēng)險(xiǎn)升級(jí)。OpenAI采取了多層防護(hù):
 
  執(zhí)行控制:涉及登錄、支付等高危操作時(shí),Agent會(huì)暫停并請(qǐng)求用戶手動(dòng)接管。如演示中,它始終停在付款確認(rèn)環(huán)節(jié):“請(qǐng)確認(rèn)是否繼續(xù)下單”。
 
  行為監(jiān)控:特別設(shè)計(jì)的“Watch Mode”確保用戶在金融等敏感頁(yè)面離開(kāi)標(biāo)簽頁(yè)時(shí),Agent自動(dòng)停止運(yùn)行。系統(tǒng)還實(shí)時(shí)檢測(cè)異常行為,阻斷可能的惡意指令注入。
 
  能力限制:盡管已激活高級(jí)生物化學(xué)防護(hù),OpenAI仍明確表示暫不支持金融交易操作,并建議用戶遵循“最小權(quán)限原則”——僅開(kāi)放必要數(shù)據(jù)權(quán)限。
 
  “我們做的是可協(xié)作的 Agent,而不是失控的自動(dòng)腳本。”OpenAI 工程師Edward在發(fā)布會(huì)上強(qiáng)調(diào)。這種設(shè)計(jì)哲學(xué)讓Agent更像數(shù)字搭檔而非自動(dòng)化工具,它懂得何時(shí)該問(wèn)、何時(shí)該等、何時(shí)該讓用戶接手。
 
  操作系統(tǒng)級(jí)革命:你的下一臺(tái)電腦可能是個(gè)對(duì)話框
 
  ChatGPT Agent 的終極意義在于重構(gòu)人機(jī)交互范式。過(guò)去完成復(fù)雜任務(wù)需要:打開(kāi)瀏覽器→搜索信息→切換電子表格→手動(dòng)整理數(shù)據(jù)→制作幻燈片。
 
  而現(xiàn)在,用戶只需對(duì)ChatGPT說(shuō)一句:“分析英偉達(dá)最新財(cái)報(bào),制作10頁(yè)摘要PPT。”
 
  Agent隨即啟動(dòng)虛擬環(huán)境:用文本瀏覽器抓取財(cái)報(bào)數(shù)據(jù)、在終端運(yùn)行Python分析、生成可視化圖表、最后打包成可下載的PPT文件。整個(gè)過(guò)程無(wú)需用戶點(diǎn)擊任何軟件或網(wǎng)頁(yè)。
 
  正如OpenAI產(chǎn)品負(fù)責(zé)人Yash Kumar所言:“我們要做的不只是回答問(wèn)題,而是替用戶把事辦完。”這標(biāo)志著AI從“功能增強(qiáng)”轉(zhuǎn)向“任務(wù)接管”——它不再是你使用的工具,而是替你操作工具的執(zhí)行者。
 
  現(xiàn)在與未來(lái):誰(shuí)將掌握AI時(shí)代的入口?
 
  目前ChatGPT Agent已向Pro、Plus和Team用戶開(kāi)放。Pro用戶每月400次查詢額度,Plus和Team用戶40次。
 
  在性能方面,ChatGPT Agent 交出了亮眼成績(jī)單:
 
  41.6%的準(zhǔn)確率通過(guò)人類(lèi)最后考試(Humanity’s Last Exam),遠(yuǎn)超o3模型的24.9%;27.4%的得分刷新數(shù)學(xué)基準(zhǔn)測(cè)試FrontierMath紀(jì)錄,比Gemini Pro 2.5高出一倍多;85.5%的準(zhǔn)確率完成數(shù)據(jù)建模任務(wù),顯著超越人類(lèi)數(shù)據(jù)分析師的65%平均水平。
 
  Altman 在發(fā)布會(huì)上坦承:“這是人類(lèi)與AI共存的實(shí)境測(cè)試,社會(huì)、技術(shù)與風(fēng)險(xiǎn)管理策略都需要同步發(fā)展。”當(dāng)AI真正開(kāi)始“動(dòng)手”做事,我們不得不重新思考:哪些工作值得人類(lèi)親力親為?
 
  隨著微軟Copilot、谷歌Gemini、xAI的Grok等競(jìng)品加速進(jìn)化,AI代理大戰(zhàn)已全面打響。但OpenAI通過(guò)ChatGPT Agent傳遞出清晰信號(hào):未來(lái)的競(jìng)爭(zhēng)不在回答質(zhì)量,而在于誰(shuí)能成為用戶任務(wù)的第一入口,那個(gè)你開(kāi)口說(shuō)話,就能把事辦妥的“云電腦”。
 
  當(dāng)Altman看著Agent自動(dòng)瀏覽網(wǎng)頁(yè)挑選西裝時(shí),那句喃喃自語(yǔ)的“它真的在工作”,或許正是對(duì)這個(gè)新時(shí)代的最佳注解。

   投稿郵箱:chuanbeiol@163.com   詳情請(qǐng)?jiān)L問(wèn)川北在線:http://www.dstuf.com/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來(lái)源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類(lèi)稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點(diǎn)不代表本站立場(chǎng),其真實(shí)性由作者或稿源方負(fù)責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評(píng)。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲(chǔ)視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問(wèn)題,請(qǐng)與本網(wǎng)聯(lián)系,我站將及時(shí)進(jìn)行刪除處理。



合作媒體
IT人網(wǎng) 綠植迷 女邦網(wǎng)
法律顧問(wèn):ITLAW-莊毅雄律師