天天干天天色天天射,99久久99

深夜突襲！OpenAI的AI程序員上線，人類僅需點(diǎn)按鈕

智東西

2025-05-17 10:05:26

作者 | 李水青

編輯 | 心緣

智東西5月17日報道，昨夜，OpenAI推出一款基于云的軟件工程Agent（智能體）——Codex的預(yù)覽版。

Codex可并行處理多項任務(wù)，例如編程、解答代碼庫相關(guān)問題、修復(fù)錯誤以及提交拉取請求以供審核等，在云上運(yùn)行并預(yù)加載用戶代碼庫。

Codex由codex-1模型提供支持。codex-1是OpenAI o3針對軟件工程優(yōu)化后的版本。目前，Codex已面向ChatGPT Pro、Team和Enterprise用戶上線，即將面向Plus用戶上線。

OpenAI同步推出codex-1的精簡版本，基于o4-mini專為輕量級開源編碼Agent“Codex CLI”而打造，API定價為1.5美元/100萬 tokens輸入， 6美元/100萬tokens輸出，即時緩存打七五折。

體驗地址：

https://chatgpt.com/codex

01.

自己寫代碼提交更改

跑一次1-30分鐘

現(xiàn)在，用戶可以通過ChatGPT的側(cè)邊欄訪問Codex，通過輸入提示并點(diǎn)擊“代碼（Code）”按鈕下達(dá)編程任務(wù)，也可以點(diǎn)擊“Ask（提問）”向Codex詢問有關(guān)代碼庫的問題。每個任務(wù)都在預(yù)加載了用戶代碼庫的獨(dú)立隔離環(huán)境中獨(dú)立處理。

Codex可以讀取和編輯文件，以及運(yùn)行包括測試工具、類型檢查器等在內(nèi)的命令。任務(wù)完成通常需要1-30分鐘，具體取決于復(fù)雜程度，用戶可以實時監(jiān)控Codex的進(jìn)度。

Codex完成任務(wù)后，會在其環(huán)境中提交更改。通過引用終端日志和測試輸出，Codex來提供其操作的可驗證證據(jù)，讓用戶可以追蹤任務(wù)完成過程中的每個步驟。

用戶可以查看結(jié)果、請求進(jìn)一步修訂、提交GitHub拉取請求，或直接將更改集成到本地環(huán)境中。在產(chǎn)品中，用戶可以配置Codex環(huán)境，使其盡可能與實際開發(fā)環(huán)境匹配。

Codex可以通過放置在用戶代碼庫中的AGENTS.md文件進(jìn)行引導(dǎo)。這些文本文件類似于README.md，用戶可以在其中告知Codex如何導(dǎo)航代碼庫、運(yùn)行哪些命令進(jìn)行測試以及如何最好地遵循項目的標(biāo)準(zhǔn)實踐。與人類開發(fā)人員一樣，Codex在配置好開發(fā)環(huán)境、可靠的測試設(shè)置和清晰的文檔后，性能最佳。

在編碼評估和內(nèi)部基準(zhǔn)測試中，即使沒有AGENTS.md文件或自定義代碼生成器，codex-1也表現(xiàn)出強(qiáng)勁的性能。

23個無法在OpenAI內(nèi)部基礎(chǔ)架構(gòu)上運(yùn)行的SWE-Bench Verified樣本被排除在外。codex-1的測試設(shè)置最大上下文長度為192k tokens，推理難度為中等，這也是目前產(chǎn)品中可用的設(shè)置。

02.

報錯自動告知用戶，過程可檢測

在安全和透明度方面，用戶可以通過引用、終端日志和測試結(jié)果來檢查Codex的工作。

當(dāng)不確定或面臨測試失敗時，Codex會明確地告知這些問題，使用戶能夠就如何繼續(xù)進(jìn)行做出正確決策。

訓(xùn)練codex-1的主要目標(biāo)，是讓它的輸出與人類的編程偏好和標(biāo)準(zhǔn)更接近。

如下圖所示，與OpenAI o3模型相比，codex-1始終能夠生成更清晰的補(bǔ)丁，可供立即進(jìn)行人工審核并集成到標(biāo)準(zhǔn)工作流程中。

為了平衡安全性和實用性，Codex經(jīng)過了訓(xùn)練，能夠識別并精準(zhǔn)拒絕旨在開發(fā)惡意軟件的請求，同時清晰區(qū)分并支持合法任務(wù)；還增強(qiáng)了政策框架，并納入了嚴(yán)格的安全評估。

Codex完全在云端安全隔離的容器中運(yùn)行。

在任務(wù)執(zhí)行期間，互聯(lián)網(wǎng)訪問被禁用，Agent的交互僅限于通過GitHub代碼庫明確提供的代碼以及用戶通過安裝腳本配置的預(yù)安裝項。Agent無法訪問外部網(wǎng)站、API或其他服務(wù)。

03.

Pro用戶可免費(fèi)體驗

API收費(fèi)1.5美元/100萬 tokens輸入

上個月，我們推出了Codex CLI，一款在終端中運(yùn)行的輕量級開源編碼Agent。它將o3和o4-mini等模型功能引入到用戶的本地工作流程中。

今天，OpenAI還發(fā)布了codex-1的精簡版本，這是專為Codex CLI使用而設(shè)計的o4-mini版本。

這個新模型支持CLI中更快的工作流程，并針對低延遲代碼問答和編輯進(jìn)行了優(yōu)化，同時保留了指令遵循和樣式方面的相同優(yōu)勢。它現(xiàn)在是Codex CLI中的默認(rèn)模型，并在API中以codex-mini-latest的形式提供。

使用ChatGPT登錄Codex CLI的Plus和Pro用戶，今天晚些時候即可開始兌換價值5美元和50美元的免費(fèi)API積分，有效期為30天。

對于使用codex-mini-latest構(gòu)建的開發(fā)人員，該模型可在Responses API上使用，價格為1.5美元/100萬 tokens（輸入）， 6美元/100萬 tokens（輸出），享受75%的即時緩存折扣。

OpenAI的技術(shù)團(tuán)隊已開始將Codex納入其日常工具包。

工程師們最常使用它來卸載那些重復(fù)且范圍明確的任務(wù)，例如重構(gòu)、重命名和編寫測試。它同樣適用于構(gòu)建新功能、連接組件、修復(fù)錯誤以及起草文檔。

在發(fā)布之前，OpenAI還與一小群外部測試人員合作。

比如，思科正在探索Codex如何幫助其工程團(tuán)隊更快地將想法付諸實踐，并向OpenAI團(tuán)隊提供反饋；Temporal?使用Codex加速功能開發(fā)、調(diào)試問題、編寫和執(zhí)行測試以及重構(gòu)大型代碼庫等。

根據(jù)早期經(jīng)驗，OpenAI建議同時將范圍明確的任務(wù)分配給多個Agent，并嘗試不同類型的任務(wù)和提示，以有效地探索模型的功能。

04.

結(jié)語：Codex仍處早期階段

未來或成主流

OpenAI坦言，Codex的開發(fā)仍處于早期階段。作為研究預(yù)覽版，它目前缺少一些功能，例如用于前端工作的圖像輸入，以及在Agent工作時對其進(jìn)行方向修正的功能。此外委托給遠(yuǎn)程Agent比交互式編輯耗時更長，都需要時間改進(jìn)。

這僅僅是一個開始，可以預(yù)測，Codex在ChatGPT中引入的異步多Agent工作流將成為工程師編寫高質(zhì)量代碼的主流方式，實時配對和任務(wù)委托兩種交互模式將逐漸融合。

上一篇：小米造芯耗費(fèi)十余年雷軍感慨：十年飲冰難涼熱血

下一篇：開了5個月還掛錯擋？比亞迪怒懟“黑公關(guān)”：絕不姑息

八戒八戒午夜视频_国产欧美一区二区三区不卡_乡村大坑的性事小说_女人脱裤子让男生桶爽在线观看