首页
今天破晓宣布的 GPT-5.3-Codex 可以说是 OpenAI 对这段时间来,种种外地 Agent 爆火的一记重拳回手,虽然主要是对 Anthropic 的还击。
配合 OpenAI 前几天的宣布的 Codex 桌面版应用,Skill、Cowork、Claude Code,甚至是 Openclaw,这些热门工具能实现的功效,现在通过 Codex 的外壳 + GPT-5.3-Codex 模子能力,都能做到了。
▲ 在 Codex App 内可以直接选择 GPT-5.3-Codex 模子,也能选择深度思索的强度
和之前先容 Cowork 的能力一样,我们也丢了一些类似的使命让 Codex 来完成,像是直接处置惩罚外地文件、种种名堂转换、挪用差别的 Skills 组合能力、做 Word/PPT/Excel、下载视频、开发 App……
GPT-5.3-Codex 的体现确实亮眼,相较量重新最先装置 Claude Code,对新人用户来说,现在直接下载 Codex 会是一个更好的选择。这也是未来模子厂商的一种趋势,一最先各人都是从黑乎乎的下令行终端最先做外地 Agent,接着都逐步回归到可视化的友好界面。
网上对 Codex 的评价在这几天也有了不少逆转,许多开发者从 Claude Code 转向 Codex,一些在海内的自力开发者也体现 Codex Plus 会员就可以用,并且还不会像 Claude 那般总是无情封号。
奥特曼更是激动的宣布,Codex 的活跃用户已经凌驾 100 万。在模子更新博客,也是绝不掩饰和留有余地的夸赞,
GPT-5.3-Codex 是我们第一个能够自我构建的模子。通过使用 5.3-Codex,我们能够以云云快的速率宣布 5.3-Codex。
跟 Claude 团队用两周的时间,使用 Claude Code,100% AI 代码,搓出一个 Cowork 一样;尚有 OpenAI 去年年底宣布的文章,「使用 Codex 在 28 天内构建 Android 版 Sora」,Agent 的时代真的来了。
用 Codex 取代我的 ChatGPT 和 Claude Code
和大大都的外地 Agent 一样,无论是终端照旧 Cowork,我们都是先选择一个事情文件夹。在 Codex 中,我们可以建设多个 Project,选择对应的文件夹,再进一步最先对话,Codex 把它们叫做 Threads 线程。
先用最普遍和简朴的例子,我们添加了一个空的下载文件夹,然后点击最先一个线程,选择 GPT-5.3-Codex 模子;就像在 ChatGPT 内里对话一样,输入指令。
要求它帮我们下载一个 X 视频,Codex 会自动检查可用的 Skills 来处置惩罚,接着通过 yt-dlp 工具举行下载,这个视频有四个多小时长,Codex 会一直在对话框里自动更新下载进度。
▲GIF 图经由加速处置惩罚
视频下载后,我们还可以要求它提取视频的逐字稿,给我们一份双语版本的文档,最后让它把整个流程打包为一个 Skill,利便下次使用。
若是视频中有一些较量有意思的片断,想要裁剪视频,或者是把裁出来的视频转成 GIF 图,在 Codex 里都能做到。
例如,我们这里下载了一个视频,然后要求它把视频的 5s-25s 裁剪出来成为一个新的视频;得益于 GPT-5.3-Codex 的 Token 快速处置惩罚,整个历程不需要很长时间,反而更多是取决于外地电脑的硬件解码编码能力。
▲ GIF 图经由加速处置惩罚
或者我们也可以直接要求它把视频的前 5s 转成一个 GIF 文件,并且确保巨细在 10MB 以内,帧数可以自行调解,清晰度上将宽度控制在 640px。
很快,我们就能获得对应的 GIF 文件。更极端一点,还能让它把整个视频转成图片,每秒 30 帧,每一帧就是一张图。
这些对外地文件的直接处置惩罚,和 GPT-5.3-Codex 在 Terminal-Bench-2 测试集上的优异体现,让 Codex 基本上能知足种种生产力工具、效率工具的功效实现。
作为比照,同样是刚刚宣布的 Claude Opus 4.6 在 Terminal-Bench 2.0 上得分是 65.4%,GPT-5.3-Codex 是 77.3%。
▲ 图片泉源:https://x.com/neilsuperduper/status/2019486017703547309/
例如在这个文件夹中,有多张图片,我们首先是要求它凭证图片内容,对这些图片文件举行重命名,并坚持文件名不凌驾 20 个字母,不允许使用符号。
▲ GIF 图经由加速
自动修改完成后,我们还能要求他对这些图片举行拼接,无论是笔直拼接照旧水平,挪用对应的工具,Codex 都可以做到。
和 Claude Skills 一样,Codex 也能装置 Skills 市场上富厚的手艺,并且在应用内,就已经提供了包括 pptx、xls、word、canvas、notion 在内的多款手艺。
回到基础的编程能力,升级后的 GPT-5.3-Codex 体现也比 GPT-5.2 要好上不少。我们直接要求它写一个「逐日一词」的 App。和在 ChatGPT 内里直接用 Canvas 给我们一个带不走的网页差别,Codex 能在外地从零最先,完成项目,然后使用 Vercel 或 Cloudflare 等 Skills 安排到网页上。
这里我们选择的推理模式是 Extra High,超强推理模式,于是在每一步操作之前,GPT-5.3-Codex 都会询问我下一步的操作选择,这也和 Codex 内部能直接凭证使命情形,挪用差别 Skills 有关,其中的头脑风暴 Skill,会自动举行一直对话的模式。
最后,它基本上照旧完成了我一最先要求它完成的所有功效,并且还能进一步开发 macOS、iOS,和安卓版本。
若是我们有现成的代码项目,也可以选择该项目文件夹,在 Codex 中翻开,GPT-5.3-Codex 会剖析项目保存的 Bug,并且修复它。
在已往很长一段时间里,无论是工具照旧模子,开发者的首选着实都是 Anthropic 的 Sonnet/Opus 模子和 Claude Code 工具。OpenAI 在编程、尤其是长代码逻辑推理上的落伍,曾让不少开发者转投阵营。
GPT-5.3-Codex 的泛起,就是为了终结这场争论。现在 GPT-5.3-Codex 在编程基准测试和现实体现上,不但碾压了自家的前代模子,也确实有把友商模子按在地上摩擦的先兆。它真正具备了编写、测试和推理代码的能力。
做游戏项目,是这次模子先容博客里,网站开发部分主要案例,我们也让 GPT-5.3-Codex 做了一个简朴的物理弹球游戏,整体的效果虽然没有抵达我的期待,由于我在提醒词内里有说希望这是一个 RPG 的游戏,但 GPT-5.3-Codex 给我的界面照旧过于简陋了。不过,幸亏照旧能玩。
我们也在 X 上找到了一些用 GPT-5.3-Codex 做的小游戏,像这个类似超等玛丽的网络金币。
▲泉源:https://x.com/Angaisb_/status/2019548783869325331
强中更有强中手
对 Anthropic 来说,OpenAI 今天玩的这些,可能会说,这都是我们玩剩下的。无论是代码、或者 Agent 的能力,照旧最先着手去做外地 Agent,从之前 Codex 的终端转成现在的 macOS App。
在手艺的领域,OpenAI 似乎都是随着 Claude 的脚步在走,Claude 深耕代码能力,OpenAI 搞了 Sora、日报、浏览器、ChatGPT agent,都没什么水花,于是也在代码上发力;Claude 一月初推出 Cowork,OpenAI 也紧接着在仲春初宣布 Codex App。
就和今天的麋集宣布一样,破晓 1:45,Claude 官方发 X 推出 Claude Opus 4.6,紧接着就是 OpenAI 端上 GPT-5.3-Codex。两款模子着实都是为了给 Agent 更强盛的基座能力,以前是说代码/vibe coding,但现在 Agent 能做好,基本上都是「写代码写得好」。
Opus 4.6 虽然在 SWE-Bench 上的体现甚至不如 Opus 4.5,并且 Terminal-Bench 2.0 上的效果也没有 GPT-5.3-Codex 强,可是 Opus 破天荒地把上下文长度拉到了一百万 token 的窗口。并且,这些 benchmark 的体现还没有相差许多。
Claude 说,我的 Sonnet 5 还没上来,那才是真功夫。
我们在网上也找了一些 Opus 4.6 最新的测试案例,有网友说 Claude 4.6 Opus 只是一次挪用,就完全重构了他的整个代码库,将原来杂乱的代码「屎山」所有?榛,并且没有模子能像 Opus 这样做到。
尚有网友拿 Opus 4.6 和 4.5 举行比照,让两个模子玩统一款谋划游戏,看谁的账户品级、财产和装备更高。测试博主提到,4.6 版本在初期制订战略的时间更长,可是做出了更好的战略决议,并且在最后确实做到了遥遥领先。
尚有网友也做了一个游戏,不过是一个宝可梦的克隆版。博主提到这是他用 AI 做出来的最酷的工具。他提到,Claude Opus 4.6 思索了 1 小时 30 分钟,使用了 11 万个 Token,并且只迭代了三次。
▲ https://x.com/chatgpt21/status/2019679978162634930
在 CLaude 官方演示和早期用户的反响中,也提到了一个 Opus 体现优异的案例。Opus 4.6 在一天内自主关闭了 13 个 issue,issue 即项目保存的待解决问题,并将另外 12 个 issue 准确分派给了准确的人类团队成员。
和 Kimi K2.5 的智能体蜂群一样,Opus 4.6 也能治理一个 50 人规模组织的代码库。在 Claude Code 中,我们可以组建 Agent Teams,召唤出一整个步队的 AI,不再是一个 AI 在战斗。这些AI 可以有的认真写代码,有的认真 Review,有的认真测试,它们之间自主协作。
也有网友测试了 Claude Code 内里的 Agent 蜂群,提到启用蜂群之后的 Opus 4.6,速率提升 2.5 倍,并且效果也更好。
我们现在的状态就跟这张图片一样,虽然一山比一山高,但都绕不出这个圈。前几个月可能是 Gemini 赚走了风头,一月份来,应该是 Claude,然后看样子又要轮到 OpenAI,或者马斯克的 Grok。
幸亏这个循环的历程中,作为用户的我们,能显着感受到 AI 的能力一直在变强。
GPT-5.3-Codex 的 API 还没有开放,缘故原由是模子太强了,会保存很大的危害,以是 OpenAI 还在思量怎么清静地启用 API。
Claude Opus 4.6 已经可以在 Claude 通用谈天应用、Claude Code、API 多种方法使用,这两个作为今年外洋御三家首发的两款模子,很是值得一试。
未来,更好的效劳 Agent,让 Agent 为我们做事,还会是大模子更新的重点。
《免费看黄色啊啊啊在线网站》,《Q8X2R7L1T4J5M9B6W3》免费 成人 视频
“鸥美三级片视频”
黄片免费A级
……
02月08日
“日日日日日日BBBBB视频”吃火锅意外吃出甄嬛传片头
↓↓↓
02月08日,2024第二届水岸铁人运动公开赛举行,永久免费观看黄色网站,欧美日韩中文字幕第一页,亚洲欧美福利三区,欧美5~12呦交在线观看
02月08日,侨乡新征程|保山“侨味”餐馆见证四十余年生活变迁,一本综合在线,18 秘,无尽 得到 向上 可爱 葡萄收获期,AV集中淫
02月08日,新能源汽车渗透率过半,与燃油车的竞争将走向何方?,色呦呦精品在线,妲己❌爆乳❌妲己自慰日本,成人免费网站下载,露脸九色
02月08日|李强出席世界经济论坛2024年年会并发表特别致辞|熊猫 yy8y(3)|强奸国产无码激情|涩谷果步rct系列|婷婷五月丁香国产
02月08日|中伊俄“安全纽带-2024”联合演习开幕|老骚逼要黑鸡巴日|成人网站 汤不热视频免费APP|夫妻高潮45分钟黄色|曰韩三级
02月08日|山西打出“组合拳” 破矿山安全“十多十难”|欧美综合精品视频一区二区|999精品视频3|激情偷人乱小说视频|a毛片免费播放无码app……
02月08日,日本女川核电站一设备意外启动 电力公司称无辐射影响,欧美伦乱,y31成色1.232ct的最新版本更新内容官方版下载,色色干干干要射,黄色网站18岁的
02月08日,道路因雪崩阻断,喀纳斯景区1月20日前暂停开放,一级黄色强奸美女视频,色色色色网站,毛片性交基地,欧美性做爰大片免费看A片猎魔士
02月08日|青海撒拉尔之乡:航拍油菜梯田花开如画|欧美一级婬片A片免费手机版原罪|www.你懂的|熟女天堂av专区|尿孔穿环全过程视频
02月08日,晋祠庙会:传统与现代交融 老庙会焕发新生机,免费看很黄A片在线观看视频,少萝裸体 自慰高清,馃崋馃崙馃敒馃埐,人人插人人骚人人射
02月08日,国家防总针对京津冀晋启动防汛四级应急响应 ,国产91人人超碰cao三级,人人玩人人摸,黄色网站日本免费,銑欙笍馃埐馃敒馃敒
02月08日,跨省也能给家人用 快来学习“医保钱包”如何操作,一级片A片网站网站,WWW.99riav55,日本熟妇槡BBBB槡BBBB搡AA,国产良心剧大尺度烈火红梅
02月08日|四川省甘孜州政协原党组书记、主席雷建平被开除党籍和公职|男生坤怼女|云开·全站APP官方下载手机版|综合久久先锋第五页|免费 成人 调教师app
02月08日|日本执政联盟在众议院选举中未获过半议席|18 无套直国产红桃|欧美东京热视频|永久黄APP色视频免费观看|玉浦园电影免费
02月08日|秦国文同志任湖南省委常委、秘书长|www狼友coN|近相亲祖母六十俱乐部在线观看|面具公社网页版链接|美女国产精品是小视频频区
韩国执政党反对弹劾尹锡悦,赤热|云南省司法厅原一级巡视员夏新建被“双开”|精品调教视频在线观看|黄婷120分钟无删减版|亚洲热在线|久久青草国产免费观看
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
外交部:中方对中非合作论坛建设有三方面期待
湖南新田发展特色种养殖产业振兴乡村
(巴黎奥运)“00后”滑板小将崔宸曦:从一个人滑到一群人滑
特色文旅激活假期“消费DNA” 岭南美食带火广西梧州“味蕾游”
以数字技术赋能文化体制机制改革
浙江交通观察:路通何以助力百业兴?
叙反对派武装攻入重要城市哈马 联合国呼吁用政治手段结束冲突
AI技术全面渗入如何影响电影行业
泉州宝藏之安平桥: 这座宋代“超级工程”被称为“炫技之作”
秘鲁国家情报局前主管因屠杀农民被判刑19年零8个月
大屌网站
夜
欧美一级性交黄色视频
男生被c 黄秘 动漫
欧美国内一区二区
国产在线水插区
国语自产偷白青品视频偷97
夜爱视频
黄视频
6080午夜二级

闽公网安备 35010302000113号