首页
henry 发自 凹非寺量子位 | 公众号
ChatGPT三岁生日这一天,硅谷热议的新模子来自DeepSeek
准确说是两款开源模子——DeepSeek-V3.2DeepSeek-V3.2-Speciale
这俩模子火到什么水平呢?
有网友体现,在去圣地亚哥的(疑似赶场NeurIPS 2025)航班上,有30%的旅客都在对着DeepSeek的PDF两眼冒光。
而上周讥笑DeepSeek “昙花一现”的推特更是在宣布确当晚被刷到了500万浏览。
除了通俗网友,奥特曼也是急急急急:不但启动红色警报,还暂时推迟了在ChatGPT上投放广告的妄想。
与此同时,那一头的谷歌也没被放过。
网友直接 “灵魂喊话” 谷歌Gemini团队:别睡了,DeepSeek回来了。
这是怎么一回事?
闭源精锐?打的就是闭源精锐!
总的来说,DeepSeek-V3.2模子在智能体评测中抵达了目今开源模子的最高水平,大幅缩小了开源模子与顶尖闭源模子的差别,并宣告了闭源落伍开源的竣事。
其中,标准版DeepSeek-V3.2在推理测试中,抵达了GPT-5的水平,仅略低于Gemini-3.0-Pro。
而“特殊版”DeepSeek-V3.2-Speciale不但全方位逾越了GPT-5,还能在主流推理使命中和Gemini-3.0-Pro掰掰手腕。
别的,V3.2-Special还拿下了IMO、CMO、ICPC及IOI的金牌,并在ICPC和IOI上抵达了人类选手第二名与第十名的水平。
这不但击碎了开源模子落伍闭源模子半年的质疑,又顺便给硅谷的闭源AI公司好好上了一波压力。
并且,这还不是V4/R2。
换句话说,大菜还没上呢,光凉菜就已经让硅谷吃饱了。
关于DeepSeek-V3.2这次的效果,DeepSeek研究院苟志斌(Zhibin Gou)在推特上给出了相当直觉性的解答:
强化学习在长上下文长度下也能一连扩展。
为了明确这句话,我们简要地回首一下论文。
简朴来说,DeepSeek-V3.2着实干了这么几件事:
首先,使用DSA希罕注重力解决了长上下文的效率问题,为后续的长序列强化学习打下了盘算基础。
接下来,通过引入可扩展的RL,并投入凌驾预训练本钱10%的算力举行后训练,大幅提升模子的通用推理和智能体能力。
最后,DeepSeek-V3.2-Speciale版本为了探索推理能力的极限,特意放宽了RL的长度限制,允许模子天生极长的“头脑链”,迫使模子通过大宗的Token天生来举行深度的自我修正和探索。
这也就是说,通过长头脑链让模子思索更多,通过自我修正探索让模子思索更久,进而解锁更强的推理能力。
由此,模子就能在不增添预训练规模的情形下,通过极长的思索(消耗更多token)历程实现性能的奔腾。
而上面的实验效果,恰恰证实晰这套“在超长上下文下一连扩展强化学习”蹊径的准确性。
正如苟志斌所说:
若是说Gemini-3证实晰:预训练可以一连扩展,那么DeepSeek-V3.2-Speciale 则证实晰:强化学习在长上下文长度下也能一连扩展。我们花了一年时间把 DeepSeek-V3 逼到极限。获得的教训是:后训练阶段的瓶颈,不是等“更好的底座模子”来解决,而是靠要领和数据自己的精炼(refine)来解决。
换句话说,若是说Gemini-3 靠“堆知识(预训练)”赢得了上半场,那么DeepSeek-V3.2-Speciale则通过“堆思索(长上下文RL)”赢回了下半场。
别的,关于大模子已经撞到天花板了的论调,他体现:
预训练能scaling,RL也能scaling,context也能scaling,所有维度都还在上涨。
这批注RL不但有用,还能通过scaling(更大 batch、更长context、更富厚使命)获得巨额收益
同时,在论文中,也有网友发明了为什么DeepSeek-V3.2在HLE和GPQA 等知识基准测试中体现稍逊:
由于盘算资源有限!而单靠强化学习是无法抵达这样的水平的。
换句话说,DeepSeek与顶尖模子的差别已经不是手艺问题,而是经济问题
只要卡够,好的开源不比闭源差!
想到会自制,没想到会自制这么多
除了性能上持平顶尖闭源模子外,DeepSeek-V3.2系列这次也着实让各人见识到了“智能自制到不必计费”。
若是从百万token输出成原来看,DeepSeek-V3.2比GPT-5自制近24倍,比Gemini 3 Pro,自制近29倍。
而随着输出token个数的增添,这个差别最高可拉大到43倍
这是什么看法呢?就好比你让大模子一次性“写”出一套《三体》三部曲,用GPT-5你或许需要八百块,Gemini 3 Pro需要一千块。
用DeepSeekV3.2只需要差未几35块钱!
以是,性能差未几,价钱却能差出几十倍。该选哪边,谜底不必多说了吧?
对此,有网友体现,DeepSeek-V3.2这一经济实惠的开源模子正在挑战Gemini3.0 Pro。
而另一头OpenAI腾贵的订阅费,瞬间就不顺眼了。
虽然,这并不是说DeepSeekV3.2毫无弱点。
正如一位网友指出的,同样解决一个问题,Gemini只需要2万个token,而Speciale则需要破费7.7万个。
(这现实上也是上面长下文RL的trade off)
不过,低廉的价钱也在一定水平上填补了现阶段Speciale版本的弱点。
总的来说,DeepSeek仍然是更实惠的谁人。
除此之外,也许更让硅谷感应头疼的就是DeepSeek-V3.2还可能直接在国产算力(华为、寒武纪)中安排,而这将进一步拉低模子推理的本钱。
此前,在宣布DeepSeek-V3.2-Exp时,DeepSeek在宣布首日就针对华为Ascend硬件和CANN软件栈举行了优化。
这次的DeepSeek-V3.2系列虽然没有明确体现,但或许率也会延续此前的战略。
换句话说,难过可能的不止是谷歌和OpenAI,尚有他们的好兄弟——英伟达。
然而,这里的价钱还只是模子公司的定价,并非推理的现实本钱。
只管我们无法得知各家模子现实的推理本钱,但从DeepSeek的手艺报告中可以看到一个清晰趋势:
相较于前一代模子DeepSeek-V3.1-Terminus,DeepSeek-V3.2在最长上下文(128K)场景下,本钱降低了75%83%左右。
这意味着随着注重力机制与后训练的一直优化,底层推理本钱正在一连下探
正如一位网友所总结的那样:
DeepSeek证实晰:实现强盛的AI,并纷歧定需要夸张的资源投入。
[1]https://x.com/airesearch12/status/1995465802040983960
[2]https://www.nbcnews.com/tech/innovation/silicon-valley-building-free-chinese-ai-rcna242430
《69人妻精品久久无码专区》,《Q8X2R7L1T4J5M9B6W3》十八禁免费视频在线播放
“国产视频91”
动漫被 到爽 流网站
……
12月10日
“林小喜趣味阁”整车超30万元!小米SU7单车成本曝光
↓↓↓
12月10日,“绅装骑行”引争议 小资还是审丑?,IGAO为爱寻找激情在线看,国产精品资源网站视频,18禁黄色女同网站网站,久久综合色站
12月10日,万千气象看福建·唱响海上牧歌丨闽海扬波:福州海洋经济展现强劲动力,国产男人久久精,2020国产精品对白露脸,视频二区国产无套乱子伦精彩,福利你懂得视频
12月10日,【巴黎奥运会】覃海洋启蒙教练:覃海洋帮我完成了32年前的梦想,台湾色老福利网址,一特级黄片视频,日韩中文字幕在线资源视频,97人人干视频
12月10日|海南:与电影共成长|日韩肏屄|最近最新的2019中文字幕|色接久久综合|无码AV 丰满AV 床震AV
12月10日|从磨憨看政协力量如何助力国际口岸建设迸发活力|性爱精品视频在线观看|糖心vlog|黄片污A片在线观看欧美|影音先锋最新av 网站
12月10日|浙江仙居制作400余年民俗板凳龙 龙年春节味渐浓|亚洲首页稀缺资源|色又黄又爽18禁免费网站现观看|腿 精 胸在线观看|www.人人干……
12月10日,(文化中国行)焦溪古镇传承舌尖上的非遗:“豆腐已到第七代传人”,性交过程视频,污韩漫二次元,欧美调教视频在线一区,女人自慰 色情
12月10日,“同心庆华诞 逐梦大湾区”2024年广东高校优秀港澳学生领袖营结营,日韩黄色性爱A片,男女一起努力做豆浆怎么画,嘿咻视频免费,操操操人人操
12月10日|重大历史题材电视剧《太平年》在浙江横店开机|小黄片国产一区|国产漫画无码作爱视频免费|A片超碰首页|性爱免费网
12月10日,低空经济和安全产业论坛:专家建言夯实无人机监管基础设施建设,国产激情一级a做作爱片免费,亚洲三级黄片啊啊啊啊啊啊啊啊啊,四虎在线成视频人观看69影院,玛薇卡二创本r18图片高清壁纸
12月10日,兴凯湖进入候鸟南迁高峰期 日均过往候鸟达3.5万只,成人扒开 伸进 17c,国产精品久久久久久久久Y,禁止18观看网站,国产九九av
12月10日,携程副总裁王韦:旅游已成生活必需品 旅游业展现强大韧性,男人和女人羞羞照片裸体,91久久久久无码精品国产,乖 啊 嗯~喷水了宝贝gl,caoporen.com
12月10日|“端午经济”迸发消费新活力|亚洲精品中文字幕99视色|91 人妻论坛|一级毛片免费高清视频不卡|日韩性交精品
12月10日|大连海关查获进境濒危物种大青鲨鱼鳍块2.5吨|怡红院亚洲综合久久九九九|欧美一级黄片黑人操逼|亚洲人人看a|18岁以下不能看的视频亚洲啪啪啪
12月10日|去年访港旅客约3400万人次 内地成最大访港旅客市场 |8x8x8x8x8x8免费无限高清在线看|欧美精品高清一区二区蜜芽|超碰图图精品|日韩欧美一区二区视频播放
林肯律师 第三季,足球英杰|加快完善银发经济支持政策体系 重视科技第一动力作用|毛级黄色视频|一区二区呦呦在线播放|亚洲熟妇一级黄色视频免费看|影音先锋最新啪啪资源网
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
世界周刊丨“大中东”之变
《黑神话:悟空》手办热销 设计者:中国IP海外输出扬眉吐气
《繁花》小食“油墩子”:“变”与“不变”中照见时代
浙江安吉获联合国“生物多样性魅力城市”称号
云南牟定:万人同跳左脚舞
港铁本地服务总客量恢复至疫情前逾九成
新型毒品“丧尸烟弹”在台泛滥 有军人、警察吸食
法律顾问在身边:律师分析编造虚假视频的法律问题读懂法律因应新质生产力之变与新 专家建言:促进法律服务行业的数字化转型
中国选手锁定巴黎奥运会跳水女子10米台金牌
新疆乌什县发生7.1级地震
脱内 揉 小视频
福利姬软件
四虎永久地让5151wwcom
男女亚洲视频
18禁免费黄网
宁荣荣光溜溜的样子
91探花在线
激情久久小说
性交aⅤ大平台
欧美视频一区二区三区91

闽公网安备 35010302000113号