目今位置:首页 → 电脑软件 → 新疆已记录到40次3级以上余震 → 99久热热 v4.168.1653.515607 IOS版
v9.394.3288.457629 安卓最新版
v4.542.2452.814925 IOS版
v2.795.2999 最新版
v9.940.1087.93471 安卓漢化版
v3.369.5768.435733 PC版
v3.1.3196.922348 安卓免費版
v7.657.6708.596453 安卓免費版
v9.596.6136.66723 PC版
v9.403.4925 安卓免費版
v6.618.2615.526840 最新版
v3.317.5732 安卓版
v4.94.1506.769736 安卓免費版
v7.882.2295.198155 安卓最新版
v5.741.97.832773 安卓免費版
v6.258.52.300018 安卓免費版
v9.928.935.20687 安卓版
v8.794.3217.420405 安卓漢化版
v6.571.8945.812743 IOS版
v9.65.2884.193549 安卓免費版
v6.1.1574.514992 PC版
v1.925.2131.683238 安卓免費版
v1.102.8473.152471 最新版
v6.431.6453 安卓版
v1.956.5761.616972 安卓最新版
v8.508.9340 安卓漢化版
v1.22.1645 安卓漢化版
v5.235.7448.413210 最新版
v3.806.7136.887023 安卓漢化版
v4.825.5902.684935 PC版
v6.633.1209.269396 安卓漢化版
v9.900 安卓漢化版
v2.176.600.416481 最新版
v5.770.5774.712898 最新版
v3.799.7904 安卓最新版
v4.187.7052 安卓最新版
v5.65 PC版
v6.578.4215.810668 PC版
v5.104.8800.895071 PC版
v9.3.851.838547 安卓漢化版
v5.829.8312.52471 安卓免費版
v8.281.1131.887119 安卓最新版
v2.827 安卓免費版
v4.608.2350.129827 安卓版
v7.566.8699.208178 最新版
v8.845.2138.90595 PC版
v2.996.6715.369986 安卓版
v8.345.7149.618170 IOS版
v6.805.7437.739891 安卓漢化版
v9.704.9455.1049 安卓版
v5.888.9153.579877 PC版
v7.828 PC版
v3.256.5008.929493 最新版
v4.107 PC版
v8.52.7792.242504 IOS版
v1.323.4210.812748 最新版
v3.196.6729.764775 安卓免費版
v4.48.9574.974416 安卓漢化版
v1.582.6889.752890 最新版
v1.628.2373 安卓版
v1.199.4389.149127 安卓免費版
v7.219.1775.410121 安卓最新版
v5.127.4102 IOS版
v9.544.138 安卓漢化版
v2.27.3405 安卓最新版
v1.544.3098.488520 PC版
v6.760.7346.826115 最新版
v5.717.8587.808193 安卓免費版
v3.368.9821.570131 IOS版
v8.48.6601.81949 安卓漢化版
v2.867.4578.353078 安卓版
v7.888.2060 安卓免費版
v1.763 安卓免費版
v4.949.1747.630421 安卓版
v6.265.3313.948735 安卓最新版
v1.104.5844 最新版
v5.691.5325 PC版
v3.718.8888.66587 安卓漢化版
v5.206 PC版
v8.613 PC版
v5.473.4475 PC版
99久热热
作者 | 辰辰
出品 | 网易科技
专挑节沐日搞大新闻”的DeepSeek又脱手了。
就在大洋彼岸的工程师们准备切火鸡庆祝节日时,DeepSeek坚持了极客古板,悄然上线了DeepSeekMath-V2。
开源权重、IMO金牌水平、逾越GPT-5。?这套熟悉的“三连击”,再次牢靠了DeepSeek作为“开源灯塔”的职位。?在算力受限的配景下,DeepSeek 再次证实晰自己:不需要重大的 GPU 集群,也能用算法事业在最硬核的数学赛道上,教闭源巨头们“做人”。
它“不搞虚的”,直接拿数学竞赛界的“最终试金石”,包括2025国际数学奥林匹克(IMO 2025)?和?普特南数学竞赛(Putnam)?的真题开练。在严苛的基准测试中,它交出了一份与 GPT-5和 Gemini 2.5 Pro 平起平坐,甚至更胜一筹的完善答卷。
1. 战绩彪悍:AI “碾压”人类学霸
DeepSeekMath-V2究竟有多强?数据不会说谎。
——?IMO 2025金牌得主,比肩谷歌 OpenAI。?在 IMO 2025的基准测试中,DeepSeekMath-V2乐成解出6道题中的5道,抵达“金牌”水准。这一效果直接对标谷歌 DeepMind 和 OpenAI 此前引以为傲的闭源模子。?要知道,在此之前,这种级别的推理能力是硅谷巨头们严防死守的商业神秘。
——?普特南竞赛:118分 VS 人类最高分90分。?威廉·罗威尔·普特南数学竞赛(Putnam)可以说是北美本科生的“恶梦”,以难度极高著称,中位数得分甚至靠近于0。DeepSeek 团队透露,DeepSeekMath-V2在2024年的普特南考题测试中,12道题做对了11道,最后一道也仅有细小瑕疵,最终得分118分(满分120)。相比之下,人类选手的最高分只有90分左右。这说明 AI 不但仅是在“背题”,而是具备了逾越顶尖人类选手的逻辑解题能力。
别的,DeepSeekMath-V2在代数、几何等5大数学领域周全逾越 GPT-5和 Gemini 2.5 Pro。
2. 揭秘:为什么它能这么智慧?
数学推理一直是 AI 的软肋,由于大模子很容易“一本正经地乱说八道”(幻觉问题)。DeepSeek 是怎样解决这个问题的?
谜底是“元验证”(Meta-Verification)手艺。
古板的 AI 训练是“给糖吃”:谜底对了就奖励。但在高等数学证实中,谜底对不代表历程对。AI 很容易瞎编一个历程然后蒙对谜底。
但 DeepSeek 引入了一套“左右互搏”机制:
其中天生器就像一个学生,认真写解题办法。验证器则是先生,认真检查逻辑误差,不但仅看谜底,还要看推导历程是否严谨。
更绝的是,他们还训练了一个“二阶验证器”,用来监视“先生”修正得对差池,避免模子为了拿分而钻空子。?这种递归式的验证结构,逼着模子必需学会真正的逻辑推理,而不是投契取巧。
而在推理阶段,模子不是张口就来。它会针对一个问题天生64个候选证实路径,然后用验证器逐一打分,挑出逻辑最严密的那一个。?这种“三思此后行”的模式,正是通往通用人工智能(AGI)的要害一步。
别的,DeepSeekMath-V2还打造了数字闭环生态,用验证反响直接优化天生质量,用自主爆发的高难度训练样本推动系统迭代。
3. 最大的杀手锏:它是开源的!
这才是让手艺界欢喜的真正缘故原由。
以往,无论是 OpenAI 照旧谷歌都选择闭源。你想用顶级的数学推理能力?只能付费挪用 API,不但数据要传到云端,使用更受限于人。
但 DeepSeek 直接掀了桌子:模子权重果真下载,Apache 2.0协议。
Hugging Face 的 CEO 克莱门特·德朗格(Clément Delangue)为此激动地发推体现:
“据我所知,没有任何谈天机械人或 API 能给你提供 IMO 金牌级别的模子。但今天变了,你可以在 Hugging Face 上直接下载 DeepSeek Math-V2的权重。”
这意味着,高校研究职员、企业开发者都可以在外地安排这个“数学天才”。所有人都可以体验在外地运行“奥数金牌” AI 的快感,无需担心数据隐私,也不必看硅谷大厂的神色。?一夜之间,一经被视为焦点竞争力的“推理护城河”,酿成了人人可用的基础设施。
一经上线,全球各路手艺播客和达人纷纷上手试用。
手艺博主、英王程序大佬西蒙·威利森(Simon Willison)快速对 DeepSeek Math-V2的宣布做了手艺层面解读,强调这是一个开放权重模子。他还特意提到,OpenAI和谷歌的一律模子有快要700G,相比之下DeepSeek Math-V2要小得多。
BinaryVerse 宣布的播客也称 DeepSeekMath-V2在某些数学推理基准上逾越了已有闭源大模子,但同时也提到,模子“对知识问答或通用场景并非周全领先”。
Hacker News 等社区也纷纷对模子指标和能力揭晓小我私家看法。不少人惊讶模子的强盛能力,但也有人质疑大宗推理算力带来的优异指标是否可迁徙到通例使用场景。许多谈论强调“惊艳但令人担心”的速率,讨论模子在更广义推理与清静性方面的意义。
4. 逆风翻盘:算力受限下的极致优化
DeepSeek 的这次突围,配景着实略带悲壮。
由于芯片供应问题,DeepSeek 在算力硬件上并不占优,旗舰模子 R2甚至因硬件兼容性问题而被迫推迟。
但在这种极限施压下,DeepSeekMath-V2证实晰一件事:算法的立异可以填补算力的缺乏。
它没有纯粹依赖暴力堆砌英伟达的 GPU 集群,而是通过“冷启动”训练——让 AI 自己天生训练数据,自己训练自己,还用自动化标注系统挣脱了对昂朱紫工标注数据的依赖。
5. 结语
DeepSeekMath-V2的宣布证实:在通往 AGI 的蹊径上,开源模子并没有落伍,甚至正在反超。
当硅谷还在试图用“清静”为由将顶级模子锁在黑盒子里时,来自中国企业的 DeepSeek 选择漂亮把钥匙交给了全天下。
关于所有 AI 从业者来说,这是一个最好的时代。
相关版本
多平台下载
审查所有0条谈论>网友谈论