还能看的黄色网站,界面清爽、功能强大,专为极致体验而生

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

「北京版幻方」开源SOTA代码模子!40B参数掀翻Opus-4.5和GPT-5.2

2026-01-08 22:15:06
泉源:

猫眼影戏

作者:

库里南

手机审查

  猫眼影戏记者 梅花桩 报道Q8X2R7L1T4J5M9B6W3

衡宇 发自 凹非寺量子位 | 公众号 QbitAI

又一其中国新模子被推到聚光灯下,刷屏海内外科技圈  。

IQuest-Coder-V1模子系列,看起来真的很牛  。

在最新版SWE-Bench Verified榜单中,40B参数版本的IQuest-Coder取得了81.4%的效果,这个效果甚至凌驾了Claude Opus-4.5和GPT-5.2(这俩模子没有官方资料,但外界普遍推测参数规模在千亿-万亿级)  。

Oh~Tiny Core, Titan Power  。

好,看到这里我盲猜许多人肯定已经最先边摇头边笑了  。

事实这年头,benchmark的权威犹在,但说服力似乎已经大不如前了  。

那咱们就看看这个模子跑出来的case——

Prompt:编写一个网页来展示一个逼真的太阳系模拟  。

然后你将获得:

可以自由切换种种视角,让画面暂停、放大,调解公转速率也ok  。

选中详细的行星,还会跳出响应的名字和简朴先容  。

现在,这套代码大模子系列已经在GitHub和抱抱脸上开源  。

有一个重点一定要划  。  。

这个模子团队IQuest,和DeepSeek团队一个路数,都出自中国的量化私募  。

背后公司就是北京版幻方量化——九坤投资  。

(两家公司都是业内公认的量化私募头部)

X、Reddit等平台上,关于IQuest-Coder的新闻和对中国量化公司杀入AI模子战场的讨论已经满天飞了  。

有网友一脸unbelievable地问出了令他惊讶的问题:

中国量化公司究竟吸纳了些什么人才,才华把模子训练成这样  ???

Ok,一起来看看这套模子的详细情形吧~

IQuest-Coder-V1系列

从定位上看,IQuest-Coder-V1是一套笼罩多个参数规模与使用场景的家族版本,专注于代码天生、代码明确与软件工程使命的模子系列  。

参数有7B、14B和40B的,每个规模均提供Instruct和Thinking两种版本  。

其中,Instruct偏向指令追随与工程使用,更高效 ;Thinking强化重大推理和多步问题拆解,响应时间更长  。

特殊提醒各人注重一下,40B参数规模的IQuest-Coder-V1特殊提供了Loop版本,用于探索更高的参数使用效率  。

与盘算成内情似的模子相比,IQuest-Coder-V1-40B-Loop的HBM和KV Cache开销显著降低,而吞吐量大幅提升  。

仅增添约5%的训练本钱,Loop架构下,40B模子抵达数百亿参数MoE模子的水平  。

在架构设计上,IQuest-Coder-V1系列强调了“工程友好”和“长上下文可用性”  。

官方在GitHub上给出的四点架构特征划分是:

分组盘问注重力(Grouped Query Attention,GQA)以实现高效推理原生支持128K上下文长度词表大  。76800个token循环变体接纳了具有共享参数的循环Transformer设计,该设计在两个迭代历程中坚持一致  。

首先说说GQA的引入  。

通过镌汰KV头数目来降低推理阶段的显存占用和盘算压力,对长上下文场景超等友好  。

其次,模子原生支持128K上下文长度  。这就让模子有能力直接处置惩罚完整代码客栈、跨文件依赖以及大规模工程上下文  。

第三,76800个token的词表巨细,更贴近真实代码情形中频仍泛起的标识符、路径名和符号组合  。

最后,在Loop变体中,模子接纳了具有跨两次迭代共享参数的循环Transformer设计,用重复盘算换取更高的参数使用率,在不线性扩大模子规模的条件下提升性能  。

作者刻意指出,这和早期Parallel Loop Transformer差别,去掉了token shifting和inference trick,更强调推理阶段的稳固性  。

这些特征组合在一起,有利于模子在真实软件工程场景中跑得更好  。

来看官方展示的更多case  。

Prompt 1:构建一个粒子-文本动画,知足以下要求  。

文本采样:将给定文本(例如,IQuest)在 Canvas 上转换为由数百个小粒子组成的点阵  。状态:每个粒子都有一个目今位置和一个目的位置(形成文本)  。交互式物理效果:当鼠标靠近时相互倾轧和散开 ;当鼠标移开时平滑地弹回  。视觉效果与缓动:随机/渐变颜色,用于整体运动的缓动效果  。

Prompt 2:构建一个实时像素沙盒游戏  。

通过按钮切换沙子、水、石头和酸液 ;在画布上涂画可天生具有差别颜色的元素 ;大规模更新依然流通 ;元素会自然着落并流动  。

Prompt 3:构建一个完整的单文件HTML5 Canvas太空射击游戏,具有复古霓虹美学和显着的战斗反响  。

视觉气概:玄色配景,高饱和度霓虹几何形状,街机感  ?刂疲篧ASD移动 ;两种瞄准/炮塔模式(鼠标追随,或按R键旋转炮塔)  。射击:带完整视觉效果的自动射击太空飞船  。反  。夯魃笔,泛起粒子爆炸效果 ;受到危险时,屏幕会震惊  。仇人:通俗士兵/奇袭者/重型坦克,以及Boss战  。进阶:按P键能升级火力  。

Prompt 4:基于鸟群算法的仿生鸟/鱼群体模拟,拥有150个以上的自主Agent,有实时调理功效  。

焦点规则:疏散(阻止碰撞)、对齐(速率匹配)和内聚(群体中心)  。实时面板:调解疏散/对齐/凝聚权重(0-3)、视觉半径(20-150 像素)和最大速率  。交互:鼠标充当捕食者,使周围的智能体散开  。渲染:在深色配景下,以运动偏向旋转的霓虹三角形和发光轨迹  。工具:FPS 计数器和暂停/继续(空格键)  。

与众差别的“代码流多阶段训练”训练战略

IQuest-Coder的训练流程如下——

预训练阶段先用通用数据和大规模代码数据打底,然后通过高质量代码annealing强化基础代码表征  。

中期训练阶段第一次明确引入reasoning、agent trajectory和长上下文代码,并且分32K和128K两个标准逐步推进  。

最终post-training阶段,模子被明确分流成instruct蹊径和thinking蹊径,划分用差别目的函数和RL方法收敛  。

官方强调,IQuest-Coder-V1系列接纳了与古板简单静态源代码训练差别的训练战略  。

称之为code-flow multi-stage training  。

与大宗代码模子着重从静态代码片断中学习差别,这套要领强调从代码的演化历程中学习  。

团队专门设计了基于项目生命周期的triplet数据结构方法,用 (R_old, Patch, R_new) 这样的结构,让模子看到稳固期代码、变换内容以及变换后的效果  。

并且刻意避开项目早期和后期,只取40%–80%生命周期区间  。

这一步现实上把“软件工程履历”显式编码进了训练数据里  。

以是模子看到的并不但是某一时刻的完成态代码,还包括修改前后的差别、提交历史中的逻辑转变,以及真实工程中重复试错和修正的痕迹  。

也就是说模子被训练得能够捕获软件逻辑的动态演变  。

不少网友推测,这就是IQuest-Coder-V1在多个软件工程类评测中体现突出的主要缘故原由之一  。

这套模子效果确实亮眼  。

SWE-Bench Verified:81.4%BigCodeBench:49.9%LiveCodeBench v6:81.1%

下面这张图体现得更直观一点,IQuest-Coder在八个代码、Agentic相关榜单上都独吞鳌头  。

不过,GitHub上白纸黑字写着,模子可以天生代码,但不可执行,始终在沙盒情形中验证输出效果  。

安排方面,官方信息显示,不管是基础版本照旧Loop版本,都支持单卡H20推理  。

其Int4版本可在单张消耗级3090/4090 GPU上安排  。

有网友体现,非Loop版本的模子似乎接纳的是阿里Qwen2的架构  。

随着关注度上升,质疑也同步泛起  。

九坤投资公司是谁?

好,最后我们来熟悉一下IQuest-Coder背后的公司,九坤投资(Ubiquant Holding Limited)  。

公司建设于2012年,是中国较早一批专注量化投资和高频生意的私募机构之一,现在治理规模在数百亿元人民币,和幻方同属于公认的海内量化私募头部公司  。

九坤主要办公地在北京,3周前开设了新加坡办公室  。

联合首创人王琛,2000年考入清华大学,获得数学物理学士学位和理论盘算机博士学位,博士时代师从图灵奖得主姚期智院士  。

博士结业后,王琛就职于美国顶级对冲基金Millennium,后创业担当九坤投资联合首创人、CEO  。

联合首创人姚齐聪,2002年考入北京大学数学系,获得数学学士和金融数学硕士学位  。

硕士结业后进入Millennium,后与王琛配合创业,主要认真九坤投研系统搭建、量化战略开发和危害治理,被视为公司战略和风控系统的焦点设计者之一  。

九坤的投研与手艺团队人数凌驾百人,90%以上结业于清华、北大、复旦、斯坦福等海内外着名高校,博士占比凌驾60%  。

果真信息显示,这家公司现在也倾向于从全球顶尖高校招募具有盘算机、数学、物理、统计学等配景的应届结业生  。

在AI领域,幻方更早凭DeepSeek站到台前  。

不过盘问有关资料发明,此前九坤也很注重AI手艺这一块  。

现在,九坤的IT和算力建设位居海内量化机构前三,并建设了数据实验室(DATA LAB)、人工智能实验室(AI LAB)等多个前沿实验室  。

本次宣布的IQuest-Coder就出自其提倡设立的自力研究平台至知立异研究院  。

倒也不全是为了把AI用在金融市场展望和生意决议啦——前段时间(2025年12月16日),九坤已经推出过通用推理模子URM  。

该模子在ARC-AGI准确率为53.8%,当允许多次实验时,URM的乐成率能抵达85%以上 ;在更难题的ARC-AGI 2上也拿到了16.0%  。

Paper最后附上了IQuest-Coder团队的成员名单  。

挺长的,就纷歧一先容了  。

不过我们发明这篇paper的焦点作者层,和《Scaling Laws for Code》《CodeSimpleQA》《From Code Foundation Models to Agents and Applications》作者阵容重合度很是高  。

以是这里稍微睁开先容一下Core Contributor的几位成员  。

(注:IQuestLab团队成员许多没有果真小我私家档案,我们这里放出可寻找到的果真资料)

Jian Yang,谷歌学术被引量凌驾1.6万  。

此前应该在Qwen 2.5和Qwen 3团队待过很长一段时间,2025年起最先在九坤投资揭晓论文  。

Zhengmao Ye,本科结业于西南交通大学,在四川大学获得盘算机科学硕士学位  。

此前,他曾在华为和商汤科技担当过手艺事情职员  。

你没看错,8位Core Contributor就找到了2位的果真资料,真的起劲了.gif

另外,paper的通讯作者,是九坤人工智能实验室首席研究员和认真人Bryan Dai  。

Paper地点:https://github.com/IQuestLab/IQuest-Coder-V1/tree/main/papers参考资料:[1]https://x.com/zephyr_z9/status/2006579658972868988?s=20[2]https://github.com/IQuestLab/IQuest-Coder-V1?tab=readme-ov-file[3]https://iquestlab.github.io/#/[4]https://www.reddit.com/r/LocalLLaMA/comments/1q0x19t/anyone_tried_iquestcoderv1_yet_the_40b_numbers/

??时势1:扒开老师 奶头含羞

??01月08日,广东省自然资源厅:开展地质灾害风险隐患大排查,

  “你确信,你们吃了一头狻猊?”蛟鹏睁大了眼睛问道,一时间没有了狂傲,露出了孩子应有的受惊与好奇本色  。

,综合网在线看在线看  。

??01月08日,第14次中国—欧盟防务部门安全政策对话在北京举行,

  同样的事情,也爆发在其他富家内  。

,美女隐私链接下载,石榴视频,蝌蚪黄片小辣椒视频  。

??时势2:亚洲中文字幕永久在线2020黄色

??01月08日,文化中国行丨二次探查喀拉克尔遗址,在跋涉中见证热爱,

  他刚进入瀑布下,就被白色浪涛打翻了出去,瀑布从数百米、上千米高的石崖山垂落,力道太强烈了  。

,美女 可爱 无尽 视频,爽 躁多水 快 深女女表情包,91在线国产视频观看  。

??01月08日,“十四冬”单板滑雪平行大回转青年组男子比赛落幕 内蒙古队彭玥熙夺冠,

  二要严肃学习纪律  。 这次集中培训的时间较为紧凑,使命十分沉重,因此各人一定要严肃学习纪律,包管学习时间,希望在座的每位同志倍加珍惜这次难堪的学习时机,尊重先生的劳动,认真听课,记好条记,统一行动,不搞小我私家自由主义,维护优异的学习民俗,有特殊情形要向党工委主要向导请假,确保培训事情取得预期的效果  。

,妻社,小樱被鸣人c到合不拢腿,黄色网址国产  。

??时势3:日本熟妇乄Ⅹ乄日本少妇

??01月08日,李强在河北调研时强调 坚持创新驱动发展 加快全面绿色转型 在推进京津冀协同发展中展现新作为,

  这届学生现真相形众所周知,学生水平狼籍不齐  。我们只有扎实事情,花鼎实力,发挥苦干加巧干的精神,才华周全提高教育教学质量,才华确保完成20x年中考目的  。 为此,特制订本届 九 年级教育教学 ,以“稳固、生长、突破”为 目的 ,以“扎实、热情、良心”为原则,有妄想 地 落实好新学期的事情  。

,嫩草视频a范冰冰,草草视频欧美A片,国产一级做a爱免费  。

??01月08日,黄河壶口瀑布现“金流飞瀑”景观,

  那张金色的狼皮宝具,与一头真正的神狼没有什么区别,通体如黄金铸成,扑杀到了近前,探出一对大爪子,无坚不摧,直接扒开了土石,要毁柳树的根部  。

,西德性丰满高清HD,同人片,免费视频色色色的  。

??时势4:大胸美女脱衣爆淫水叫插

??01月08日,刘振民接替解振华出任中国气候变化事务特使 外交部介绍情况,  总结来看,今年高考时代南北方不少地区考生都免不了冒雨“赶考”了,建议受影响地区考生提前出发,关注邻近预告、预警信息,做好防护 ;同时实时调解盛意态,只管降低天气对考试状态的影响  。,美女裸体污污污被爆操久久,欧美式交性三人视频,拳交视频汇编大全凸  。

??01月08日,航拍贵州乌江寨国际旅游度假区夜景美如画,

  亲爱的校园,今天我们因您而自满,明天您一定因我们而庆幸! 最后,请允许我代表镇东小学六年级全体结业生同砚,向学校向导和先生们致以最高尚的敬意!

,国产精品三区视频,伊人黄色视频,欧美巨屌黄色视频  。

责编:巴勒摩

审核:邹军

责编:梁选翠

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图