首页
衡宇 发自 凹非寺量子位 | 公众号 QbitAI
又一其中国新模子被推到聚光灯下,刷屏海内外科技圈。
IQuest-Coder-V1模子系列,看起来真的很牛。
在最新版SWE-Bench Verified榜单中,40B参数版本的IQuest-Coder取得了81.4%的效果,这个效果甚至凌驾了Claude Opus-4.5和GPT-5.2(这俩模子没有官方资料,但外界普遍推测参数规模在千亿-万亿级)。
Oh~Tiny Core, Titan Power。
好,看到这里我盲猜许多人肯定已经最先边摇头边笑了。
事实这年头,benchmark的权威犹在,但说服力似乎已经大不如前了。
那咱们就看看这个模子跑出来的case——
Prompt:编写一个网页来展示一个逼真的太阳系模拟。
然后你将获得:
可以自由切换种种视角,让画面暂停、放大,调解公转速率也ok。
选中详细的行星,还会跳出响应的名字和简朴先容。
现在,这套代码大模子系列已经在GitHub和抱抱脸上开源。
有一个重点一定要划。。
这个模子团队IQuest,和DeepSeek团队一个路数,都出自中国的量化私募。
背后公司就是北京版幻方量化——九坤投资。
(两家公司都是业内公认的量化私募头部)
X、Reddit等平台上,关于IQuest-Coder的新闻和对中国量化公司杀入AI模子战场的讨论已经满天飞了。
有网友一脸unbelievable地问出了令他惊讶的问题:
中国量化公司究竟吸纳了些什么人才,才华把模子训练成这样???
Ok,一起来看看这套模子的详细情形吧~
IQuest-Coder-V1系列
从定位上看,IQuest-Coder-V1是一套笼罩多个参数规模与使用场景的家族版本,专注于代码天生、代码明确与软件工程使命的模子系列。
参数有7B、14B和40B的,每个规模均提供Instruct和Thinking两种版本。
其中,Instruct偏向指令追随与工程使用,更高效;Thinking强化重大推理和多步问题拆解,响应时间更长。
特殊提醒各人注重一下,40B参数规模的IQuest-Coder-V1特殊提供了Loop版本,用于探索更高的参数使用效率。
与盘算成内情似的模子相比,IQuest-Coder-V1-40B-Loop的HBM和KV Cache开销显著降低,而吞吐量大幅提升。
仅增添约5%的训练本钱,Loop架构下,40B模子抵达数百亿参数MoE模子的水平。
在架构设计上,IQuest-Coder-V1系列强调了“工程友好”和“长上下文可用性”。
官方在GitHub上给出的四点架构特征划分是:
分组盘问注重力(Grouped Query Attention,GQA)以实现高效推理原生支持128K上下文长度词表大。76800个token循环变体接纳了具有共享参数的循环Transformer设计,该设计在两个迭代历程中坚持一致。
首先说说GQA的引入。
通过镌汰KV头数目来降低推理阶段的显存占用和盘算压力,对长上下文场景超等友好。
其次,模子原生支持128K上下文长度。这就让模子有能力直接处置惩罚完整代码客栈、跨文件依赖以及大规模工程上下文。
第三,76800个token的词表巨细,更贴近真实代码情形中频仍泛起的标识符、路径名和符号组合。
最后,在Loop变体中,模子接纳了具有跨两次迭代共享参数的循环Transformer设计,用重复盘算换取更高的参数使用率,在不线性扩大模子规模的条件下提升性能。
作者刻意指出,这和早期Parallel Loop Transformer差别,去掉了token shifting和inference trick,更强调推理阶段的稳固性。
这些特征组合在一起,有利于模子在真实软件工程场景中跑得更好。
来看官方展示的更多case。
Prompt 1:构建一个粒子-文本动画,知足以下要求。
文本采样:将给定文本(例如,IQuest)在 Canvas 上转换为由数百个小粒子组成的点阵。状态:每个粒子都有一个目今位置和一个目的位置(形成文本)。交互式物理效果:当鼠标靠近时相互倾轧和散开;当鼠标移开时平滑地弹回。视觉效果与缓动:随机/渐变颜色,用于整体运动的缓动效果。
Prompt 2:构建一个实时像素沙盒游戏。
通过按钮切换沙子、水、石头和酸液;在画布上涂画可天生具有差别颜色的元素;大规模更新依然流通;元素会自然着落并流动。
Prompt 3:构建一个完整的单文件HTML5 Canvas太空射击游戏,具有复古霓虹美学和显着的战斗反响。
视觉气概:玄色配景,高饱和度霓虹几何形状,街机感?刂疲篧ASD移动;两种瞄准/炮塔模式(鼠标追随,或按R键旋转炮塔)。射击:带完整视觉效果的自动射击太空飞船。反。夯魃笔,泛起粒子爆炸效果;受到危险时,屏幕会震惊。仇人:通俗士兵/奇袭者/重型坦克,以及Boss战。进阶:按P键能升级火力。
Prompt 4:基于鸟群算法的仿生鸟/鱼群体模拟,拥有150个以上的自主Agent,有实时调理功效。
焦点规则:疏散(阻止碰撞)、对齐(速率匹配)和内聚(群体中心)。实时面板:调解疏散/对齐/凝聚权重(0-3)、视觉半径(20-150 像素)和最大速率。交互:鼠标充当捕食者,使周围的智能体散开。渲染:在深色配景下,以运动偏向旋转的霓虹三角形和发光轨迹。工具:FPS 计数器和暂停/继续(空格键)。
与众差别的“代码流多阶段训练”训练战略
IQuest-Coder的训练流程如下——
预训练阶段先用通用数据和大规模代码数据打底,然后通过高质量代码annealing强化基础代码表征。
中期训练阶段第一次明确引入reasoning、agent trajectory和长上下文代码,并且分32K和128K两个标准逐步推进。
最终post-training阶段,模子被明确分流成instruct蹊径和thinking蹊径,划分用差别目的函数和RL方法收敛。
官方强调,IQuest-Coder-V1系列接纳了与古板简单静态源代码训练差别的训练战略。
称之为code-flow multi-stage training。
与大宗代码模子着重从静态代码片断中学习差别,这套要领强调从代码的演化历程中学习。
团队专门设计了基于项目生命周期的triplet数据结构方法,用 (R_old, Patch, R_new) 这样的结构,让模子看到稳固期代码、变换内容以及变换后的效果。
并且刻意避开项目早期和后期,只取40%–80%生命周期区间。
这一步现实上把“软件工程履历”显式编码进了训练数据里。
以是模子看到的并不但是某一时刻的完成态代码,还包括修改前后的差别、提交历史中的逻辑转变,以及真实工程中重复试错和修正的痕迹。
也就是说模子被训练得能够捕获软件逻辑的动态演变。
不少网友推测,这就是IQuest-Coder-V1在多个软件工程类评测中体现突出的主要缘故原由之一。
这套模子效果确实亮眼。
SWE-Bench Verified:81.4%BigCodeBench:49.9%LiveCodeBench v6:81.1%
下面这张图体现得更直观一点,IQuest-Coder在八个代码、Agentic相关榜单上都独吞鳌头。
不过,GitHub上白纸黑字写着,模子可以天生代码,但不可执行,始终在沙盒情形中验证输出效果。
安排方面,官方信息显示,不管是基础版本照旧Loop版本,都支持单卡H20推理。
其Int4版本可在单张消耗级3090/4090 GPU上安排。
有网友体现,非Loop版本的模子似乎接纳的是阿里Qwen2的架构。
随着关注度上升,质疑也同步泛起。
九坤投资公司是谁?
好,最后我们来熟悉一下IQuest-Coder背后的公司,九坤投资(Ubiquant Holding Limited)。
公司建设于2012年,是中国较早一批专注量化投资和高频生意的私募机构之一,现在治理规模在数百亿元人民币,和幻方同属于公认的海内量化私募头部公司。
九坤主要办公地在北京,3周前开设了新加坡办公室。
联合首创人王琛,2000年考入清华大学,获得数学物理学士学位和理论盘算机博士学位,博士时代师从图灵奖得主姚期智院士。
博士结业后,王琛就职于美国顶级对冲基金Millennium,后创业担当九坤投资联合首创人、CEO。
联合首创人姚齐聪,2002年考入北京大学数学系,获得数学学士和金融数学硕士学位。
硕士结业后进入Millennium,后与王琛配合创业,主要认真九坤投研系统搭建、量化战略开发和危害治理,被视为公司战略和风控系统的焦点设计者之一。
九坤的投研与手艺团队人数凌驾百人,90%以上结业于清华、北大、复旦、斯坦福等海内外着名高校,博士占比凌驾60%。
果真信息显示,这家公司现在也倾向于从全球顶尖高校招募具有盘算机、数学、物理、统计学等配景的应届结业生。
在AI领域,幻方更早凭DeepSeek站到台前。
不过盘问有关资料发明,此前九坤也很注重AI手艺这一块。
现在,九坤的IT和算力建设位居海内量化机构前三,并建设了数据实验室(DATA LAB)、人工智能实验室(AI LAB)等多个前沿实验室。
本次宣布的IQuest-Coder就出自其提倡设立的自力研究平台至知立异研究院。
倒也不全是为了把AI用在金融市场展望和生意决议啦——前段时间(2025年12月16日),九坤已经推出过通用推理模子URM。
该模子在ARC-AGI准确率为53.8%,当允许多次实验时,URM的乐成率能抵达85%以上;在更难题的ARC-AGI 2上也拿到了16.0%。
Paper最后附上了IQuest-Coder团队的成员名单。
挺长的,就纷歧一先容了。
不过我们发明这篇paper的焦点作者层,和《Scaling Laws for Code》《CodeSimpleQA》《From Code Foundation Models to Agents and Applications》作者阵容重合度很是高。
以是这里稍微睁开先容一下Core Contributor的几位成员。
(注:IQuestLab团队成员许多没有果真小我私家档案,我们这里放出可寻找到的果真资料)
Jian Yang,谷歌学术被引量凌驾1.6万。
此前应该在Qwen 2.5和Qwen 3团队待过很长一段时间,2025年起最先在九坤投资揭晓论文。
Zhengmao Ye,本科结业于西南交通大学,在四川大学获得盘算机科学硕士学位。
此前,他曾在华为和商汤科技担当过手艺事情职员。
你没看错,8位Core Contributor就找到了2位的果真资料,真的起劲了.gif
另外,paper的通讯作者,是九坤人工智能实验室首席研究员和认真人Bryan Dai。
Paper地点:https://github.com/IQuestLab/IQuest-Coder-V1/tree/main/papers参考资料:[1]https://x.com/zephyr_z9/status/2006579658972868988?s=20[2]https://github.com/IQuestLab/IQuest-Coder-V1?tab=readme-ov-file[3]https://iquestlab.github.io/#/[4]https://www.reddit.com/r/LocalLLaMA/comments/1q0x19t/anyone_tried_iquestcoderv1_yet_the_40b_numbers/
《6080亚洲理论片在线观看》,《Q8X2R7L1T4J5M9B6W3》美女被cao免费观看网站软件
“日韩性色a v无码”
色综合影院网
……
01月04日
“尤物视屏网站”许美静团队回应演唱会太水争议
↓↓↓
01月04日,第四届金剧奖在深圳举行 快手为“剧星梦想”提供舞台与空间,欧美高清一级片九九,黄色无码啪啪视频,熟女视频,美女高潮网站
01月04日,国内首个5G-A通感一体低空飞行应用落户广东清远,操裸体美女屁股网站,AV无码国产精品性色aⅴ,天天插日在线观看视频网站,国精产品一二区三区视频
01月04日,广西壮族自治区人大常委会原党组副书记、副主任张秀隆严重违纪违法被开除党籍,自拍偷拍片,国产后入又长又硬,无人区1卡一卡2卡3卡4乱码,欧美性爱之欧美A疗
01月04日|美式干涉:当“黑手”戴上“白手套”|中文午夜乱理片无码AⅤ|综合色91区|YouJizz丰满熟妇日本白|久久黄色视频网址
01月04日|恶性安全事件高发频发 驻中非使馆发布紧急安全提醒|性欧美老幼欢|国产v碰|髙清无码一级爱a视频|🐹星空无限传媒免费观看电视剧官方版下载
01月04日|量子互联网关键连接首次实现|国产精品色哟哟在线观看|爱搞.com|把女人日出白浆来免费视频|俄罗斯一级a片黄片……
01月04日,“新三样”成外贸增长“新引擎” 江西将大力培育外贸新动能,亚洲婷婷综合网,黄色网站一级国产,美女下部隐私扒开视频无遮挡白,天堂av网z线
01月04日,两会受权发布|中华人民共和国国务院组织法,欧美九九久久精品,云缨巡街救公孙离漫画免费天堂,成色18k1.8811.7v蓝莓,秋霞人成午夜免费大片麻豆
01月04日|从“一枝独秀”到“百花齐放” 山西晋城光机电产业“光彩蝶变”|妓女视频网址|韩国做aj的视频大全|熟女精品一区二区三区|三叶草gw6781
01月04日,海陆空出动:深中通道上演“紧急救援”演练,久久人人看免费毛片,国产精品99久久99久久久,欧美二区wwwvv,国产午夜一级毛片 A 级
01月04日,和评理 | 马尼拉应停止侵权挑衅 不要引火烧身玩火自焚,欧美性爱欧美激情,自拍一二区,一级精品黄片视频,网站污黄操逼wwwwwwwwxxx
01月04日,加拿大2023年平均通胀同比上涨3.9% 达32年来次高水平,免费一级毛片一级A片一级AV,未满18看 插,国精产品视频一二二区视频,新呦呦视频
01月04日|对“家丑”视而不见,对别国“长臂管辖”!美国反兴奋剂“双标”干扰奥运会|亚洲美女在干嘛观看全球美女私生活电影及三级片|在线观看欧美a片视频|狼友网址永久入口|色综合站四色综合站
01月04日|【巴黎奥运会】张雨霏:未来想体验不同生活,但并不代表要退役|91AV视频国产|欧美日韩国产中文在线专区视频|717在线视频|JiZZ在线观看免费网站
01月04日|外交部:一个中国原则是国际关系基本准则,中国政府从不拿原则做交易|79秀表演秀全程免费版|欧美的黄色网站|吸奶揉胸咬大扎头免费网站|胸罩内半个奶都露了出来
又见逍遥,七夕之国|新加坡旅游热度上涨,“门将椰浆饭”也火了|真人国产一级A片|男人和女人的爽爽爽毛片特黄视频在线|玖玖玖综合网|www麻豆视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
新疆阿勒泰地区下拨1000万元应急救灾资金
郑州力争144小时过境免签政策落地
国际识局:如果针对尹锡悦的弹劾案通过,会发生什么?
“马中两国将在更多领域迎来高质量发展”
警惕!燃气聚能环既不节能也不安全
广西“画警”手绘安全知识海报 用画笔沟通民族情
上海:菜场变身“艺术馆” 解锁生活无限趣味
国家统计局:2023年12月份社会消费品零售总额增长7.4%
氢燃料电池汽车困局调查 年销不足万辆 加氢站成本高利用率低
新疆阿克苏地区乌什县发生7.1级地震:地震来临 客运员第一时间组织旅客疏散
小南给鸣人生猴子免费观看
亚洲黄色三级全部网站
国产污污av在线免费观看
成视频在线播放免费人成
在线观看观看黄色视频
久久久久一级高潮A片
亚洲视频不卡毛片
FerrPorno馃拫馃憴69
强被 c到爽 鞠婧祎
国产亚洲精品视频第1页玖玖

闽公网安备 35010302000113号