首页
智工具作者 程茜编辑 李水青
智工具1月20日报道,今日下昼,阶跃星辰开源多模态模子Step3-VL-10B。该模子参数目为10B,在视觉感知、逻辑推理、数学竞赛以及通用对话等一系列基准测试中均抵达同规模SOTA水平。
阶跃星辰的多项测评显示,Step3-VL-10B的性能可以媲美甚至逾越规模大10-20倍的开源模子,如GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B以及闭源旗舰模子,如Gemini 2.5 Pro、Seed-1.5-VL。
这一轻量级模子的性能体现,也意味着手机、电脑、工业嵌入式装备也可以运行GUI操作、重大文档剖析、高精度计数等重大多模态推理使命。
从手艺层面看,Step3-VL-10B的性能突破得益于三个要害设计,划分是高质量多模态语料库上举行统一预训练、缩放多模态强化学习、并行协调推理机制。
现在,阶跃星辰已开源Step3-VL-10B系列的Base模子和Thinking模子。
Hugging Face开源地点:https://huggingface.co/collections/stepfun-ai/step3-vl-10b
ModelScope开源地点:https://modelscope.cn/collections/stepfun-ai/Step3-VL-10B
体验地点:https://huggingface.co/spaces/stepfun-ai/Step3-VL-10B
手艺报告链接:https://arxiv.org/pdf/2601.09668
一、从GUI感知到视觉识别和推理,Step3-VL-10B思绪清晰
阶跃星辰在官方公众号里放出了Step3-VL-10B在多模推理能力方面的真实案例。
首先是关于摩尔斯编码的推理,可以看到模子的思索历程思绪清晰,先拆解字母再逐个查表,最后拼接,流程准确,并且对大部分字母如S、T、E、F、U、N的定位和编码形貌准确。
其次是GUI感知能力,模子需要识别标签页中以章节开头.tex最后的文件标签,可以看到其思索历程接纳了识别标签、扫除非目的、统计数目的办法举行了准确剖析,并有用规避了滋扰选项。
第三个是关于图推理的案例,模子需要在连线很是重大的图片中准确识别中长度最短的图有几条,从思索历程可以看到,其先确认了最小权重的边长度是1,然后再统计所有权重为1的边。
二、拿下开源SOTA,数学竞赛测试题超94分
Step3-VL-10B具备三大焦点亮点:
视觉感知精度更高:在同参数目级中展现出顶尖的识别与感知精度,研究职员为其引入PaCoRe(并行协调推理)机制,模子在重大计数、高精度OCR及空间拓扑明确等高难度使命上的可靠性提升。
深层逻辑推演与长程推理:得益于规;炕埃≧L)的一连迭代,Step3-VL-10B在10B规模上能应对竞赛级数学难题、真实编程情形、视觉逻辑谜题。
端侧Agent交互:基于海量GUI(图形用户界面)专用预训练数据,模子能够精准识别并操作重大界面。
阶跃星辰果真的多模态基准测试效果显示,Step3-VL-10B是10B参数种别中最强盛的开源模子。
详细来看,在多模态推理能力上,Step3-VL-10B在部分测试集上逾越了GLM-4.6V、Qwen3-VL等模子,其性能优于10倍至20倍大的模子。
数学能力方面,该模子在AIME 25/24等数学竞赛测试题上得分凌驾94分,这意味着其在逻辑严密性上甚至优于许多千亿级模子。
2D、3D空间推理能力上,模子在BLINK上体现出66.79%的涌现式空间意识,在All-Angles-Bench上抵达57.21%,意味着该模子在具身智能应用方面具有强盛的潜力。
最后是编程能力,在真实、动态编程情形下,Step3-VL-10B逾越GLM-4.6V、Qwen3-VL等模子。
别的,该模子的开源主页显示,研究职员在Qwen3VL-8B相关的基准测试中泛起了禁绝确数据,例如AIME、HMMT、LCB,现在正在修复。这些过失是由于其在大规模评估历程中max_tokens设置过失造成,他们将重新运行测试,并在下一版手艺报告中提供修正后的数据。
三、从感知到推理双提升,三大概害设计加持
该模子的论文提到,Step3-VL-10B的性能突破得益于三个要害设计:
一是在高质量多模态语料库上举行统一预训练:研究职员接纳单阶段、完全解冻的训练战略,在1.2T token的多模态语料库上举行训练,重点关注两大基础能力:推理和感知,例如通用知识和教育中心使命等推理能力,定位、计数、OCR和GUI交互等感知能力。
通过联合优化感知编码器和Qwen3-8B解码器,STEP3-VL-10B建设了内在的视觉-语言协同效应。
二是缩放多模态强化学习:通过一个严酷的后训练流程解锁了前沿能力,该流程包括两阶段监视微调(SFT)以及凌驾1400次的强化学习迭代,连系可验证奖励(RLVR)和人类反。≧LHF)。
三是并行协调推理机制:研究职员接纳并行协调推理(PaCoRe),支持推理阶段的动态算力扩展。通过并行探索多个感知假设并举行多维证据聚合,该机制显著提升了模子在竞赛级数学、重大OCR识别、精准物体计数及空间拓扑推理中的准确度。
阶跃星辰的官方公众号提到,得益于“三位一体”架构,Step3-VL-10B证实智能水平并不完全取决于参数规模。这也意味着:天下一流的多模态能力有望以更低本钱、更少算力获得;与此同时,已往主要集中在云端超等智能将逐步向端侧下沉,推动终端走向“自动明确与可执行交互”。
结语:Step3-VL-10B或成端侧AI新选择
从Step3-VL-10B的实测可以看出,该模子依附10B轻量化参数体量,通过高质量多模态语料统一预训练、千余次强化学习迭代及并行协调推理机制,实现了对超大规模模子的跨级性能追赶。
并且详细到GUI交互、精准计数、竞赛级数学推理等使命,该模子也展现出较大应用潜力,未来有望降低在工业质检、外地文档剖析、下层医疗辅助等场景的安排门槛。
《黄片视频在线免费阅读》,《Q8X2R7L1T4J5M9B6W3》狠狠碰免费视频
“亚洲第5页”
美女被操网站免费
……
01月21日
“在线视频激情视频激情文学”弗洛伊德
↓↓↓
01月21日,(新春走基层)宁夏特产乘上“云端” 家乡味从直播间里飞往全国,成人修车,桃色av,222免费毛片,一级黄片免费看99讠Ver
01月21日,哈萨克斯坦与阿塞拜疆两国总统举行会谈,欧美性爱一级视频在线观看,亚洲无码第六页,91麻豆精品国产福利在线观看,日本爆乳片中文字幕一区
01月21日,强降雨来临,牢记这些安全提示,1313午夜精品美女爱做视频,欧美色区亚洲色第一页10p,欧美西欧美日韩性爱,男生女生插插插插叉代码
01月21日|荣耀!虽然没有金牌,你们依然是我们的骄傲|国产在线强暴美女精品|www.3344在线观看|igao av|黄色网站免费在线观看AV
01月21日|世界黄金协会:全球黄金采矿业难维持产量增长|色哟哟视频免费网址|一级做a爰片久久毛片黑人|特黄一级a、性生活视频|艹干天天
01月21日|浙江杭州:首届全国全民健身大赛气排球项目总决赛举行|日本有色视频网站|中文字幕黄色一级A片AAA片视频免费|欧美日韩中国性生活视频|柳神3dmax动漫……
01月21日,4名中央企业专职外部董事调整,原神甘雨被盗宝团俘虏,99riav3. com,国产最新性爱视频,国产做无码视频在线观看
01月21日,“五一”假期 重庆民众乐享近郊游,成人秘,2021国产午夜三级精品最新在线,成人9118,免费大雷的宝藏库
01月21日|美媒:大规模枪案频发 美国深陷枪支暴力危机|xnxx美女|chinese熟女一区二区|911国产精九九 网站|亚州另类小说色图
01月21日,外籍人士走进上海政协全过程人民民主实践点 聆听协商民主故事,国产91麻豆精品,极黄网站,色色视频播放网址,全网最大的黄色网站免费观看
01月21日,TVB“万千星辉颁奖典礼2023”澳门举行 佘诗曼三封“视后”,美女咬小头头小说,激情偷乱人伦小说在线,91黄片影院,男女性受一级A片
01月21日,台湾“龙先生”广州繁育科莫多龙,免费AAAA级毛片视频,日本女人性爱、eeeeeee,国产一级a免费无码播放,人人操人人干人人爽
01月21日|2024中国民营企业投融资洽谈会在天津开幕|欧美乱伦视频|伊人网在线免费观看视频|高清 码 免费阅读|一区无码在线观看
01月21日|宁夏银川:萌娃乐享书香假期|最新封神27岁财务姐姐的论坛|97免费人妻公开超碰|邱淑贞被躁120分钟视频|迷姦AV免費在綫觀看
01月21日|外媒聚焦世界经济论坛年会:重建信任、加强合作丨世界观|黄色网站免费播放视频|老女人 网站|伊人久久免费视频|国产视频2021在线观看
国家体育总局对袁某某开始调查,原来吃席也讲究技术|中新教育丨自考专科是否需要高中毕业证?教育部回应|国产黄网站|sss性欧美一区二区|啊嗯啊视频|在线看韩国三级
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
“零关税待遇”彰显扩大高水平开放决心(和音)
城市轨道交通里程破1万公里,北京上海列第一梯队
第九届亚洲冬季运动会志愿者出征
云南进入两会时间 一张照片“晒出”民营企业发展信心
美执法人员以放行为条件要求中国留学生提供中国政府内部信息 外交部回应
从前三季度多领域数据看中国经济运行的“稳”与“进”
湖南成交首例自然资源资产组合供应试点项目
中国财政部:能够保证养老金按时足额发放
广西外贸提前两年达到“十四五”规划目标总额
国际锐评|亚太一路走来,“合”才是主流
差不多30分钟的轮滑视频
黄色视频四五级毛片
综合一区欧美日韩
美女艹网站免费
亚洲天堂一区啪啪啪888
久久爱精品官网
动漫美女大欧派高清壁纸图片
久久怕怕
99精品视频观看国产金尊播放
又爽又黄又刺激的网站

闽公网安备 35010302000113号