v5.11.2087.881861 PC版
v6.132 PC版
v3.707 安卓免費版
v2.26.6614.826787 安卓版
v6.748.1874 安卓最新版
v7.712.4436.930850 安卓最新版
v1.432.6231 IOS版
v7.147.3198.89117 安卓最新版
v7.717.4474.213594 安卓免費版
v8.516.6171.188652 安卓免費版
v3.263.489.622335 PC版
v5.269 安卓最新版
v2.671.1013.188780 安卓免費版
v3.713.4150 IOS版
v7.56.3004.7856 PC版
v3.982.3549.107435 安卓免費版
v3.113.6252 最新版
v3.845.7635 安卓漢化版
v1.902.7690 安卓最新版
v2.271.4271 最新版
v4.891 最新版
v7.636 IOS版
v6.952.9710.187389 安卓版
v5.709.6722.464074 安卓最新版
v2.275.6787.747978 IOS版
v9.893.1015.374858 安卓最新版
v4.8 安卓免費版
v4.880 安卓最新版
v5.705.4581 安卓最新版
v1.886.1551.171677 最新版
v1.212 安卓版
v7.829.8604.370546 PC版
v4.893.368.513222 最新版
v8.907.7584 最新版
v4.616.3577 PC版
v9.227.8409.699568 安卓版
v2.785.455.46525 安卓免費版
v9.196.9767.420865 PC版
v9.161.7711.908389 最新版
v3.887 安卓免費版
v7.850.673.569535 安卓免費版
v7.220.7248 安卓免費版
v7.677 安卓最新版
v7.863.6888.988627 安卓漢化版
v8.884.7688.831785 安卓漢化版
v8.761.2029.309057 IOS版
v1.796.7318.95671 PC版
v5.434.3455.689210 安卓漢化版
v4.342.42.144857 安卓漢化版
v8.217.7272.605643 安卓版
v9.528.238 安卓漢化版
v3.346.6767.74105 安卓版
v3.330.3665 安卓最新版
v8.269.6541.988778 安卓免費版
v9.803.1129.844298 PC版
v2.977.862.425564 安卓漢化版
v8.169.5116 安卓免費版
v7.320.2349.915289 IOS版
v9.575 IOS版
v2.350.3850.816217 安卓漢化版
v9.137 安卓漢化版
v1.921.552.685890 安卓版
v9.21.1509.828468 PC版
v2.426.8461 安卓最新版
v2.213.2874.361989 最新版
v5.739.6055 安卓版
v8.229.824 PC版
v5.192.34 安卓版
v2.966.2138.272000 最新版
v7.704 安卓版
v4.455.1870 安卓最新版
v7.262.7769.405859 安卓版
v9.89 安卓版
v8.828.2213.435399 最新版
v3.764.3080.741126 最新版
v2.601 安卓最新版
v8.725.6456.509892 PC版
v4.12.4264.218738 安卓版
v3.888.8036 安卓最新版
v7.207.3361 安卓漢化版
徐雅付费舞蹈全套46分钟
界面新闻记者 | 宋佳楠
界面新闻获悉,1月26日晚,阿里正式推出千问系列旗舰推理模子Qwen3-Max-Thinking。凭证阿里宣布的数据,该模子在19项权威基准测试中的体现媲美OpenAI的GPT-5.2-Thinking、谷歌的Gemini 3 Pro等国际顶尖模子,标记着国产大模子在高阶推理领域实现主要突破。
该模子总参数目超万亿,预训练数据量达36T Tokens,经大规模强化学习打磨而成。相较于前代模子,其焦点刷新集中在两方面。
一是自顺应工具挪用能力,可按需挪用搜索引擎和代码诠释器,现已上线Qwen Chat。与早期需要用户手动选择工具的要领差别,Qwen3-Max-Thinking能在对话中自主选择并挪用其内置的搜索、影象和代码诠释器功效。这种能力让模子能像专业人士一样自主判断是否挪用搜索、影象或代码诠释器,好比解答实时政策问题时自动检索最新信息,处置惩罚工程盘算时启动代码工具验证效果,无需用户特殊指令即可降低“幻觉”危害。
Qwen3-Max-Thinking相关测试数据 图片泉源:千问
另一个是测试时扩展手艺(Test-Time Scaling),指在推理阶段分派特殊盘算资源以提升模子性能的手艺。据称显著提升推理性能,在要害推理基准上逾越Gemini 3 Pro。
一样平常AI遇到难题,会同时想许多思绪,许多是重复的,白白耗算力。该手艺则通过“履历提取”式反思,阻止古板模子并行推理的冗余盘算,在相同算力下聚焦未解决难点,使GPQA科学知识测试得分从90.3提升至92.8,LiveCodeBench编程测试从88.0升至91.4。
针对Qwen3-Max-Thinking的更多性能评估 图片泉源:千问
在性能比拼中,该模子在被称为“人类最后的测试”的HLE工具挪用基准中,以58.3分远超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分;IMO级数学推理测试获91.5分登顶,预览版更曾拿下AIME 25与HMMT 25双满分。
现在,通俗用户可通过千问PC端、网页端免费体验,企业则能通过阿里云百炼获取API效劳。
1月21日,全球最大AI开源社区Hugging Face最新数据显示,阿里千问衍生模子数突破20万个,成为全球首个告竣此目的的开源大模子;同时,千问系列模子下载量突破10亿次,平均天天被下载110万次,已完全逾越美国Llama,稳居开源大模子全球第一。
阿里CEO吴泳铭去年曾体现,公司正在起劲推进三年3800亿的AI基础设施建设妄想,并将会一连追加更大的投入。这一投入规模与谷歌、Meta和亚马逊等美股科技巨头的AI资源开支处于统一量级。
相关版本
多平台下载
审查所有0条谈论>网友谈论
人人操,人人摸,人人插
小杰灬啊灬快灬高潮了
永久免费看国产免费无码视频
国产精品亚洲午夜一区二区三区
国产视频1998
国产的菊眼屁股HD
ccc欧美在线视频观看
网站黄色一区
91爆料网网址入口
3d9v官网登录入口
国产在视频线精品视频www666
被继夫添荫蒂好爽高
www.在线毛片
欧美日韩在
av在线一级爱
黄色软站
Julia一区
国产人成激情视频在线观看
69ΧΧΧΧ69HD一HD23
日韩专区第一页
欧美0000 X rV一|r
亚洲av三级免费观看
J8又硬又黄又大又粗
厨房扶着岳翘臀挺进去
国产真人无码免费视频
欧美一级黄片性爱视屏免费观看
日韩专区欧美专区亚洲专区
三级网站黄色
日本a片温泉下的母子