首页
金磊 发自 凹非寺量子位 | 公众号 QbitAI
真是越到年底,越是仙人打斗。
这不,智谱又又又发了新模子——GLM-4.7。
然后一举在代码竞技场WebDev榜单上逾越GPT-5.2,拿下开源大模子第一!
现在网友们也正在拿它猖獗实测中,体验完险些都是清一色的“Amazing”。
直接来感受一下网友拿着GLM-4.7和Gemini 3同时做的桌版溜溜球游戏,让网友直呼:
GLM-4.7完胜!
视频地点:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,为什么GLM-4.7这次会在编程效果上有这么大的前进?
就在今天早些时间,智谱还特意在Reddit上举行了一场AMA(Ask Me Anything)活动,关于背后的一切,都已经回覆得清晰明晰。
关于GLM-4.7,智谱回覆一切
这场对话不但展现了GLM-4.7怎样通事后训练实现性能奔腾,还首次深度曝光了自研的强化学习框架——Slime。
我们整理了这场AMA的焦点英华,看看这个被称为“Claude Code最佳平替”的国产模子,事实是怎么炼成的。
模子性能与优化
首先就是各人最为体贴的,为什么GLM-4.7会在体感上有云云显着的前进。
智谱团队在AMA中明确体现,GLM-4.7的刷新主要集中在后训练阶段。
在SFT(监视微调)和RL(强化学习)阶段,团队接纳磷泣细腻的宣布配方(Release Recipe)。通过对差别领域数据集的对齐,模子不但在基准测试上跑分更高,在现实安排中的稳固性也大幅提升。
而针对社区关于“为何不出更大参数目模子”的疑问,智谱团队直言:
训练本钱和安排本钱是设计的焦点锚点。
GLM-4.7在设计之初就思量了硬件限制。团队目的是让模子在消耗级显卡上也能跑出Air版本的无邪性,同时坚持靠近30B甚至更高规模的逻辑能力。这种在有限参数下压榨极致性能的思绪,正是为了让AI真正落地。
除此之外,智谱分享了他们建设的一套重大的预训练数据流程:
多源屎厕: 涵盖从高质量论文到小说等种种文本。极致整理: 包括去重、质量过滤和敏感词筛查。对齐战略: 重点关注SFT和RL阶段,让写作气概不再像机械人,而是越爆发动详尽。
模子应用场景与功效
若是说以前的GLM是个有些死板的理科生,那么4.7版本则是完成了一次情商逆袭。
在AMA中,开发者问得最多的就是编程。智谱团队坦言,他们针对Claude Code做了大宗的优化和适配事情。
现在,GLM-4.7在多语言编码方面体现精彩,不但支持Python、JS,在一些相对冷门的语言和重大的逻辑架构上也展现了极强的明确力。
团队以为,智能体框架对性能的影响占比高达30%,因此GLM-4.7在系统提醒词、工具挪用层级上做了深度打磨。
为了让模子更像人,团队从大宗小说和剧本中罗致养分。
现在的GLM-4.7在创意写作时,细节形貌越发富厚,不再只会说“在一个阳灼烁媚的下昼”这种套话。在角色饰演使命中,它能更好地维持人设,镌汰出戏的频率。
除此之外,GLM-4.7还引入了一个很是硬核的功效:交织思索(Interleaved Thinking)。
在执行行动或挪用工具之前,模子会先举行一段隐性思索。这种类似OpenAI o1的头脑链机制,让它在处置惩罚重大的多模态使命(如看图写代码、图表剖析)时,镌汰了冒失操作的概率,提高了准确度。
手艺要领与工具
智谱之以是在外洋社区受接待,与其起劲拥抱开源的态度密不可分。
这次AMA最让人惊喜的莫过于Slime框架的果真。
为相识决大模子强化学习效率低、稳固性差的问题,智谱研发并开源了Slime。
这个框架专为大规模强化学习设计,支持多种对齐算法。它的名字寓意着“无邪且具有极强顺应性”,能够资助开发者更容易地复现GLM级别的对齐效果。
智谱体现,他们从开源生态中获益良多,因此也乐于回馈。
他们详细形貌了从数据网络、整理到质量过滤的完整流水线。这种透明度在现在的国产大模子厂商中并未几见,也赢得了LocalLLaMA社区的一致尊重。
在 Reddit 上,智谱团队展现了极其接地气的一面。
有用户问:“你们训练时遇到最意外的挑战是什么?”
团队回覆:“最大的挑战着实是宣布配方。就像厨师手里有最好的食材(数据),但怎么掌握火候(RL参数)让它在出锅时最完善,往往需要无数次的推倒重来。”
尚有人奚落:“GLM-4.7是不是吃了什么灵丹妙药?”
团队则诙谐回应:“主要是我们学会了怎样让它在行动之前多想一想。”
实测GLM-4.7
在相识完GLM-4.7背后的“奇技淫巧”之后,我们照旧老规则,一波实测走起~
首先值得注重的是,现在在z.ai上搞开发,最好是点开“全栈开发”的按钮:
然后我们先做一个植物大战僵尸来小试牛刀,Prompt如下:
请基于目今目录准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 看成游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目录下的种莳植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一个《植物大战僵尸》游戏。
可以看到,同样是经典的测试游戏,这次在体感上是“声色俱全”的那种(体验链接放下面了):https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361
除了游戏之外,GLM-4.7另一个体感上的跃迁,即是做PPT了,这个demo的Prompt极其简朴:
做一个先容巴黎的PPT。
可以看到,PPT的效果已经抵达了直接商用的水平:
除此之外,做海报也是GLM-4.7的一绝。
例如设计一张宣传运动鞋的海报,比照GLM-4.6和GLM-4.7,效果的差别就一目了然了:
从种种效果来看,也就不难明确为什么这次GLM-4.7会在X上被刷屏了。
允许上市后一连开源
在这次AMA中,除了手艺硬核细节,围观群众最体贴的莫过于智谱要上市的事情了。
事实最近关于智谱拟赴港IPO的新闻引发了圈内不小的关注。
Reddit上有资深老哥犀利发问:“一旦公司上市,你们是否会缩减开源投入?”
智谱团队给出了一个很是坚定的定心丸:“开源是我们的焦点基因,无论资源路径怎样转变,我们允许上市后将一连开源。”
团队诠释道,智谱深知其生长离不开开源生态的滋养。一连开源不但是回馈,更是坚持手艺领先、建设开发者标准的最优路径。这种“即便敲钟,也要开卷”的姿态,确实让不少外洋开发者直呼“Respect”。
通过交织思索提升智力上限,通过Slime框架规范训练流程,智谱正在用最硬核的方法证实:国产模子不但能跑分,更能实战。
并且从用户们的反响来看,GLM-4.7以及智谱恒久以来的事情也是被给予了高度的认可。
例若有网友从价钱角度评价说:
GLM 4.7的1年订阅(靠近Opus 4.5级别)= Codex/Claude Code的1个月Max Plan。我现在就立马订一年的。
包括估值40亿美元的Fireworks也在Day0支持GLM 4.7,嗯,美国人也是有更好的模子选择了。
除此之外,在AMA的中,智谱团队说了一句让人期待的话:“我们会为了AGI在明年做更多的孝顺。”
在此基础之上,智谱首席科学家唐杰在GLM-4.7宣布之际揭晓了他关于大模子生长的一些看法。
原链接:https://weibo.com/2126427211/QjIYhCmfq
在IPO的灯灼烁起之前,智谱选择先点亮开发者的屏幕。这种恒久主义的浪漫,或许正是大模子时代最稀缺的底色。
《动漫爆浆一区二区》,《Q8X2R7L1T4J5M9B6W3》亚洲一区二区图片
“国产熟女丝袜视频一区草草影院”
精品久久久久久无码三级
……
12月30日
“免费试看欧美性生活影院”刘亦菲海南plog
↓↓↓
12月30日,香港消委会公布最新一期《选择》月刊 测试唇膏等多款产品,黄视频一区二区,gaintess,68日本XXXXXⅩXXX19,黄色在线 网站
12月30日,天天学习丨中南海月刊(2024.07),久久91精品国产91久久户,AV集中淫,欧美成高清视频三级,cc微博至尊版舞蹈
12月30日,外媒:以色列袭击黎巴嫩南部致3人遇难,一级黄片免费在线观看不卡,午夜性一级视频爽爽,橾橾操操处女,少萝足球鞋导管素材必备
12月30日|台胞遇见“非遗奇妙夜” 望与台湾阵头文化作交流|亚洲欧洲国产精品久久久|欧美一级毛视频免费播放|人人鲁人人尻|第一次破苞疼哭在线观看
12月30日|福建省启动防暴雨Ⅳ级应急响应|看美女胸和屁股歪歪漫画网页入口|JAVA高清在线谜|尼尔机械3D网站com.|日本久操
12月30日|国家统计局:造假是统计领域最大腐败|中国老太太伦乱视频|黄色视频www88|福利视频自拍|国产专区一区二区……
12月30日,(经济观察)东盟国家数字化建设给中国企业带来机会,黄色一级久久久AV高清片,亚洲AV无码一区二区三区dv,免费操逼视频网站,日韩Av无码高清
12月30日,十四届全国人大二次会议第三场“部长通道”集中采访活动举行,岛国片在线播放,免费插进去视频网站,欧美在线看免费vA,韩国电影a级
12月30日|攀岩亚少赛、全国青攀联赛相继在四川眉山举行|欧美日韩乱人伦一区二区|东北 HDvideo|群交俱乐部|欧美特级婬片A片免费看
12月30日,新华社记者说|今年两会,习近平尤为关切这件“新”事,国产中文字幕第二页,亚洲黄男女网,免费 成 人 黄 色 网站69,色视频大全
12月30日,冰雪经济,乘着“冬”风“热”起来,超碰91人妻在线,亚洲成色精品一区二区三区3d,国产亚洲情侣一区二区三区,同人动漫k128.co
12月30日,就业形势总体保持稳定——中国经济首季报亮点之四,黄工厂最新无码网站,暴肏,XNXX69爻诏卮,老湿av
12月30日|度小满CEO朱光:推理大模型在金融领域的应用将从外围场景深入到核心业务|女人的奶头不遮挡免费视频|得国黄色网站|嗯~啊~快点 死我漫画|陈美娇以一敌七视频下载
12月30日|第五届西部数字经济博览会在西安开幕|欧美老妇操逼|bbb污污污在线观看|人妖在线视频|91深夜在线观看国产亚洲一区
12月30日|中新教育丨全球数字教育发展指数“出炉”:中国排名前进15位|亚洲美女模特一级A片|日韩爱爱视频网|800AV视频在线观看网站|观看在线黄色网址
凤凰传奇免费联动时装,张雪峰说给女儿起名翻了半年字典|在热议AI时看见农村|黄化熊出没纳雅黄改版|免费A片在线观看在哪里|x7x7任意噪入口|AV激情小说图片网站
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
内塔尼亚胡回应以军对伊朗打击:精确有力,实现所有目标
北京警方深入开展安全隐患集中排查整治行动
中国第40次南极考察 “雪龙2”号完成大洋综合调查及走航作业
成都世园会闭幕 接待中外游客超千万人次
我国工业领域设备更新加速落地
中国大学生微纳大赛:309支队伍“论剑”总决赛
14分钟“生命通话” 山东冠县警方多警种联动营救轻生男子
为何颜色不一样都叫大白菜?
法国总统马克龙概述执政党议会选举纲领 痛批极右翼政党
从中国两会看全过程人民民主—— 以广泛商量回应人民诉求的良政善治
女人被添荫蒂的视频
手机在线免费夫妻毛片网站
B站未过审的舞蹈视频
50岁老熟女吞精
不卡免费黄片
韩国最新3级
国产最新av网址
只有高品的性爱视频
国产丰满熟女91
亚洲人人操网

闽公网安备 35010302000113号