首页
金磊 发自 凹非寺量子位 | 公众号 QbitAI
真是越到年底,越是仙人打斗。
这不,智谱又又又发了新模子——GLM-4.7。
然后一举在代码竞技场WebDev榜单上逾越GPT-5.2,拿下开源大模子第一!
现在网友们也正在拿它猖獗实测中,体验完险些都是清一色的“Amazing”。
直接来感受一下网友拿着GLM-4.7和Gemini 3同时做的桌版溜溜球游戏,让网友直呼:
GLM-4.7完胜!
视频地点:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,为什么GLM-4.7这次会在编程效果上有这么大的前进?
就在今天早些时间,智谱还特意在Reddit上举行了一场AMA(Ask Me Anything)活动,关于背后的一切,都已经回覆得清晰明晰。
关于GLM-4.7,智谱回覆一切
这场对话不但展现了GLM-4.7怎样通事后训练实现性能奔腾,还首次深度曝光了自研的强化学习框架——Slime。
我们整理了这场AMA的焦点英华,看看这个被称为“Claude Code最佳平替”的国产模子,事实是怎么炼成的。
模子性能与优化
首先就是各人最为体贴的,为什么GLM-4.7会在体感上有云云显着的前进。
智谱团队在AMA中明确体现,GLM-4.7的刷新主要集中在后训练阶段。
在SFT(监视微调)和RL(强化学习)阶段,团队接纳磷泣细腻的宣布配方(Release Recipe)。通过对差别领域数据集的对齐,模子不但在基准测试上跑分更高,在现实安排中的稳固性也大幅提升。
而针对社区关于“为何不出更大参数目模子”的疑问,智谱团队直言:
训练本钱和安排本钱是设计的焦点锚点。
GLM-4.7在设计之初就思量了硬件限制。团队目的是让模子在消耗级显卡上也能跑出Air版本的无邪性,同时坚持靠近30B甚至更高规模的逻辑能力。这种在有限参数下压榨极致性能的思绪,正是为了让AI真正落地。
除此之外,智谱分享了他们建设的一套重大的预训练数据流程:
多源屎厕: 涵盖从高质量论文到小说等种种文本。极致整理: 包括去重、质量过滤和敏感词筛查。对齐战略: 重点关注SFT和RL阶段,让写作气概不再像机械人,而是越爆发动详尽。
模子应用场景与功效
若是说以前的GLM是个有些死板的理科生,那么4.7版本则是完成了一次情商逆袭。
在AMA中,开发者问得最多的就是编程。智谱团队坦言,他们针对Claude Code做了大宗的优化和适配事情。
现在,GLM-4.7在多语言编码方面体现精彩,不但支持Python、JS,在一些相对冷门的语言和重大的逻辑架构上也展现了极强的明确力。
团队以为,智能体框架对性能的影响占比高达30%,因此GLM-4.7在系统提醒词、工具挪用层级上做了深度打磨。
为了让模子更像人,团队从大宗小说和剧本中罗致养分。
现在的GLM-4.7在创意写作时,细节形貌越发富厚,不再只会说“在一个阳灼烁媚的下昼”这种套话。在角色饰演使命中,它能更好地维持人设,镌汰出戏的频率。
除此之外,GLM-4.7还引入了一个很是硬核的功效:交织思索(Interleaved Thinking)。
在执行行动或挪用工具之前,模子会先举行一段隐性思索。这种类似OpenAI o1的头脑链机制,让它在处置惩罚重大的多模态使命(如看图写代码、图表剖析)时,镌汰了冒失操作的概率,提高了准确度。
手艺要领与工具
智谱之以是在外洋社区受接待,与其起劲拥抱开源的态度密不可分。
这次AMA最让人惊喜的莫过于Slime框架的果真。
为相识决大模子强化学习效率低、稳固性差的问题,智谱研发并开源了Slime。
这个框架专为大规模强化学习设计,支持多种对齐算法。它的名字寓意着“无邪且具有极强顺应性”,能够资助开发者更容易地复现GLM级别的对齐效果。
智谱体现,他们从开源生态中获益良多,因此也乐于回馈。
他们详细形貌了从数据网络、整理到质量过滤的完整流水线。这种透明度在现在的国产大模子厂商中并未几见,也赢得了LocalLLaMA社区的一致尊重。
在 Reddit 上,智谱团队展现了极其接地气的一面。
有用户问:“你们训练时遇到最意外的挑战是什么?”
团队回覆:“最大的挑战着实是宣布配方。就像厨师手里有最好的食材(数据),但怎么掌握火候(RL参数)让它在出锅时最完善,往往需要无数次的推倒重来。”
尚有人奚落:“GLM-4.7是不是吃了什么灵丹妙药?”
团队则诙谐回应:“主要是我们学会了怎样让它在行动之前多想一想。”
实测GLM-4.7
在相识完GLM-4.7背后的“奇技淫巧”之后,我们照旧老规则,一波实测走起~
首先值得注重的是,现在在z.ai上搞开发,最好是点开“全栈开发”的按钮:
然后我们先做一个植物大战僵尸来小试牛刀,Prompt如下:
请基于目今目录准备的素材(下载 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 看成游戏音乐, 下载 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目录下的种莳植物与僵尸静态/GIF图片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一个《植物大战僵尸》游戏。
可以看到,同样是经典的测试游戏,这次在体感上是“声色俱全”的那种(体验链接放下面了):https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361
除了游戏之外,GLM-4.7另一个体感上的跃迁,即是做PPT了,这个demo的Prompt极其简朴:
做一个先容巴黎的PPT。
可以看到,PPT的效果已经抵达了直接商用的水平:
除此之外,做海报也是GLM-4.7的一绝。
例如设计一张宣传运动鞋的海报,比照GLM-4.6和GLM-4.7,效果的差别就一目了然了:
从种种效果来看,也就不难明确为什么这次GLM-4.7会在X上被刷屏了。
允许上市后一连开源
在这次AMA中,除了手艺硬核细节,围观群众最体贴的莫过于智谱要上市的事情了。
事实最近关于智谱拟赴港IPO的新闻引发了圈内不小的关注。
Reddit上有资深老哥犀利发问:“一旦公司上市,你们是否会缩减开源投入?”
智谱团队给出了一个很是坚定的定心丸:“开源是我们的焦点基因,无论资源路径怎样转变,我们允许上市后将一连开源。”
团队诠释道,智谱深知其生长离不开开源生态的滋养。一连开源不但是回馈,更是坚持手艺领先、建设开发者标准的最优路径。这种“即便敲钟,也要开卷”的姿态,确实让不少外洋开发者直呼“Respect”。
通过交织思索提升智力上限,通过Slime框架规范训练流程,智谱正在用最硬核的方法证实:国产模子不但能跑分,更能实战。
并且从用户们的反响来看,GLM-4.7以及智谱恒久以来的事情也是被给予了高度的认可。
例若有网友从价钱角度评价说:
GLM 4.7的1年订阅(靠近Opus 4.5级别)= Codex/Claude Code的1个月Max Plan。我现在就立马订一年的。
包括估值40亿美元的Fireworks也在Day0支持GLM 4.7,嗯,美国人也是有更好的模子选择了。
除此之外,在AMA的中,智谱团队说了一句让人期待的话:“我们会为了AGI在明年做更多的孝顺。”
在此基础之上,智谱首席科学家唐杰在GLM-4.7宣布之际揭晓了他关于大模子生长的一些看法。
原链接:https://weibo.com/2126427211/QjIYhCmfq
在IPO的灯灼烁起之前,智谱选择先点亮开发者的屏幕。这种恒久主义的浪漫,或许正是大模子时代最稀缺的底色。
《69ΧΧΧΧ69HD一HD23》,《Q8X2R7L1T4J5M9B6W3》日韩综合无码一区二区青草
“美女自慰网站”
欧美性生交XXXXX无码婷婷
……
12月30日
“骚逼在线观看”黎巴嫩真主党宣布对以色列大规模袭击
↓↓↓
12月30日,十四届全国人大二次会议在京闭幕春龙节山西太原办社火表演传承千秋礼仪,欧美午夜三级片,女仆打开双腿让小少爷惩罚,美女奶头免费视频无遮挡,玖玖一区一区
12月30日,数据资产化激活要素价值,色哟哟导航日本在线,Chinese国产乱在线观看,免费可以看黄的视频网站,色中色.com
12月30日,2024年中国内地电影五一档票房破15亿元,斗罗大陆 18禁成人游戏,86j8精品视频,美女肛交的视频,漫 视频晚
12月30日|菲律宾11月通胀率升至2.5% 连续两月上涨|一级黄片免费在线观看不卡|成人电影在线免费视频|久久九九久精品国产婷婷婷婷|玖玖玖精品视频在线观看靠爱
12月30日|社交平台刮起“碘伏美白风” 专家:别信|狠狠色狠狠色综合日日不卡|小池理奈cos视频在线免费观看|aaa爽爽爽日韩视频|百分百曝光率软件下载
12月30日|(文化中国行)国家博物馆馆长:2024年入馆观众中35岁以下年轻人占比超六成|99在线一本精品欧美|初中校花洗澡视频91|图片亚洲综合区|成年动漫人物3d啪啪18禁……
12月30日,天津港开通“天津—南美东”直航新航线,欧k影视,国产精品玖玖资源站在线观看,欧美1视频,欧美三级在线免费看
12月30日,“五一”侨乡热 侨元素融入旅游体验,www.先锋影音资源站.com,黄色人人色黄色片,动漫女角色裸体乳头被吸的又红又肿网站,超碰91偷拍
12月30日|中新健康丨国际最新研究称有蛇毒治疗抗体或增强蛇毒毒性 提醒关注潜在风险|你懂得网站在线观看|亚洲欧美日韩综合另类旡码一级|欧美x x x x A片|朵莉亚本子18+
12月30日,喀什论道| 澳大利亚联邦人文科学院院士马克林:新疆正在经历另一个伟大的繁荣时刻,色碰网,祢豆子同人18 黄漫网站,h视频免费在线,https://kvx1o066.top/
12月30日,中国早稻产量连续4年在2800万吨以上,8888XXXX1819,把 插入 别揉了~视频三级,欧美黄色视频91,小医仙扒开 让我
12月30日,走好科技强农质量兴农品牌富农之路,女朋友被扣爽到尿了,91亚洲最新国语中文字幕,欧美XXXX,工地野外男女交配视频
12月30日|巴基斯坦两起巴士翻车事故致30余人死亡|69国产视频91AV|欧美性爱一区二区俄罗斯|媚黑漫画|黄色网站视频免费看在线
12月30日|数字社交如何重构“关系”?|久久久久久久91久久久|在线 91|馃悢馃悢浼歌繘馃敒馃敒|h黄视频在线免费观看
12月30日|议员吃回扣问题仍在发酵 日本岸田内阁支持率再创新低|你懂得精品在线|打扑克爽 又黄 视频|黄色网站入入口|宁荣荣被 到爽 高潮痉挛
留几手分析晚晚,妈妈的笑声比爸爸的普通话更好笑|北美票房|《特技狂人》开画表现不及预期|A片在线网址|黄色视频进入码。|欧美巨乳人妻中文在线播放|国产综合在线观看视频
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺
青海实现植物新品种授权“零”突破
探索综艺带动地方文旅 目的地推介计划正式启动
应急管理部:江苏常州粉尘爆炸事故暴露出企业主体责任不落实等突出问题
“五一”假期收官:国内流行小城游 中东、欧洲成出境游热门
飘香七十载,探访中国胡椒“兴隆之路”
中新健康|双胎孕妈妈遇到“无心胎” 上海专家宫内急救助正常胎儿发育
新疆喀什多地“五一”迎旅游热潮 游客:体验很好,下次还来
中央气象台继续发布冰冻橙色预警
王沪宁会见柬埔寨人民党主席、参议院主席洪森
利好不断!出入境旅游复苏进行时
国产人人插
国产情情久久网站
老年人一级毛片黄片
久久婷婷五月综合色7777
永久黄色网地址
女同一区 二区 三区
无码毛片在线观看网站
R星成人版黄APP下载
一本大道在线一本久道29欧美
超碰免費

闽公网安备 35010302000113号