717电影院,海量高清资源免费畅享,热门影视综艺一网打尽

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Anthropic官宣PTC突破,中国开发者一年前就实现了

2025-12-11 12:05:24
泉源:

猫眼影戏

作者:

薛发网

手机审查

  猫眼影戏记者 胡洪林 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:LRST

【新智元导读】Anthropic宣布了Programmatic Tool Calling(PTC)特征,让Claude通过代码编排工具执行,降低token消耗、镌汰延迟并提升准确性。不过,国产minion框架从一最先就接纳类似架构,其LLM妄想决议,代码情形执行,仅返回最终效果。相比PTC需显式启用,minion将此作为基础架构,还支持Python生态、状态治理、过失处置惩罚等功效,在现实应用中展现出更高的效率和无邪性。

2025年11月24日,Anthropic正式宣布了Programmatic Tool Calling (PTC)特征,允许Claude通过代码而非单次API挪用来编排工具执行。

这一立异被以为是Agent开发的主要突破,能够显著降低token消耗、镌汰延迟并提升准确性。

然而,Minion框架的建设者最近分享了一个有趣的事实:Minion从一最先就接纳了这种架构理念。

代码链接:https://github.com/femto/minion

在PTC看法被正式提出之前,minion已经在生产情形中证实晰这种要领的价值。

PTC解决了什么问题?

Anthropic在博文中指出了古板Tool Calling的两个焦点问题:

1. Context污染问题

古板方法中,每次工具挪用的效果都会返回到LLM的context中。例如剖析一个10MB的日志文件时,整个文件内容会进入context window,纵然LLM只需要过失频率的摘要。

2. 推理开销与手动综合

每次工具挪用都需要一次完整的模子推理。LLM必需「眼球式」地剖析数据、提取相关信息、推理片断怎样组合,然后决议下一步——这个历程既缓慢又容易蜕化。

Minion的解决计划

自然的PTC架构

Minion框架从设计之初就接纳了一种基础差别的架构:LLM专注于妄想和决议,详细执行交给代码情形。

这正是PTC想要实现的效果,但minion将其作为基础架构而非可选特征。

现实案例比照

Anthropic博文中的预算合规检查示例。

使命:找出Q3差旅超预算的团队成员

古板Tool Calling方法:

获取团队成员 → 20人

为每人获取Q3用度 → 20次工具挪用,每次返回50-100条用度明细

获取各级别预算限额

所有数据进入context:2000+条用度纪录(50KB+)

LLM手动汇总每人用度、查找预算、较量超支情形

使用PTC后:

Claude写一段Python剧本编排整个流程

剧本在Code Execution情形运行

LLM只看到最终效果:2-3个超支职员

在Minion中,这种模式是默认行为,llm会天生代码:

要害区别在于,Minion是框架的焦点设计,所有重大使命都这样处置惩罚;

而PTC需要显式启用,保存多重架构限制:

必需显式标记哪些工具允许programmatic挪用(allowed_callers设置)

运行在受限的Claude容器情形中,无法自由装置恣意包

文件需要通过特另外Files API上传(单文件最大500MB限制)

工具必需在容器4.5分钟不活动超时前返回效果

Web工具、MCP工具无法通过programmatic方法挪用

Minion的优势

更进一步

Minion不但实现了PTC的焦点理念,还提供了更多优势:

完整的Python生态系统

Minion中的代码执行情形拥有完整的Python生态会见权:

状态治理和长期化

Minion自然支持重大的状态治理:

过失处置惩罚和重试逻辑

在代码中显式处置惩罚种种界线情形:

并行和异步操作

充分使用Python的异步能力:

性能数据比照

凭证Anthropic的内部测试,PTC带来了显著刷新:

Token节。褐卮笱芯渴姑43,588降至27,297 tokens(镌汰37%)

延迟降低:消除了多次模子推理往返

准确率提升:

内部知识检索:25.6% → 28.5%

GIA基准测试:46.5% → 51.2%

在minion的生产使用中,能视察到类似甚至更好的指标,由于:

更少的模子挪用:LLM只在妄想阶段和最终总结时加入

更高效的资源使用:外地数据处置惩罚不必耗API tokens

更可展望的性能:代码执行路径明确,镌汰了LLM的不确定性

架构哲学

谁应该做什么?

Minion的设计基于一个焦点信心:

LLM善于明确、妄想和推理;Python善于执行、处置惩罚和转换。

这种职责疏散带来了清晰的架构:

这不但仅是优化,而是一种架构级别的重新思索。

Tool Search Tool

Minion的动态工具发明

Anthropic的另一个新特征是Tool Search Tool,解决大型工具库的context消耗问题。Minion在这方面也有响应的机制:

分层工具袒露

向量搜索工具发明

现实应用

Minion在生产情形

Minion框架已经在多个现实场景中证实晰这种架构的价值:

案例1:大规模数据剖析

金融科技公司使用minion剖析数百万条生意纪录,寻找异常模式:

效果:

处置惩罚100万条纪录

LLM仅消耗~5K tokens(古板方法需要500K+)

端到端延迟:30秒(vs 古板方法的5分钟+)

案例2:多源数据整合

SaaS公司使用minion整合来自多个API的客户数据:

案例3:自动化事情流

DevOps团队使用minion自动化重大的安排流程:

逾越PTC

Minion的未来偏向

虽然PTC是一个主要的前进,但minion的架构设计让我们能够探索更多可能性:

混淆推理模式

在一个会话中智能切换:

增量盘算缓和存

智能重用中心效果:

多模子协作

差别模子处置惩罚差别阶段:

开源的实力

社区驱动的立异

Minion作为开源项目(300+ GitHub stars),其生长得益于社区的孝顺和反响。这种开放性带来了:

快速迭代:社区发明问题和用例,推动快速刷新

多样化应用:用户在我们未曾想象的场景中使用minion

相比之下,PTC虽然强盛,但:

需要显式设置(allowed_callers,defer_loading等)

依赖特定的API版本和beta功效

与Claude的生态系统细密耦合

Minion的设计原则是provider-agnostic——你可以用任何LLM后端(Claude, GPT-4, 开源模子),架构优势依然保存。

手艺细节

实现比照

深入较量实现细节。

PTC的实现方法

Minion的实现方法

要害区别:

PTC:工具挪用通过特殊的API机制,有caller/callee关系

Minion:工具就是通俗的Python async函数,LLM天生标准代码

为什么这个架构云云主要?

随着AI Agent向生产情形生长,业界面临的焦点挑战是:

规模:处置惩罚百万级数据,不可全塞进context

可靠性:生产系统需要确定性的过失处置惩罚

本钱:token消耗直接影响商业可行性

性能:用户体验需要亚秒级响应

古板的单次工具挪用模式在这些维度上都遇到瓶颈。代码编排模式(无论是PTC照旧minion)提供了突破:

支持多种LLM后端(Claude, GPT-4, 开源模子);

无邪的安排选项(云端、外地、混淆);

富厚的Python生态系统集成。

结论

架构的必定收敛

Anthropic推出PTC不是无意——这是agent架构演进的必定偏向。当你需要构建能处置惩罚重大使命、大规模数据、多办法流程的生产级agent时,你会自然而然地得出这样的结论:

LLM应该专注于它善于的(明确和妄想),让代码处置惩罚它善于的(执行和转换)。

Minion从一最先就拥抱了这个理念,并将继续推动这个偏向:

?今天:完整的PTC式架构,生产情形验证

明天:更智能的工具发明、更高效的状态治理

未来:混淆推理、增量盘算、多模子协作

视频演示

作者信息

郑炳南,结业于复旦大学物理系。拥有20多年软件开发履历,具有富厚的古板软件开发以及人工智能开发履历,是开源社区的活跃孝顺者,加入孝顺metagpt、huggingface项目smolagents、mem0、crystal等项目,为ICLR 2025 oral paper《AFlow: Automating Agentic Workflow Generation》的作者之一。

参考资料:

https://github.com/femto/minion

https://github.com/femto/minion/blob/main/docs/advanced_tool_use.md

秒追ASI

?点赞、转发、在看一键三连?

点亮星标,锁定新智元极速推送!

??时势1:男人的 伸到 坤坤眼里

??12月11日,坚持在促进共同富裕中扶贫——“解码中国打赢脱贫攻坚战的世界意义”系列评论之四,

  小不点迈步,入目一片荒芜,各处尽是瓦砾,一经雄伟的宫阙、殿宇等都被毁掉了,有一种沧桑与古远的气息。

,99久久国产精品免费热97。

??12月11日,截至2023年底香港有逾1.4万间非本地公司 同比增逾2%,

  这不像是符文构建的银月,由于太真实了,倒像是天上的神月坠落,灵动而逼真。

,一级黄色级黄色级黄片一级黄片一级黄片,黄色色情按摩,欧美三级 欧美一级视频。

??时势2:亚洲资源一区

??12月11日,台媒:黑客入侵鸿海旗下半导体设备大厂京鼎 威胁公开5TB数据资料,

  (十一)开展案件整改检查,推动以查促防。各银行业金融机构应对其分支机构爆发案件的整改情形举行审计检查,并将检查情形实时羁系机构。羁系机构应对辖内银行业金融机构案件整改审计情形举行监视检查,评估检查整改效果,对整改不力的,要实时约谈,接纳羁系步伐,推动以查促防。

,一级二级三级片在线观看,日本黄页网站视频免费软件,国产精品丝袜综合区另类。

??12月11日,看熊猫、写书法、赴家宴 美国青少年石家庄感受待客之道,

  4.爆发火灾时要迅速逃生,不可贪恋财物。

,国产人成在线视频,操逼网视频,日本黄色二级视频。

??时势3:国产XXXX免费观看高清视频

??12月11日,美国国会参议员图恩当选参议院共和党领袖,

  针对现在我们在清静方面保存的问题,连系我们学校的现真相形,学校提出以下几点要求:

,10后女脱了内裤自慰,gg51·com红桃视频在线看免费版在线看在线看,真实迷奸在线观看。

??12月11日,时政Vlog丨龙狮双舞 欢迎习近平主席到访巴黎,

  乱箭如暴雨,越来越麋集。小不点大喝,在途中将一块千斤巨石踢起,轰然一声腾空,砸向神色很冷的少年狈风。

,人人摸视频在,黄网站色在线视频免费无码,草莓视频成人版。

??时势4:白丝校花让我摸

??12月11日,全球近百名顶尖电竞选手参与 2024上海电竞大师赛开赛,

  3、学校一直以来重视九年级事情,抓结业班治理,抓应对中考已形成一套较为成熟的事情程序和履历,特殊是今年中考取得了优异的效果,更为我们备考积累了富厚的履历。

,美女隐私全身免费看网站,日本少女性交处破,欧美三级AAAA片。

??12月11日,时政微周刊丨总书记的一周(4月29日—5月5日),

  统一时间,在其他三个偏向也泛起了三位至强者,登临石崖,俯视石村。

,朱竹清女仆装跳舞视频,日韩一级特黄无码毛片,A片一级毛片。

责编:陈嘉桦

审核:杨文

责编:杨雄

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图