枫可怜811,内容丰富,界面简洁,无论新手还是高手都能轻松上手

k1体育麻将胡了

搜索 猫眼影戏 融媒体矩阵
  • 山东手机报

  • 猫眼影戏

  • 公共网官方微信

  • 公共网官方微博

  • 抖音

  • 人民号

  • 天下党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

Anthropic官宣PTC突破,中国开发者一年前就实现了

2025-12-10 04:57:29
泉源:

猫眼影戏

作者:

黎翔

手机审查

  猫眼影戏记者 金丰 报道Q8X2R7L1T4J5M9B6W3

新智元报道

编辑:LRST

【新智元导读】Anthropic宣布了Programmatic Tool Calling(PTC)特征,让Claude通过代码编排工具执行,降低token消耗、镌汰延迟并提升准确性。不过,国产minion框架从一最先就接纳类似架构,其LLM妄想决议,代码情形执行,仅返回最终效果。相比PTC需显式启用,minion将此作为基础架构,还支持Python生态、状态治理、过失处置惩罚等功效,在现实应用中展现出更高的效率和无邪性。

2025年11月24日,Anthropic正式宣布了Programmatic Tool Calling (PTC)特征,允许Claude通过代码而非单次API挪用来编排工具执行。

这一立异被以为是Agent开发的主要突破,能够显著降低token消耗、镌汰延迟并提升准确性。

然而,Minion框架的建设者最近分享了一个有趣的事实:Minion从一最先就接纳了这种架构理念。

代码链接:https://github.com/femto/minion

在PTC看法被正式提出之前,minion已经在生产情形中证实晰这种要领的价值。

PTC解决了什么问题 ?

Anthropic在博文中指出了古板Tool Calling的两个焦点问题:

1. Context污染问题

古板方法中,每次工具挪用的效果都会返回到LLM的context中。例如剖析一个10MB的日志文件时,整个文件内容会进入context window,纵然LLM只需要过失频率的摘要。

2. 推理开销与手动综合

每次工具挪用都需要一次完整的模子推理。LLM必需「眼球式」地剖析数据、提取相关信息、推理片断怎样组合,然后决议下一步——这个历程既缓慢又容易蜕化。

Minion的解决计划

自然的PTC架构

Minion框架从设计之初就接纳了一种基础差别的架构:LLM专注于妄想和决议,详细执行交给代码情形。

这正是PTC想要实现的效果,但minion将其作为基础架构而非可选特征。

现实案例比照

Anthropic博文中的预算合规检查示例。

使命:找出Q3差旅超预算的团队成员

古板Tool Calling方法:

获取团队成员 → 20人

为每人获取Q3用度 → 20次工具挪用,每次返回50-100条用度明细

获取各级别预算限额

所有数据进入context:2000+条用度纪录(50KB+)

LLM手动汇总每人用度、查找预算、较量超支情形

使用PTC后:

Claude写一段Python剧本编排整个流程

剧本在Code Execution情形运行

LLM只看到最终效果:2-3个超支职员

在Minion中,这种模式是默认行为,llm会天生代码:

要害区别在于,Minion是框架的焦点设计,所有重大使命都这样处置惩罚 ;

而PTC需要显式启用,保存多重架构限制:

必需显式标记哪些工具允许programmatic挪用(allowed_callers设置)

运行在受限的Claude容器情形中,无法自由装置恣意包

文件需要通过特另外Files API上传(单文件最大500MB限制)

工具必需在容器4.5分钟不活动超时前返回效果

Web工具、MCP工具无法通过programmatic方法挪用

Minion的优势

更进一步

Minion不但实现了PTC的焦点理念,还提供了更多优势:

完整的Python生态系统

Minion中的代码执行情形拥有完整的Python生态会见权:

状态治理和长期化

Minion自然支持重大的状态治理:

过失处置惩罚和重试逻辑

在代码中显式处置惩罚种种界线情形:

并行和异步操作

充分使用Python的异步能力:

性能数据比照

凭证Anthropic的内部测试,PTC带来了显著刷新:

Token节。褐卮笱芯渴姑43,588降至27,297 tokens(镌汰37%)

延迟降低:消除了多次模子推理往返

准确率提升:

内部知识检索:25.6% → 28.5%

GIA基准测试:46.5% → 51.2%

在minion的生产使用中,能视察到类似甚至更好的指标,由于:

更少的模子挪用:LLM只在妄想阶段和最终总结时加入

更高效的资源使用:外地数据处置惩罚不必耗API tokens

更可展望的性能:代码执行路径明确,镌汰了LLM的不确定性

架构哲学

谁应该做什么 ?

Minion的设计基于一个焦点信心:

LLM善于明确、妄想和推理 ;Python善于执行、处置惩罚和转换。

这种职责疏散带来了清晰的架构:

这不但仅是优化,而是一种架构级别的重新思索。

Tool Search Tool

Minion的动态工具发明

Anthropic的另一个新特征是Tool Search Tool,解决大型工具库的context消耗问题。Minion在这方面也有响应的机制:

分层工具袒露

向量搜索工具发明

现实应用

Minion在生产情形

Minion框架已经在多个现实场景中证实晰这种架构的价值:

案例1:大规模数据剖析

金融科技公司使用minion剖析数百万条生意纪录,寻找异常模式:

效果:

处置惩罚100万条纪录

LLM仅消耗~5K tokens(古板方法需要500K+)

端到端延迟:30秒(vs 古板方法的5分钟+)

案例2:多源数据整合

SaaS公司使用minion整合来自多个API的客户数据:

案例3:自动化事情流

DevOps团队使用minion自动化重大的安排流程:

逾越PTC

Minion的未来偏向

虽然PTC是一个主要的前进,但minion的架构设计让我们能够探索更多可能性:

混淆推理模式

在一个会话中智能切换:

增量盘算缓和存

智能重用中心效果:

多模子协作

差别模子处置惩罚差别阶段:

开源的实力

社区驱动的立异

Minion作为开源项目(300+ GitHub stars),其生长得益于社区的孝顺和反响。这种开放性带来了:

快速迭代:社区发明问题和用例,推动快速刷新

多样化应用:用户在我们未曾想象的场景中使用minion

相比之下,PTC虽然强盛,但:

需要显式设置(allowed_callers,defer_loading等)

依赖特定的API版本和beta功效

与Claude的生态系统细密耦合

Minion的设计原则是provider-agnostic——你可以用任何LLM后端(Claude, GPT-4, 开源模子),架构优势依然保存。

手艺细节

实现比照

深入较量实现细节。

PTC的实现方法

Minion的实现方法

要害区别:

PTC:工具挪用通过特殊的API机制,有caller/callee关系

Minion:工具就是通俗的Python async函数,LLM天生标准代码

为什么这个架构云云主要 ?

随着AI Agent向生产情形生长,业界面临的焦点挑战是:

规模:处置惩罚百万级数据,不可全塞进context

可靠性:生产系统需要确定性的过失处置惩罚

本钱:token消耗直接影响商业可行性

性能:用户体验需要亚秒级响应

古板的单次工具挪用模式在这些维度上都遇到瓶颈。代码编排模式(无论是PTC照旧minion)提供了突破:

支持多种LLM后端(Claude, GPT-4, 开源模子) ;

无邪的安排选项(云端、外地、混淆) ;

富厚的Python生态系统集成。

结论

架构的必定收敛

Anthropic推出PTC不是无意——这是agent架构演进的必定偏向。当你需要构建能处置惩罚重大使命、大规模数据、多办法流程的生产级agent时,你会自然而然地得出这样的结论:

LLM应该专注于它善于的(明确和妄想),让代码处置惩罚它善于的(执行和转换)。

Minion从一最先就拥抱了这个理念,并将继续推动这个偏向:

?今天:完整的PTC式架构,生产情形验证

明天:更智能的工具发明、更高效的状态治理

未来:混淆推理、增量盘算、多模子协作

视频演示

作者信息

郑炳南,结业于复旦大学物理系。拥有20多年软件开发履历,具有富厚的古板软件开发以及人工智能开发履历,是开源社区的活跃孝顺者,加入孝顺metagpt、huggingface项目smolagents、mem0、crystal等项目,为ICLR 2025 oral paper《AFlow: Automating Agentic Workflow Generation》的作者之一。

参考资料:

https://github.com/femto/minion

https://github.com/femto/minion/blob/main/docs/advanced_tool_use.md

秒追ASI

?点赞、转发、在看一键三连?

点亮星标,锁定新智元极速推送!

??时势1:亚洲中文字幕一级毛片

??12月10日,外媒:达沃斯“今日最大故事”是中国庞大的代表团,

  所有人都心中一紧,那只神性狻猊绚烂更炫目了,张牙舞爪,喷云吐雾,发出阵阵雷鸣声,冲向小不点。

,国产xboxones免费。

??12月10日,胡塞武装逮捕多名联合国工作人员 古特雷斯谴责,

  此后,他想到了一个严重的问题,柳神是究竟什么年月的生灵,它所说的事,岂非是亲眼所见 ?

,国产呦精品一区二区三区按摩,丝袜老师把我 出精,中日韩欧美性爱视频又黑。

??时势2:免费福利视频网

??12月10日,CBA第三阶段竞争性提升的背后,

  第五、要战胜难题,勇往直前。有的同砚家境贫赛,学习难以为继,有的同砚疾病缠身,影响学习生涯,有的经常遇到不顺心的事情……难题是好事,而不是坏事。难题是磨石,可以麿炼我们顽强的意志。“自古英雄多灾祸”,“自古英雄出贫家”,“宝剑锋自磨砺出,梅花香自苦寒来”。

,成熟熟女熟妇XX,午夜福利综合网站,国产日韩av免费无码一区二区不卡。

??12月10日,深刻把握金融工作的政治性和人民性,

  敬的列位爱心人士、列位向导、先生们、同砚们:

,k200.tv app如何下载安装,无码粉嫩小泬无套在线观看免费,妃光莉在线观看。

??时势3:www爱搞

??12月10日,【中新画报】世界地球日 感受这颗星球的蓝色之美,

  (四)开展案防事情试评估,引发内生动力。各银行业金融机构要围绕案防事情组织、制度及质量控制、案防事情执行、监视与检查、审核与问责等方面内容开展20xx年案防事情试评估,凭证法人认真原则,细化对分支机构自我评估的事情要求。要通过评估,查找内控治理和案防薄弱环节,严酷落实整改。羁系部分要实时对银行业金融机构试评估情形举行羁系评价。

,人人一级黄片一级黄片,性交动态图在线观看,女的被草到高潮喷水的视频。

??12月10日,文化中国行 | 2024“新疆是个好地方”对口援疆非遗展在库尔勒开幕,

  “哦,你们继续,我去磨炼了。”新的一天最先,小不点吃过早晚后,奔向那处乱石瀑布群。

,欧美三级片一区,久久精品99毛片免费,一级黄色A片国产片免费看。

??时势4:H片视频在线观看

??12月10日,一批00后舰载战斗机飞行学员成功完成单飞训练,

共青团讲话 篇2

,女性向男喘自慰h,乱伦操B小说,久久欧精品欧美精品日韩精品。

??12月10日,西太平洋海军论坛第19届年会开幕,

  镇外,原始山林中,一条兽骨很是粗长,六七米长,不知属于何种凶物,散发莹白绚烂,符文闪灼,密密麻麻,离地一尺高,快速冲来。

,花影视院韩国午夜,免费视频专区一国产盗摄,人人爱人人色人人操。

责编:伯南克

审核:王贵妃

责编:张怡宁

相关推荐 换一换

Copyright (C) 2001-   dzwww.com. All Rights Reserved

新闻信息效劳允许证 - 音像制品出书允许证 - 广播电视节目制作谋划允许证 - 网络视听允许证 - 网络文化谋划允许证

山东省互联网传媒集团主理  联系电话:0531-85193202  违法不良信息举报电话:0531-85196540

鲁ICP备09023866号-1   鲁公网安备 37010202000111号  

Copyright (C) 2001- Dzwww   鲁ICP备09023866号-1

网站地图