2025年03月12日,AIHub报道 —— OpenAI近日发布了一系列全新工具和API,旨在帮助开发者更轻松地创建能够自动执行任务的AI Agents(智能体)。尽管此前的高级推理和多模态交互模型为Agent开发提供了基础,但在实际构建生产级Agent时,开发者仍面临诸多技术难题。此次发布的工具包通过优化开发流程、降低技术门槛,为开发者提供了更高效的解决方案。
核心工具与功能
ResponseS API
ResponseS API融合了Chat Completions API的简洁性和Assistants API的工具调用能力。开发者只需调用一次API,即可利用多种工具和多轮模型交互完成复杂任务,大幅提升开发效率。
内置工具
Web搜索工具:支持GPT-40和GPT-40-mini模型访问互联网获取实时信息。在SimpleQA基准测试中,分别取得了90%和88%的准确率。
文件搜索工具:支持多种文件格式,优化查询、元数据过滤和自定义排序功能,帮助开发者快速从海量文档中提取关键信息。
计算机使用工具:由Computer-Using Agent(CUA)模型驱动,可模拟鼠标和键盘操作,自动化复杂任务,支持网页和桌面应用程序。
Agents SDK
基于Swarm框架升级的开源框架,简化多Agent工作流程的编排,提供LLM与工具集成、Agent间智能交接控制、可配置安全检查以及可视化追踪等功能。
应用场景
客户支持自动化:通过Web搜索工具帮助资产管理者和法律从业者快速获取有效信息。
AI旅行助手:利用文件搜索工具为用户提供精准的旅行政策解答。
复杂操作自动化:通过计算机使用工具实现传统系统中复杂操作的自动化。
企业数据搜索:使用Agents SDK快速构建企业级数据搜索应用。
技术细节与优势
Agent间的无缝协作:支持复杂任务的分解和多Agent协同工作,例如从商品推荐到购买再到退货的全流程自动化。
隐私保护机制:通过安全措施(guardrails)和输入过滤(input filter)确保用户数据隐私。
模型性能优化:在多个基准测试中,CUA模型表现优异,例如在WebVoyager测试中达到了87%的准确率。
未来规划
OpenAI表示将继续支持Chat Completions API,并计划在2026年中期停用Assistants API,同时提供详细的迁移指南。此外,新工具的定价也已公布:
Web搜索:每千次查询30美元(GPT-40)和25美元(GPT-40-mini)。
文件搜索:每千次查询2.5美元。
计算机使用工具:按token计费。
总结
OpenAI此次发布的Agent工具包为开发者提供了强大的工具和框架,显著简化了AI Agents的构建和部署流程。这不仅降低了技术门槛,还推动了AI在更多领域的广泛应用。随着这些工具的不断优化,AI Agents有望在未来实现更多创新应用,为各行各业带来深远影响。