Hugging Face发布：千行代码让AI学会自己写代码解决问题！

本文最后更新于 2025-09-28，距今已有 136 天，若文章内容或图片链接失效，请留言反馈。

Hugging Face发布：千行代码让AI学会自己写代码解决问题！

最近在研究Hugging Face的新项目SmolAgents，这个项目让我对AI Agent有了全新的认识。

我一直以为各种AI框架就是做问答和内容生成的，但SmolAgents完全不同，它不是用来聊天或生成内容的，而是用来构建能够自主执行任务的AI Agent。

这个区别很有意思。以前的AI应用就像个问答机器人，你问它问题，它给你答案。但SmolAgents构建的Agent更像是个智能助理，你给它任务，它自己思考并执行各种操作来完成。

前几天和朋友聊天，他说现在没人讨论AI会不会取代程序员了，大家都在讨论怎么用好AI。这句话让我挺有感触的，确实AI正在从被动回答问题的工具，变成能够主动解决问题的智能伙伴。

不到1000行代码的AI Agent框架

SmolAgents最让我惊讶的是它的简洁性——只有大约1000行代码！

现在的AI框架动不动就几万行代码，配置复杂得让人头疼。但SmolAgents反其道而行之，简单得让人觉得不可思议。

没有复杂的配置，没有花哨的功能，就是一个纯粹的Python库，让你能快速构建会"思考"的AI。这种返璞归真的设计，反而让我觉得特别酷。

Agent就像个小程序员一样，先思考要做什么，然后选择合适的工具，一步步把问题解决掉。整个过程完全自动化，而且只有1000行代码就实现了！

SmolAgents最大的特点是超级简洁，只有大约1000行代码，没有复杂的配置。而且它兼容各种AI模型，不管是OpenAI、Anthropic还是开源模型都能用。

最重要的是，它让AI能够通过写代码的方式来执行任务，而不是简单地调用预定义的工具。简单来说，SmolAgents让AI能够像程序员一样思考问题，然后自己写代码来执行各种操作。这种设计让Agent变得更强大，也更灵活。

CodeAgent：让AI通过代码执行任务

SmolAgents的核心是CodeAgent，这个名字听起来可能有点普通，但它的工作机制却很巧妙。

传统的AI Agent通常是通过JSON格式来调用工具，比如：

{
  "tool": "web_search",
  "query": "最新的AI发展趋势"
}

但CodeAgent不一样，它会直接生成Python代码：

# CodeAgent生成的代码示例
results = []
queries = ["AI发展趋势2025", "机器学习最新进展", "深度学习突破"]
for query in queries:
    results.append(web_search(query))

final_answer(f"搜索结果汇总：{results}")

这种方式有什么优势呢？根据Hugging Face的研究，代码驱动的Agent比传统的JSON方式减少了30%的执行步骤，意味着更少的LLM调用，更高的效率。

代码方式的优势真的很明显。代码像搭积木一样灵活，可以把各种代码块组合重用，想怎么玩就怎么玩。处理复杂数据也很轻松，能轻松存储和管理各种复杂信息。

理论上任何计算机能做的事情，代码都能表达，简直是无所不能。而且AI天生就更擅长写代码，毕竟训练时看了海量代码，写代码对它来说几乎是本能。

react原理图.png

ReAct框架的原理很简单，就像我们解决问题一样：先想清楚要做什么（思考），然后动手去做（行动）。如果没解决好，就继续思考下一步该怎么做，直到完成任务。这其实就是人类解决问题的自然方式！

实际体验：几行代码就能跑起来

我试着用SmolAgents写了一个简单的Agent：

from smolagents import CodeAgent, WebSearchTool, InferenceClientModel

model = InferenceClientModel()
agent = CodeAgent(tools=[WebSearchTool()], model=model, stream_outputs=True)

agent.run("帮我分析一下2025年AI Agent框架的发展趋势")

就这么简单，一个能够上网搜索、分析信息的Agent就跑起来了。而且它不是简单地搜索一下就返回结果，而是会真正地"思考"如何完成任务。

安全性考虑

说到让AI直接执行代码，很多人第一反应可能是：这不安全吧？

SmolAgents早就想到了这个问题，提供了三重安全保障：

安全的代码执行器：不是用普通的Python解释器，而是专门构建的安全版本，限制危险操作
沙盒环境：可以在隔离的容器里运行代码，完全不影响你的电脑
代码审查：执行前可以先检查生成的代码有没有问题

这种既追求效率又重视安全的设计，我觉得很实用。

支持各种模型和工具

SmolAgents的另一个亮点是它的兼容性：

模型无关：支持各种LLM，无论是OpenAI、Anthropic，还是本地的Transformers模型
工具无关：可以使用LangChain的工具、MCP服务器的工具，甚至Hugging Face的Space作为工具
多模态支持：不仅支持文本，还支持图像、视频、音频等多种输入格式

这种开放性让SmolAgents可以很容易地集成到现有的技术栈中。

真实的应用场景

我研究了一些SmolAgents的实际应用案例，发现它在以下几个场景特别有用：

智能RAG系统

传统的RAG系统只能简单地检索和生成，而SmolAgents可以构建更智能的RAG，能够根据问题动态调整检索策略。

比如，AI可以自己构建更好的搜索查询，而不是直接用用户的问题去搜索。如果第一次搜索结果不好，它还会自动重新搜索，比传统RAG聪明多了。

自动化研究助手

可以帮你搜索学术论文、提取关键信息、生成摘要，甚至做简单的数据分析。相当于拥有了一个不知疲倦的研究助理。

编程任务支持

不只是帮你写代码片段，而是能理解需求，写出完整的程序，甚至自己调试和优化代码。因为它本身就是用代码工作的，所以在编程任务上特别厉害。

自动化工作流

可以把各种工具和服务连接起来，构建复杂的工作流程。比如创建一个客服agent，它能同时查天气、看地图、访问知识库，像个多面手一样处理复杂问题。

文本转SQL

最让我惊讶的是，它能把自然语言转换成SQL查询。你用中文问个问题，它就能写出对应的SQL代码来查询数据库。

开源模型的崛起

让我感到很兴奋的是，SmolAgents的测试数据显示，开源模型在Agent任务上的表现已经相当不错：

DeepSeek-R1在某些任务上甚至超过了GPT-4，这说明开源模型在复杂推理任务上已经具备了很强的能力。

这对于想要在本地部署Agent系统的开发者来说是个好消息，意味着不需要依赖昂贵的API服务，也能构建强大的AI Agent。

简单但不是简陋

SmolAgents的简约设计让我想起了一个观点：好的设计不是加法，而是减法。

它没有追求大而全，而是专注于做好一件事——让AI能够通过代码来解决问题。这种专注反而让它变得更加灵活和强大。

但同时，简约并不意味着功能简陋。SmolAgents支持多Agent系统、远程代码执行、视觉模型等高级功能，只是这些功能都是以一种简洁的方式呈现的。

监控和调试：让Agent运行过程透明化

为什么要监控？

说实话，刚开始我觉得Agent运行监控可有可无，但实际使用后发现它真的很有用：

调试变得简单：当Agent运行出错时，可以准确找到问题所在
性能优化：可以看到哪些步骤耗时较长，针对性优化
决策透明：理解Agent的"思考过程"，便于改进
生产环境必备：在生产环境中，没有监控就像盲人摸象

因为Agent的工作流程本身就具有不可预测性，而且多步骤Agent会快速生成大量日志，大多数错误只是"LLM低级错误"，通常会在后续步骤中自我修正。这时候，监控工具就变得特别重要了。

Langfuse监控平台

SmolAgents支持OpenTelemetry标准，可以和Langfuse等监控平台集成。Langfuse是一个面向LLM工程的开源平台，提供AI Agent的追踪与监控功能。

配置完成后，你就可以在Langfuse平台上看到Agent的完整运行过程了：

从监控界面中，你可以清楚地看到每一步的思考和决策过程，这种可视化的调试方式确实比看日志高效得多。

给开发者的建议

如果你对AI Agent感兴趣，我觉得SmolAgents值得尝试：

适合初学者：简洁的设计让入门变得很容易，不需要理解复杂的概念就能开始使用。

适合快速原型：几行代码就能构建一个功能完整的Agent，很适合快速验证想法。

适合定制化：由于代码简洁，很容易根据自己的需求进行修改和扩展。

适合学习：通过阅读SmolAgents的源码，可以很好地理解Agent的工作原理。

总结一下

聊了这么多，其实我想表达的观点很简单：AI Agent框架的核心价值，应该是帮我们用更少的代码解决更多问题。

SmolAgents之所以让我觉得有意思，就是因为它在往这个方向努力。它让AI能够真正地"思考"和"行动"，而不只是一个会写代码的工具。

我觉得这种从"工具"到"伙伴"的转变，可能才是AI Agent框架发展的真正方向。SmolAgents虽然还很新，但至少给了我们一个不同的思路。

如果你想体验一下这种新的AI Agent开发方式，不妨试试看。从我的使用体验来看，它确实能帮我们解决一些实际问题，特别是在处理复杂任务时，那种让AI自己去思考和执行的方式真的很酷。

也欢迎大家在评论区分享你们的看法：你觉得AI Agent框架的未来会是什么样的？

本文仅代表个人观点，欢迎在评论区分享你对AI Agent框架的看法。

如果觉得文章对你有用，请随意赞赏

Hugging Face发布：千行代码让AI学会自己写代码解决问题！

https://www.lllyyb.com/archives/v65NBtiv

作者

lybtt

发布于

2025-09-28

更新于

2025-09-28

许可协议

CC BY 4.0