您的位置：首页 > 手游攻略 > Agent 工程终于有脚手架了：Google开源一个开发agent的工具

Agent 工程终于有脚手架了：Google开源一个开发agent的工具

作者：互联网　　时间： 2026-07-05 08:23:53 　

Google开源agents-cli，为AI Agent开发提供从创建、测试到部署的全流程工程化支持，终结工具链断裂的痛点。
核心内容：
1. 工具定位：将常见编码助手转化为更懂Google Cloud Agent Platform的开发助手
2. 核心能力：注入7类工程技能，覆盖开发、评估、部署、观测全生命周期
3. 设计目标：将Agent项目从Demo推向可交付的企业级应用

Karpathy 前段时间把一个词讲热了：Agentic Engineering 。它听起来很抽象，落到项目里，其实就是三件事：先把需求写清楚，再用评估反复压问题，最后把安全、权限、部署、观测这些工程活补齐。

过去做 Agent，最容易卡在中间。写代码在编辑器里，起项目在终端里，测试要开浏览器，部署要进云控制台，评估还要再接一套框架。每一步都能做，但每换一个工具，脑子里的上下文就丢一截。

Google 这个 agents-cli 解决的正是这段断裂。它并不提供一个新的聊天机器人，也不替代 Claude Code 、 Codex 、 Cursor 。它更像一套给 coding agent 装上的工程技能包，让这些 coding agent 知道怎么用 Google 的 ADK 、 Agent Runtime 、 Cloud Run 、 Gemini Enterprise 去搭、测、发一个企业级 Agent 。

GitHub 上的定位很直白：agents-cli 是一套 CLI 和 skills，用来把常见 coding assistant 变成更懂 Google Cloud Agent Platform 的开发助手。

它支持 Antigravity CLI 、 Claude Code 、 Codex，也可以配合其他 coding agent 。安装后，它会给 coding agent 注入 7 类技能：

• google-agents-cli-workflow：Agent 开发生命周期和代码保留规则。
• google-agents-cli-adk-code：ADK Python API 、 tools 、 callbacks 、 state 等写法。
• google-agents-cli-scaffold：创建、增强、升级 Agent 项目。
• google-agents-cli-eval：评估集、指标、 LLM-as-judge 、 rubric 。
• google-agents-cli-deploy：Agent Runtime 、 Cloud Run 、 GKE 、 CI/CD 、 secrets 。
• google-agents-cli-publish：注册到 Gemini Enterprise 。
• google-agents-cli-observability：Cloud Trace 、日志和观测接入。

这个设计的重点不止是“又多一个命令行工具”。它想把 Agent 项目从 demo 拉到可交付状态。能创建项目只是第一步，能测试、能部署、能被组织里的人找到，才算走完。

第一步：安装

准备好 Python 3.11+、uv 和 Node.js 后，直接跑：

uvx google-agents-cli setup

如果只想装 skills，让自己的 coding agent 接管后面的工作，也可以用：

npx skills add google/agents-cli

装完后打开你常用的 coding agent，比如 Claude Code 、 Codex 、 Cursor 或 Antigravity CLI，让它按自然语言指令去创建项目。

第二步：让 coding agent 搭一个 RAG Agent

一个可复现的起手式是：

Build a RAG agent that ingests documents, retrieves relevant context,
and answers questions with source citations. Use the ADK agentic_rag
template with Gemini 3.5 Flash.

在 Akshay 的测试里，Claude Code 调用了 agents-cli 的 ADK skills，从 agentic_rag 模板搭出项目，用 Vector Search 做 datastore，还补了 citation 相关逻辑：回答必须有引用，retriever 返回文档时带 source ID 。

这一步很关键。很多 RAG demo 只演示“能答”，企业里更关心回答有没有资料依据。引用链如果一开始没设计，后面再补会很麻烦。

第三步：本地先测一轮

项目起来后，让 coding agent 启动 ADK Web UI：

Spin up a local dev server so I can test this.

本地测试至少看两类问题。

第一类是资料里能回答的问题，比如 “how to merge two dictionaries?”，Agent 应该能检索到对应内容，解释 | 合并和 update() 方法，并附上类似 [source: 1003] 的引用。

第二类是资料里没有的问题，比如 “who won the FIFA World Cup in 2022?”，Agent 应该承认资料不足，不能凭常识硬答。 RAG 项目上线前，这类拒答测试比“答得很顺”更有价值。

第四步：上线前做评估

很多 Agent 项目死在这里：demo 能跑，评估没有。 Karpathy 提过一个数据，运行 Agent 的团队里，做 observability 的比例高于做 evals 的比例。可没有 evals，日志再多也很难判断改动有没有把系统弄坏。

可以直接让 coding agent 生成评估集：

Generate 20 test scenarios for this RAG agent covering correct retrieval,
insufficient context where the agent should say it doesn't know,
multi-hop questions, and citation accuracy. Run the full eval suite and
show me the results.

这 20 个 case 可以分成四组：

• 6 个正确检索问题；
• 5 个资料不足时的拒答问题；
• 5 个需要多文档推理的问题；
• 4 个 citation accuracy 问题。

Akshay 的测试结果里，引用准确率 20/20，通过。但 eval 也抓到一个洞：当问题不在语料里时，Agent 有时会补一句通用知识。问题来自 instruction 里的一行宽松规则，大意是“简单问题可以不用工具直接回答”。删掉这行，拒答行为才会稳定。

这就是 eval 的价值。分数表只是表面结果，最有用的是提前暴露那些容易被忽略的指令漏洞。

第五步：部署到 Agent Runtime

评估过后，就可以让 coding agent 处理部署：

Deploy this to Agent Runtime in us-central1.

agents-cli 会把项目补齐为 Agent Runtime 可部署的形态，加入入口文件和基础设施配置。根据这次测试，部署到 Google Cloud 大概花了 2 到 3 分钟。

Cloud Trace 默认接入，这一点对团队协作很实用。 Agent 出问题时，不能只看聊天记录，还要能回到 trace 、日志、调用链里定位是哪一步坏了。

第六步：注册到 Gemini Enterprise

很多内部 Agent 做完后，只停留在“某个同事机器上能跑”。别人不知道它存在，也拿不到 endpoint 、权限和使用方式。这样的 Agent 很快就会被遗忘。

继续让 coding agent 执行：

Register this agent to Gemini Enterprise.

注册后，它会出现在 Gemini Enterprise app 里，组织内有权限的人可以发现和使用。 IAM 控制访问，企业面板负责观测。到这一步，一个 RAG Agent 才从个人 demo 变成团队可用的内部知识助手。

可以怎么用在自己的项目里

如果只是想试水，不用一上来就做复杂 Agent 。更稳的路径是：

1. 先选一个低风险知识库，比如团队 FAQ 、产品术语表、内部 onboarding 文档。
2. 用 agents-cli scaffold 或 setup 后的 coding agent 建一个 RAG 项目。
3. 写 15 到 30 个真实问题，里面故意混入资料不足、歧义、多跳问题。
4. 先跑 eval，再改 instruction，不要只靠手感调 prompt 。
5. 本地测过后再部署，部署后补 trace 、权限、成本监控。
6. 最后再考虑注册到企业入口，让团队成员能找到它。

GitHub README 里列出的常用命令也值得保存：

agents-cli scaffold 
agents-cli eval generate
agents-cli eval grade
agents-cli deploy
agents-cli publish gemini-enterprise

如果你已经有一个 ADK 项目，也可以用：

agents-cli scaffold enhance

它会给旧项目补部署、 CI/CD 或 RAG 相关能力。

使用前要先想清楚的地方

agents-cli 很适合 Google Cloud 和 ADK 体系内的 Agent 工程。如果你的团队已经在用 Vertex AI 、 Cloud Run 、 Gemini Enterprise，它能省掉不少胶水工作。

但它也带来一个前提：部署、观测、企业注册这些能力都和 Google Cloud 绑定得比较深。个人开发者可以本地玩起来，真要走云端和企业入口，还是要处理账号、计费、权限、服务条款和区域合规。

另一个提醒是，不要把“coding agent 能自动跑完整流程”理解成可以少做验收。脚手架能加速，eval 和权限检查不能省。 Agent 最危险的地方往往不在答不上来，而在资料不足时答得太顺。

我会怎么判断它值不值得用

如果你的 Agent 还停留在玩具 demo 阶段，agents-cli 可能显得有点重。直接用 ADK 或 LangGraph 写一个本地原型，反而更快。

如果你已经遇到这些问题，它就值得试：

• 每个 Agent 都要重新搭项目结构；
• 评估集总是上线前才想起来；
• 部署脚本、权限、 Cloud Run 配置反复复制；
• 内部 Agent 做完后没人知道入口在哪里；
• 团队希望 coding agent 不只写代码，还能按工程规范把项目推到可上线状态。

Agent 开发接下来拼的不会只是模型调用能力。更麻烦的部分在评估、权限、部署、观测、组织分发。 Google 这次把这些环节塞进一个 CLI 和一组 skills 里，方向是对的：让 coding agent 少当“会写代码的助手”，多承担一点工程交付的脏活。

_{来源链接: https://github.com/google/agents-cli}

登录查看剩余 70% 内容

小编: 三国战纪风云再起整合版| 三国战纪乱世天炽(风云修改版)| 三国战纪乱世天炽修正版| 三国战纪乱世风云-邪凤对战| 新三国战纪七星转生整合版|

精彩合集

游戏排行

NO.1

《神剑伏魔录》（神剑风云）游戏音乐合集

7.73 MB/其他游戏

下载
NO.2

《行尸走肉第一章》免安装中文汉化硬盘版下载

436 MB/单机

下载
NO.3

《街头霸王X铁拳》免安装中文汉化硬盘版下载

111MB/单机

下载
4 《生化危机：浣熊市行动》免安装中文硬盘版下载
5 《暗黑破坏神3》免安装繁体中文正式版下载
6 《马克思佩恩3》免安装硬盘版下载
7 《冰河世纪4：大陆漂移》免安装硬盘版下载发布
8 《疯狂车手》免安装中文汉化硬盘版下载
9 《愤怒的小鸟：猪之夏日海洋版》免安装中文版下载
10 《植物大战僵尸无尽版》免安装中文硬盘版下载

三国

街机

手游

单机

攻略