Nvidia Agent Fleet

NVIDIA Agent Fleet — 19个模型Agent + 智能调度引擎 + 并行协作

Audits

Pass

Install

openclaw skills install nvidia-agent-fleet

🚀 NVIDIA Agent Fleet

多 Agent 调度系统。每个 NVIDIA 模型拥有专属 Agent 身份,调度器自动分析任务类型并分配最佳 Agent 执行。

架构

任务输入 → 调度引擎 → 任务分类 → Agent 匹配 → 执行
                                            ├── DeepSeek V3.2 🧠
                                            ├── Qwen Coder 32B 💻
                                            ├── Kimi K2 🇨🇳
                                            ├── Llama 4 Maverick 🦙
                                            └── ... 19 个 Agent

Agent 阵容 (19个)

Agent模型专长
🧠 deepseek-v3-2DeepSeek V3.2推理、逻辑、数学
🇨🇳 kimi-k2Kimi K2中文、长文本、知识
🤔 kimi-k2-thinkingKimi K2 Thinking深度思考、推理
🏆 mistral-large-3Mistral Large 3 (675B)通用智能、多语言
⚡ mistral-smallMistral Small 4快速响应
💻 qwen-coder-32bQwen2.5 Coder 32B代码生成、算法
🦾 qwen3-coder-480bQwen3 Coder 480B架构设计、审查
🔧 deepseek-coderDeepSeek Coder 6.7B轻量代码、SQL
⚙️ codestralCodestral 22B代码补全、填空
🦙 llama-3-3-70bLlama 3.3 70B通用对话
🦙🆕 llama-4-maverickLlama 4 Maverick创意、分析
🔬 gemma-3-27bGemma 3 27B学术、科学
🏎️ phi-4-miniPhi-4 Mini极速响应
💨 gemma-3-4bGemma 3 4B超轻量
🌏 yi-largeYi Large中文优化
🏛️ glm-5-1GLM 5.1中文问答
🐉 qwen-3-5-397bQwen 3.5 397B超大中文
👁️ llama-vision-90bLlama Vision 90B视觉理解
📐 nv-embedNV-EmbedQA文本嵌入

使用

CLI

# 自动调度最佳 Agent
fleet "用Python写一个快速排序"

# 分析任务会匹配哪些 Agent
fleet analyze "解释一下量子纠缠"

# 指定 Agent 执行
fleet agent qwen-coder-32b "实现二分查找"

# 多 Agent 协同
fleet multi "如何看待人工智能的未来?"

# 列出所有 Agent
fleet list

⚡ 并行执行(v1.1.0 新增)

# 多 Agent 并行协同(同时调不同模型,互不等待)
fleet --multi --parallel "对比茅台和五粮液的财务状况"

# 指定 Agent 并行
fleet --multi --parallel --agent deepseek-v3-2,kimi-k2 "分析这个创业方案"

# 仍支持原有串行模式
fleet --multi "分析市场趋势"

并行 vs 串行 速度对比

串行: 任务A→任务B→任务C→任务D = 4个加起来
并行: 同时发4个请求 = 最慢那个决定总时间
加速比: x2~4 (取决于模型)

自动超时保护

每个模型有独立超时时间,快的先出结果,慢的到点自动跳过:

模型超时说明
Llama 4 Maverick15s写作/报告类,极快
Qwen Coder 32B20s代码/数据处理
Kimi K225s中文分析
DeepSeek V3.235s深度推理(最慢)
其他30s通用

API Key 自动发现

支持多级检索,无需手动设置环境变量:

1. $NVIDIA_API_KEY (环境变量)
2. ~/.zshrc (常用 shell 配置)
3. openclaw.json (OpenClaw 配置)

Python SDK

from dispatcher.fleet import dispatch, select_agents, multi_dispatch

# 自动匹配
result = dispatch("实现一个Web服务器")
print(result["content"])

# 多Agent协同(串行)
results = multi_dispatch("哲学问题:意识是什么?")

# 多Agent协同(并行执行)🚀
results = multi_dispatch("分析市场", parallel=True)
for r in results:
    print(f"{r['emoji']} {r['name']}: {r['content'][:100]}...")

v1.1.0 变更

✨ 新增

  • 并行执行模式 (--parallel / -p): 多 Agent 同时调用,互不等待
  • 逐模型超时保护: 每个模型有独立超时,慢的不拖累快的
  • API Key 自动发现: 环境变量 → .zshrc → openclaw.json 三级检索
  • 线程安全: ThreadPoolExecutor + Lock 确保日志不串

🔧 优化

  • 执行失败时优雅降级,已完成结果不受影响
  • 超时模型明确标记,不阻塞整体流程