Media Saber 极空间监控
v3.0.202604030848实时监控极空间NAS系统状态、硬件健康、存储容量和性能指标。支持定时监控、异常告警、趋势分析和容量规划
Like a lobster shell, security has layers — review code before you run it.
License
SKILL.md
极空间 NAS 监控助手
基于 MCP get_zspace_system_state 工具,实时监控极空间NAS系统状态、硬件运行状况、存储空间和网络性能。
核心功能
1. 实时系统监控 📊
- CPU 状态: 实时CPU温度、使用率、核心数、主频
- 内存监控: 内存总量、使用率、可用空间
- 风扇转速: CPU风扇和系统风扇转速、控制值、运行状态
- GPU 状态: GPU温度、显存使用、渲染任务量
- 系统运行类: 运行时间(uptime)、启动时间、当前时间
2. 存储容量分析 💾
-
多盘管理:
- SATA 硬盘(支持多盘,如3.5"/2.5")
- NVMe SSD(M.2 2280格式)
- 单盘容量、已用空间、剩余空间
-
容量分析统计:
- 总容量计算
- 总体使用率百分比
- 各盘使用对比分析
- 容量满度警告(>90%提醒)
-
SMART 健康检查:
- 盘符、序列号、固件版本
- 硬盘型号、容量、转速
- SATA版本、扇区大小
- 磁盘状态(state)检查
3. 硬件健康检测 🌡️
-
温度监控告警:
- CPU 温度(建议 <80°C)
- 存储盘温度(建议 <50°C)
- GPU 温度(建议 <70°C)
- 温度过高自动告警
-
风扇状态检查:
- 转速是否正常
- 故障告警(state != 0)
-
磁盘 IO 检查:
- 各盘 IO 利用率(ioutil)
- 读写速度(rps/wps)
- 异常IO检测
4. 网络性能分析 🌐
-
网络速度测试:
- 实时下行速度(Kbps)
- 实时上行速度(Kbps)
- 多网卡监测(eth0等)
- 网络性能评分
-
网络信息:
- IP地址、网关、DNS
- MAC地址、子网掩码
- 公网IP和地址信息
5. 硬件配置查询 ⚙️
- 完整硬件清单:
- CPU型号、内存容量、GPU型号
- 存储支持: SATA硬盘、NVMe SSD、eMMC
- 网络: 千兆/2.5G网卡数量
- 接口: USB版本、HDMI、Type-C等
- 电源、RAID支持状态
安全性和权限声明
本技能需要以下权限和凭证,确保完全透明:
🔐 所需凭证- Media Saber MCP Endpoint URL: Media Saber MCP 服务的实际地址
- 示例:
http://localhost:22698/message或你的部署地址 - 敏感性:低(地址通常是内部网络或已知地址)
- 用途:连接到 Media Saber MCP 服务
- Media Saber MCP API Key: 用于验证与 Media Saber MCP 服务的连接
- 存储位置:OpenClaw 环境变量或配置文件
- 敏感性:高(不会在日志中显示)
- 用途:所有 NAS 监控数据的实时获取
- 配置文件修改:
~/.claw/mcpServers.json- 用途:存储 Media Saber MCP 端点配置
- 访问类型:读和写
- 操作:OpenClaw 安装时自动配置(需用户确认)
🔒 数据隐私
- 所有 NAS 监控数据仅用于本地分析
- API Key 从不发送至第三方
- 温度/性能数据用于告警判断,不上报统计
⚠️ 信任验证与最小权限
与外部端点交互时正常执行以下步骤,确保最小权限不超预期:
1. API Key 最小权限原则
- 需求介于想要接入的是什么 NAS 监控功能(数据查看、告警等)
- 尽可能用于仅读数据专用 API 密钥
- 不需要提供完整系统管理权限
2. 端点信任
- 校验端点是可信的(例如你拥有的属于团队的作地)
- 不要接入未知组织的远程端点
- 使用 HTTPS 、验证证书等安全配置
3. 配置文件保护
~/.claw/mcpServers.json配置了你的整个端点信息,包含了敏感的 API 密钥- 每次都要确保文件的文件权限(推荐:600)
- 定期更新、旋转 API 密钥
✅ 最佳实践
-
API Key 管理
# 设置环境变量(推荐) export API_KEY="your-api-key-here" export MCP_ENDPOINT_URL="http://localhost:22698/message" # 或在 ~/.claw/mcpServers.json 中配置 -
权限最小化
- 使用只读权限的 API Key(如可用)
- 定期轮换凭证
-
安全检查清单
- ✓ 确认 API Key 来自可信的 Media Saber 实例
- ✓ 检查 ~/.claw/mcpServers.json 的内容
- ✓ 监控日志中的认证失败
常见应用场景
📈 日常监控
"帮我查看NAS当前状态"
→ 显示: CPU温度、内存/存储使用率、网络速度、风扇转速
"NAS的硬盘情况怎么样?"
→ 显示: 各硬盘容量/使用情况、温度、SMART状态
"网络速度多少?"
→ 显示: 实时上下行速度、当前网卡、速度评级
🚨 故障告警
"系统温度高吗?"
→ 检查所有组件温度,高于阈值时给出告警
"硬盘快满了吗?"
→ 分析各硬盘使用率,>90%时提醒扩容
"NAS运行正常吗?"
→ 综合检查: CPU/内存/温度/IO/网络 + 告警
📊 容量规划
"可用存储空间还有多少?"
→ 统计所有盘可用容量、剩余时间估算
"哪个硬盘用的最满?"
→ 对比各盘使用率,给出排序和建议
"NAS能再用多久?"
→ 基于存储增长率估算满盘时间
⚙️ 硬件信息
"NAS的硬件配置是什么?"
→ 显示完整配置: CPU/内存/GPU/网络/存储规格
"支持哪些存储设备?"
→ 显示硬盘/SSD/eMMC支持规格
"网络接口有几个?"
→ 显示网卡数量、类型(2.5GbE等)
💡 高级功能:定时监控和异常告警
定时监控工作流
该技能支持周期性监控模式,可用于:
- 5分钟快速检查: 关键指标异常检测
- 30分钟常规巡检: 综合系统健康评分
- 每天深度分析: 趋势预警、容量规划、性能诊断
监控流程:
1. 获取系统状态 → get_zspace_system_state
2. 解析关键指标 → 提取CPU、内存、磁盘、温度、网络数据
3. 对标阈值检测 → 判断是否超过告警/危险阈值
4. 异常锁定 → 采集详细数据用于诊断
5. 发送告警 → 分级告警、历史对比、建议操作
异常检测和告警机制
告警级别定义
| 级别 | 触发条件 | 建议行动 |
|---|---|---|
| 🟢 正常 | 所有指标在正常范围内 | 继续监控 |
| 🟡 警告 | 单个指标接近阈值 | 观察趋势 |
| 🟠 告警 | 单个或多个指标超过告警阈值 | 主动介入 |
| 🔴 危险 | 多个关键指标严重超标 | 立即采取行动 |
关键异常场景检测
1. CPU 异常
🟡 警告: CPU使用率 >70% 持续 10分钟
→ 建议检查后台任务、停止不必要的服务
🔴 危险: CPU使用率 >90% 或 温度 >85°C
→ 可能散热不足、需要立即降温或检查硬故障
2. 内存异常
🟡 警告: 内存使用率 >80%
→ 建议重启服务或清理缓存
🔴 危险: 内存使用率 >95%
→ 系统可能卡顿、需要立即处理
3. 存储异常
🟡 警告: 单盘使用率 >85%
→ 建议规划扩容或清理过期文件
🔴 危险: 任何盘使用率 >95%
→ 系统可能无法写入、需要立即清理
4. 温度异常
🟡 警告: 硬盘温度 >50°C 或 CPU温度 >75°C
→ 检查风扇转速、改善散热
🔴 危险: 硬盘温度 >60°C 或 CPU温度 >90°C
→ 散热严重不足、硬件可能受损、立即停止工作负载
5. 网络异常
🟡 警告: 网络速度 <10Mbps 或 丢包率 >1%
→ 检查网络连接质量
🔴 危险: 网络断连 或 丢包率 >5%
→ 网络故障、需要检修网络设备
6. 风扇和散热故障
🔴 危险: 风扇转速为0 或 风扇状态异常
→ 风扇故障、系统可能过热、需要立即维修
对比和趋势分析
该技能支持:
- 环比分析: 与上次采样数据对比,检测变化趋势
- 周期性模式: 识别规律性高峰(如定时备份导致的高负载)
- 异常突变: 检测异常的突变(如硬盘温度突然升高)
- 长期趋势: 预测磁盘将满、硬件老化时间等
示例:
"今天CPU和磁盘的使用趋势相比昨天如何?"
→ 显示对比图表、异常峰值、原因分析
"硬盘温度在上升,还能继续工作多久?"
→ 计算温度上升速率、预估critical温度时间
"哪个硬盘最容易先坏?"
→ 基于温度、IO数据、SMART状态进行寿命评估
工作原理
- 调用 MCP 工具: 使用
get_zspace_system_state获取系统完整信息 - 数据解析: 提取CPU、内存、磁盘、网络、硬件6大类信息
- 智能分析:
- 温度告警检测(设定阈值)
- 容量使用率计算
- 网络性能评分
- 硬盘寿命预估
- 定时监控告警(新增)
- 可视化展示: 表格、图表、趋势分析
- 历史对比: 保存历史数据,进行时序分析
关键参数和阈值
基础监控阈值表
| 指标 | 正常范围 | 警告 | 告警 | 危险 |
|---|---|---|---|---|
| CPU 温度 | <60度C | 70度C | 80度C | >85度C |
| 硬盘温度 | <50度C | 50度C | 55度C | >60度C |
| GPU 温度 | <70度C | 72度C | 75度C | >80度C |
| CPU 使用率 | <70% | 75% | 85% | >90% |
| 内存使用率 | <80% | 85% | 90% | >95% |
| 存储使用率 | <80% | 85% | 90% | >95% |
| 网络速度 | >50Mbps | 20-50Mbps | 10-20Mbps | <10Mbps |
| 网络丢包率 | <0.1% | 0.5% | 1% | >5% |
监控间隔建议
| 监控类型 | 推荐间隔 | 场景说明 |
|---|---|---|
| 快速巡检 | 5 分钟 | 关键指标异常预警 |
| 常规监控 | 30 分钟 | 日常健康状态检查 |
| 深度分析 | 每天1-2次 | 性能诊断和预报 |
| 周期总结 | 每周1次 | 长期趋势分析 |
自定义告警规则
该技能支持灵活配置告警规则,常见规则包括:
温度异常告警
- 触发条件:硬盘温度连续3次采样 >55度C
- 告警级别:橙色告警
- 建议:检查散热、减少IO
容量爆满告警
- 触发条件:存储使用率 >95% 或 剩余容量 <500GB
- 告警级别:红色危险
- 建议:立即清理或扩容
风扇故障告警
- 触发条件:风扇转速为0 或 风扇状态异常
- 告警级别:红色危险
- 建议:立即检修
网络中断告警
- 触发条件:网络连接失败 或 丢包率 >5%
- 告警级别:红色危险
- 建议:检查网络设备和连接
⚠️ 必须配置:MCP 服务连接
使用此技能前,您必须配置 Media Saber MCP 服务的连接信息。
1. MCP 地址配置(需要用户填写)
- transport:
streamable-http - endpoint:
<MCP_ENDPOINT_URL>(例如:http://localhost:22698/message 或你的其他部署地址) - 需要用户填写实际的 MCP 服务地址
2. 认证信息配置(需要用户填写)
请在以下位置之一配置您的 API_KEY:
方式 A:OpenClaw 配置(推荐)
在 ~/.claw/mcpServers.json 中配置 Media Saber 连接:
{
"mcpServers": {
"MediaSaber": {
"transport": "streamable-http",
"url": "http://localhost:22698/message",
"headers": {
"Authorization": "Bearer sk-YOUR_API_KEY_HERE"
}
}
}
}
替换 sk-YOUR_API_KEY_HERE 为您的实际 API 密钥
方式 B:环境变量配置
- 设置环境变量:
MEDIA_SABER_API_KEY=sk-your-api-key - 该密钥将被自动注入到请求头中
3. 获取 API_KEY
请从 Media Saber 系统获取您的 API 密钥:
- 访问 Media Saber Web 界面
- 进入 "设置" → "API 密钥"
- 复制您的密钥(通常以
sk-开头)
安全提示:
- ⚠️ 切勿将 API_KEY 硬编码在代码、提示词或文档中
- ⚠️ 切勿通过不安全的通道传输 API_KEY
- ⚠️ 定期轮换您的 API_KEY
- ⚠️ 不要与他人共享您的 API_KEY
连接配置
该技能使用 MCP 后端的 get_zspace_system_state 工具实现实时监控。
工具信息:
- 工具名称:
get_zspace_system_state - 功能: 获取极空间NAS的完整系统状态信息
- 包含数据: CPU、内存、硬盘、温度、网络、硬件配置等
所需权限:
- Media Saber API 访问权限
- 极空间NAS 系统状态读取权限
相关技能推荐
- media-saber-mcp: 完整MCP工具集合(28+ 工具)
- media-saber-site-ops: 站点操作和诊断
- media-saber-cloud-assistant: 云盘和离线下载管理
示例提示词
系统监控
"分析我的NAS性能指标"
"CPU和内存使用情况如何?"
"各个硬盘的温度是否正常?"
"当前网络速度的表现如何?"
定时监控和异常告警(新增功能)
"帮我监控NAS状态,每隔5分钟检查一次,如果有异常请告诉我"
"定时检查CPU、内存、硬盘、温度等关键指标"
"建立一个每天的监控计划"
"提醒我任何异常情况:CPU温度>80°C、内存>90%、硬盘>85%"
"创建一个告警规则:硬盘温度超过55°C立即告诉我"
"如果网络断连或速度低于10Mbps,请立即发送告警"
"对比昨天和今天的系统状态,有什么变化吗?"
"分析过去一周的CPU使用趋势,预测何时会达到瓶颈"
"硬盘使用率在持续增长,还能用多久?"
"哪个硬盘最有可能先故障?"
"基于当前的温度趋势,散热系统是否有问题?"
问题诊断
"为什么硬盘温度这么高?"
"有什么硬件故障的迹象吗?"
"硬盘SMART状态正常吗?"
"系统风扇转速为什么这么快?"
"CPU使用率突然升高,是什么原因?"
"内存泄漏吗?使用趋势怎样?"
"检测到温度异常,该如何处理?"
容量规划
"NAS存储空间使用趋势是什么?"
"需要多久会存储满盘?"
"哪些硬盘需要更换?"
"可以添加更多存储吗?"
"基于当前写入速率,剩余空间够用多久?"
"监控三个月的容量增长曲线,来判断是否需要扩容"
"哪个硬盘转速最快,预计何时损坏?"
性能优化
"NAS网络性能如何,是否需要优化?"
"风扇转速过高是什么原因?"
"IO性能是否正常,读写速度如何?"
"系统在什么时段性能最好,什么时段最差?"
技术细节
系统信息结构:
basic: NAS基本信息(名称、NASID、注册时间)cpu: 处理器信息(型号、温度、使用率)cpu_fan: CPU风扇状态memory: 内存使用情况disks: SATA硬盘阵列(含SMART数据)ssds: NVMe SSD 信息gpu: 独立GPU/iGPU状态net_speed: 实时网络速度hard: 硬件规格清单uptime: 系统运行时间
状态码说明:
state: 0: 正常/健康state: 1: 警告/运行中state: 2+: 故障/异常
💡 提示: 定期运行此技能进行系统巡检,提前发现潜在问题,保障NAS的稳定运行。
Files
2 totalComments
Loading comments…
