Install
openclaw skills install moondream-vision-zc利用本地 Ollama 运行 Moondream 模型对图像进行理解,返回自然语言描述,可直接在聊天中发送图片或文件路径调用。
openclaw skills install moondream-vision-zcname: moondream-vision-zc description: 使用本地 Ollama 部署的 Moondream 模型进行图像理解,并将结果返回给 OpenClaw。该 Skill 适配 OpenClaw 2026 版本的多模态插件机制,可在聊天中直接发送图片或引用本地文件路径。 type: command
winget install ollama 或从 https://ollama.com/download 下载并安装。ollama serve,确保后台服务在 11434 端口监听。ollama pull moondream
ollama run moondream "一张猫的图片"
pip install requests
~/.openclaw/skills/moondream-vision/
├─ SKILL.md # 本文件
└─ scripts/
└─ moondream_vision.py
import sys, json, base64, requests, pathlib
OLLAMA_URL = "http://127.0.0.1:11434/api/generate"
def encode_image(path: str) -> str:
data = pathlib.Path(path).read_bytes()
return base64.b64encode(data).decode("utf-8")
def run_moondream(image_path: str, prompt: str = ""):
img_b64 = encode_image(image_path)
payload = {
"model": "moondream",
"prompt": prompt,
"images": [img_b64],
"stream": False,
}
resp = requests.post(OLLAMA_URL, json=payload)
resp.raise_for_status()
result = resp.json()
# Ollama returns a stream of tokens; when stream=False we get full response in ``response``
return result.get("response", "")
if __name__ == "__main__":
if len(sys.argv) < 2:
sys.stderr.write("Usage: python moondream_vision.py <image_path> [prompt]\n")
sys.exit(1)
image = sys.argv[1]
user_prompt = sys.argv[2] if len(sys.argv) > 2 else ""
print(run_moondream(image, user_prompt))
在 ~/.openclaw/config/skills.json(若不存在请创建)添加如下条目:
{
"name": "moondream-vision",
"command": "python ${skill_dir}/scripts/moondream_vision.py",
"description": "本地 Moondream 图像理解",
"usage": "!moondream <image_path> [prompt]",
"args": ["image_path", "prompt?"],
"output": "text"
}
${skill_dir} 为此 skill 所在目录的绝对路径,OpenClaw 会在运行时自动替换。!moondream D:\images\cat.jpg 在聊天中调用。!moondream img.png ➜ 获得图片描述 desc。!gpt "基于以下描述,写一段新闻稿:\n${desc}"。ollama serve 正在运行,检查防火墙是否阻止 11434 端口。prompt 参数非空,或在 payload 中加入 "system": "" 防止模型误判。用户:!moondream C:\Users\Administrator\Pictures\dog.jpg
Assistant: 这是一只棕色的狗,正坐在草地上,注视着镜头。
用户:!moondream C:\Users\Administrator\Pictures\dog.jpg "请把这张图的内容写成一段简短的广告文案"
Assistant: 「爱犬的欢笑,尽在自然」——让您的宠物在绿意盎然的草地上自由奔跑,感受生活的活力。
如有其他需求可进一步扩展,如批量处理、返回 JSON 结构等。