Install
openclaw skills install ollama-vision本地调用 Ollama qwen3-vl:4b 模型自动压缩并分析图片,支持描述、OCR 文字提取和自定义信息抽取。
openclaw skills install ollama-vision本地视觉分析技能,调用 Ollama 的 qwen3-vl:4b 模型分析图片。
此技能允许在保留 Kimi 作为主对话模型的前提下,使用本地部署的 Ollama 视觉模型(qwen3-vl:4b)分析图片内容。支持 OCR、图片描述、文字提取等功能。
pip install Pillow)分析图片内容,支持多种分析模式。
参数:
image_path (string, required): 图片文件的完整路径mode (string, optional): 分析模式,可选值:
"describe" - 详细描述图片内容(默认)"ocr" - 提取图片中的所有文字"extract" - 根据自定义提示词提取特定信息prompt (string, optional): 当 mode="extract" 时的自定义提示词返回:
示例:
# 描述图片
analyze_image(image_path="C:\\path\\to\\image.jpg")
# OCR 提取文字
analyze_image(image_path="C:\\path\\to\\image.jpg", mode="ocr")
# 自定义提取
analyze_image(
image_path="C:\\path\\to\\image.jpg",
mode="extract",
prompt="提取图片中的表格数据"
)