Install
openclaw skills install @mendynew/moonshot使用 () 大模型进行图像分析、OCR提取、文案创作和多模态对话的智能工具
openclaw skills install @mendynew/moonshot该 Skill 集成了 的 大模型,提供强大的多模态 AI 能力,包括图像理解、OCR 文字提取、智能文案创作等功能。
当用户提到以下内容时,应触发此 Skill:
所有 API 请求需要在 Authorization header 中包含 API Key:
Authorization: Bearer YOUR_API_KEY
分析图片内容,识别物体、场景、情感等。
功能特点:
从图片中提取文字、表格、文档内容。
功能特点:
根据图片或需求生成各类文案。
功能特点:
支持图像和文本的交互式对话。
功能特点:
from
client = (api_key="your_api_key")
# 分析产品图片
result = client.analyze_image(
image_path="product.jpg",
prompt="详细分析这张产品图片,包括产品特点、适用场景、目标用户群体等"
)
print(result)
# 提取文档文字
result = client.extract_text(
image_path="document.png",
output_format="structured" # 可选: "text", "structured", "json"
)
print(result)
# 根据产品图片生成文案
copywriting = client.generate_copywriting(
image_path="product.jpg",
style="inspiring", # 可选: "professional", "casual", "creative", "inspiring"
platform="wechat" # 可选: "wechat", "weibo", "xiaohongshu", "douyin"
)
print(copywriting)
# 开始多模态对话
conversation = client.create_conversation()
# 第一轮:发送图片
response1 = conversation.chat(
message="请分析这张图片",
image="screenshot.jpg"
)
# 第二轮:追问
response2 = conversation.chat(
message="基于上面的分析,给出优化建议"
)
image_path (string): 图片文件路径prompt (string): 分析提示词model (string, 可选): 使用的模型,默认 ""temperature (float, 可选): 创造性程度,0-1,默认 0.7max_tokens (int, 可选): 最大输出长度,默认 1024image_path (string): 图片文件路径output_format (string, 可选): 输出格式,"text"/"structured"/"json"language (string, 可选): 语言设置,"auto"/"zh"/"en"image_path (string): 图片文件路径(可选)prompt (string): 创作要求style (string): 文案风格platform (string): 目标平台length (string): 文案长度,"short"/"medium"/"long"图像分析提示词:
"请详细分析这张图片,包括:
1. 主要内容和主题
2. 视觉元素和构图
3. 色彩搭配和风格
4. 情感氛围和传达的信息
5. 适用场景和目标受众"
OCR 提示词:
"请提取图片中的所有文字内容,并保持原有的结构和格式。
如果是表格,请用 Markdown 表格格式输出。"
文案创作提示词:
"根据这张产品图片,创作一段吸引人的营销文案。
要求:简洁有力,突出产品卖点,适合在微信朋友圈发布。
目标用户:25-35岁的都市白领。"
具体价格请参考官网:https://platform./pricing
Q: 支持哪些图片格式? A: 支持 PNG、JPG、JPEG、WEBP 等常见格式。建议使用 PNG 或 JPG 格式以获得最佳效果。
Q: 图片大小限制? A: 单张图片建议不超过 10MB。对于高清图片,建议先进行压缩。
Q: OCR 识别准确率如何? A: 在中文识别方面表现优秀,准确率可达 95% 以上。手写文字识别需要图片清晰度较高。
Q: 可以同时处理多张图片吗? A: 支持多图输入,最多可同时处理 10 张图片。
Q: 文案创作支持哪些风格? A: 支持多种风格:专业、轻松、创意、激励等,也可以自定义风格。
Q: 如何处理敏感内容? A: 系统会自动过滤敏感内容,请确保输入内容符合法律法规和平台规范。
⚠️ 安全提醒:
📋 使用限制:
🔒 隐私保护:
┌─────────────────┐
│ 用户界面 │
│ (CLI/SDK/API) │
└────────┬────────┘
│
┌────────▼────────┐
│ │
│ 核心处理层 │
└────────┬────────┘
│
┌────────▼────────┐
│ │
│ 多模态模型 │
└─────────────────┘
欢迎提交问题和改进建议!
MIT License