Install
openclaw skills install web-to-obsidian抓取网页文章并保存到 Obsidian vault。当用户想要保存网页文章、博客、文档到 Obsidian 时使用,特别是提到"保存到 Obsidian"、"存到 Obsidian"、"抓取网页"、"网页转 Obsidian"、"导入文章"等场景。支持自动翻译非中文内容为中文,生成元数据(标签、摘要、标题),并以 Obsidian Markdown 格式存储。
openclaw skills install web-to-obsidian将网页文章抓取并保存到 Obsidian vault,支持自动翻译和内容元数据生成。
使用 scripts/fetch.py 获取网页的 Markdown 内容:
python3 scripts/fetch.py "<URL>" --json
返回格式:
{
"success": true,
"url": "https://r.jina.ai/http://example.com/article",
"content": "# Article Title\n\nClean markdown content here...",
"source": "jina",
"error": null
}
如果内容不是以中文为主,则进行高质量翻译:
1. 术语精准
2. 句式重构
3. 格式保持
4. 语境优化
基于内容分析生成以下元数据:
必需字段:
title: 文章标题(从内容中提取或使用网页标题)source: 原始 URLdate: 抓取日期(ISO 8601 格式)tags: 相关标签(3-7 个)summary: 文章摘要(100-200 字)可选字段:
author: 作者(如有)language: 内容语言(zh/en/ja 等)translated: 是否经过翻译(true/false)标签生成规则:
示例:
#tutorial, #programming, #python#ai, #machine-learning, #llm#news, #technology生成符合 Obsidian 格式的 Markdown 文件,包含:
Frontmatter(YAML 头部):
---
title: "文章标题"
date: "2024-01-15"
source: "https://example.com/article"
tags:
- tag1
- tag2
- tag3
author: "作者名"
summary: "文章摘要"
language: "en"
translated: true
---
内容主体:
正文内容...
将生成的内容生写入 当前目录下的temp.md中 ,注意:正文内容部分不要进行任何修改、抽象和演绎,直接写入即可。
,
使用 obsidian-cli 将文件导入到 Obsidian vault:
# 方法1:使用 create 命令直接创建
obsidian create name="文章标题" content="$(cat temp.md)"
# 方法2:如果支持从文件创建
# obsidian create --file "$TEMP_FILE" name="文章标题"
指定目标文件夹(可选):
--folder="articles/web"导入完成后删除临时文件:
rm -f temp.md
用户:"帮我抓取这篇文章 https://example.com/article 保存到 Obsidian"
执行步骤:
用户:"抓取 https://example.com/article 保存到 Obsidian 的 articles/tech 文件夹"
在创建时指定文件夹路径。
用户:"帮我抓取这几篇文章到 Obsidian:[url1], [url2], [url3]"
对每篇文章依次执行抓取流程。
翻译质量:确保翻译质量。如果翻译不理想,提示用户可以手动调整。
网络问题:如果抓取失败,scripts/fetch.py 会自动降级到备用服务。如果全部失败,提示用户检查 URL。
Obsidian 连接:obsidian-cli 需要 Obsidian 正在运行。如果连接失败,提示用户打开 Obsidian。
文件名处理:
隐私注意:抓取的网页内容可能包含隐私信息,提醒用户注意。
抓取失败:
Obsidian 导入失败:
翻译失败:
用户: 帮我保存这篇文章到 Obsidian: https://python.langchain.com/docs/get_started/introduction
步骤:
1. 抓取 → 获取英文 Markdown 内容
2. 检测 → 判断为英文内容(需要翻译)
3. 翻译 → 翻译为中文,保持格式
4. 元数据 →
- title: "LangChain 入门介绍"
- tags: ["python", "langchain", "llm", "tutorial"]
- summary: "LangChain 是一个用于构建 LLM 应用的框架..."
5. 创建文件 → 生成带 frontmatter 的 Markdown
6. 导入 → 使用 obsidian-cli 导入
7. 清理 → 删除临时文件
8. 反馈 → 告诉用户已保存成功,文件名是 "LangChain 入门介绍.md"