Install
openclaw skills install web-search-rules搜尋網頁時的規則管理技能。支持多種知識庫平台(IMA、騰訊文檔、Obsidian、NotebookLM),自動管理搜尋網址庫(白名單、黑名單、未分類),暫存搜尋內容,並在用戶確認後整理歸檔。⚠️ 使用前請閱讀 SECURITY.md。
openclaw skills install web-search-rules⚠️ 安全提醒:本技能支援多平台整合,某些功能需要檔案系統存取和瀏覽器自動化權限。在使用前,請先閱讀
SECURITY.md了解安全注意事項。
搜尋網頁時的規則管理技能,實現智能的網址過濾和內容管理流程。支援多種知識庫平台,讓用戶自由選擇。
IMA 知識庫 (ima)
ima-skill 進行操作騰訊文檔 (tencent-docs)
tencent-docs skill 進行操作Obsidian (obsidian)
NotebookLM (notebooklm)
playwright-cli 或 agent-browser)進行操作playwright-cli 或 agent-browser)其他平台 (custom)
在用戶首次使用時,詢問並記錄用戶的知識庫平台偏好:
詢問用戶:
「請問您想要使用哪個平台來管理搜尋規則和內容?」
選項:
1. IMA 知識庫(推薦)- 支持 AI 搜索和知識圖譜
2. 騰訊文檔 - 支持協作編輯和在線預覽
3. Obsidian - 本地化 Markdown 知識管理,支持雙向鏈接
4. NotebookLM - Google AI 輔助研究工具
5. 其他平台 - 請指定平台名稱和操作方式
用戶選擇後,將選擇記錄到配置文件:
`~/.workbuddy/skills/web-search-rules/config.json`
根據用戶選擇的平台,檢查並創建兩個知識庫:
搜尋網址庫 (search-url-library)
白名單/
├── 網址1
├── 網址2
└── ...
黑名單/
├── 網址1
├── 網址2
└── ...
未分類/
├── 網址1
├── 網址2
└── ...
未整理搜尋內容 (unorganized-search-content)
2026-05-05/
├── 網頁標題1.md
├── 網頁標題2.md
└── ...
平台特定操作:
ima-skill 檢查並創建tencent-docs skill 檢查並創建search-url-library/ 和 unorganized-search-content/ 文件夾playwright-cli 或 agent-browser)
從用戶請求中提取:
根據用戶選擇的平台,從「搜尋網址庫」中讀取:
如果無法讀取或文件不存在,提示用戶並協助創建。
使用適當的搜尋工具(如 wechat-article-search、web_search、web_fetch 等)執行搜尋。
對每個搜尋結果進行分類:
對於每個搜尋結果:
1. 提取網址
2. 如果網址在白名單中:
→ 標記為「自動通過」
3. 如果網址在黑名單中:
→ 標記為「自動過濾」,跳過
4. 如果網址在未分類中或不在任何列表中:
→ 標記為「待確認」
將所有「待確認」和「自動通過」的網頁內容暫存到「未整理搜尋內容」:
平台特定操作:
ima-skill 上傳文件tencent-docs skill 創建文檔{vault_path}/unorganized-search-content/{date}/{title}.mdplaywright-cli 或 agent-browser 打開 NotebookLM文件格式:
# 網頁標題
- 網址:<url>
- 發布時間:<date>
- 來源:<source>
- 狀態:待確認 / 自動通過
- 搜尋關鍵詞:<keywords>
## 內容摘要
<content_summary>
## 完整內容
<full_content>
列出所有「待確認」的網頁,向用戶展示:
找到 <N> 個新網址需要確認:
1. [網頁標題1](網址1)
- 來源:<source>
- 摘要:<brief_summary>
2. [網頁標題2](網址2)
- 來源:<source>
- 摘要:<brief_summary>
...
請問:
- 哪些網址應該加入白名單?(可以直接保存內容)
- 哪些網址應該加入黑名單?(以後搜尋時自動過濾)
- 哪些網址的內容需要保存?(保存到目標知識庫)
根據用戶的反饋,更新「搜尋網址庫」:
平台特定操作:
ima-skill 更新文件tencent-docs skill 更新文檔{vault_path}/search-url-library/{category}/{url}.mdplaywright-cli 或 agent-browser 打開 NotebookLM格式:
# 白名單
## 添加時間 | 網址 | 添加原因
2026-05-05 19:30 | https://example.com/article1 | 用戶確認,內容優質
⚠️ 安全提醒:
將用戶確認需要保存的網頁內容:
平台特定操作:
ima-skill 操作tencent-docs skill 操作unorganized-search-content/ 讀取 Markdown 文件playwright-cli 或 agent-browser 打開 NotebookLM向用戶提供搜尋結果摘要:
搜尋完成報告
====================
搜尋關鍵詞:<keywords>
搜尋時間:<timestamp>
使用平台:<platform>
結果統計:
- 總共找到:<total> 個結果
- 白名單自動通過:<whitelist_count> 個
- 黑名單自動過濾:<blacklist_count> 個
- 用戶確認保存:<saved_count> 個
- 用戶放棄:<discarded_count> 個
網址庫更新:
- 新增白名單:<new_whitelist_count> 個
- 新增黑名單:<new_blacklist_count> 個
已保存內容位置:
- 知識庫平台:<platform>
- 知識庫:<target_knowledge_base>
- 文件數量:<folder_path>
在用戶首次選擇平台後,創建配置文件以記錄用戶偏好:
{
"platform": "ima",
"search_url_library": "搜尋網址庫",
"unorganized_content": "未整理搜尋內容",
"auto_create": true,
"last_used": "2026-05-05 22:30:00"
}
字段說明:
platform:知識庫平台(ima / tencent-docs / custom)search_url_library:搜尋網址庫的名稱或 IDunorganized_content:未整理搜尋內容的名稱或 IDauto_create:是否自動創建必要的知識庫last_used:最後使用時間根據用戶的歷史決策,自動建議規則:
根據您的歷史決策,系統建議以下規則:
1. 網域規則:所有來自 <domain> 的網頁都應該加入白名單
2. 關鍵詞規則:標題包含 <keyword> 的網頁通常是有價值的
3. 作者規則:<author> 發布的文章質量較高
是否要應用這些規則?
支持批量確認和批量操作:
找到 10 個來自同一網域的網頁,是否要:
1. 全部加入白名單
2. 全部加入黑名單
3. 逐個確認
如果用戶想要切換知識庫平台:
詢問用戶:
「請問您想要切換到哪個知識庫平台?」
選項:
1. IMA 知識庫
2. 騰訊文檔
3. Obsidian
4. NotebookLM
5. 其他平台
切換後,需要:
1. 重新配置知識庫
2. 遷移現有的網址庫和暫存內容(可選)
3. 更新配置文件
本 skill 包含以下參考文件,根據需要載入:
references/ima-operations.md - IMA 知識庫操作詳解,包含文件結構、格式規範和操作示例references/tencent-docs-operations.md - 騰訊文檔操作詳解,包含文檔創建、編輯和管理的操作方法references/obsidian-operations.md - Obsidian 操作詳解,包含 Vault 文件系統操作和 Local REST API 操作方法references/notebooklm-operations.md - NotebookLM 操作詳解,包含瀏覽器自動化和 Google Drive API 集成方法references/examples.md - 完整的使用場景示例,包含基本搜尋、規則建議、批量操作和定期維護等情境references/platform-comparison.md - 各平台功能對比表,幫助用戶選擇適合的平台當遇到複雜的平台操作時,請先讀取相應的參考文件以獲取詳細的操作指導。當需要向用戶說明工作流程時,可以參考 references/examples.md 中的示例。