Install
openclaw skills install cnki-download从中国知网(CNKI,中南大学图书馆代理入口)检索并批量下载学术文献 PDF。一句话触发:"知网下载"、"cnki 下载"、"帮我下几篇知网文献"。负责:用自然语言收集参数(关键词/篇数/筛选/排序)→ 启动 Playwright+Edge pipeline →第一次会手动登录,登录态保留在 `browser_data/`,cookie 几个小时内有效,复用不需要再登录。覆盖检索 + 筛选(来源类别/年度等)+ 排序(相关度/时间/被引/下载/综合)+ 详情页访问 + PDF 下载全流程。
openclaw skills install cnki-download用户说「知网下载」「cnki 下载」「帮我下几篇知网文献」「从知网搜点论文」时直接用本 skill。
不要让用户自己去 npm install、装 Node、装 Edge —— 全部由 agent 跑前自检、自行装好。
启动脚本前依次跑下面 4 项检查,全部 ✅ 才进入工作流第 1 步:
node --version 能输出 v18+。如果不通过,提示用户装 Node 后由 agent 重试。C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe 或 C:\Program Files\Microsoft\Edge\Application\msedge.exe 是否存在。缺失则提示用户装 Microsoft Edge(https://www.microsoft.com/edge)。scripts/ 目录下跑 node -e "import('playwright').then(m=>process.exit(0)).catch(e=>process.exit(1))",exit 0 即通过。Node 会沿父目录向上找 node_modules/,所以 workspace 根目录已装的 playwright 也能复用。npm install。重要:执行时设环境变量 PLAYWRIGHT_SKIP_BROWSER_DOWNLOAD=1(这个 skill 用的是系统 Edge,不需要再下载 playwright 自带的 chromium,能省几百 MB)。
cd C:\Users\lfp\.openclaw\workspace\skills\cnki-download\scripts
$env:PLAYWRIGHT_SKIP_BROWSER_DOWNLOAD = "1"
npm install
自检全通过后告诉用户「环境 OK,开始干」,再进入第 1 步反问参数。
如果用户第一次说"知网下载"时已经在聊天里走了一段时间了,先做这 4 步自检再问参数 —— 自检可能也要十几秒,提前跑能省一次往返。
不要一上来就问一堆参数。用一段话先建议 demo 试跑,小白用户可以先看到完整流程怎么走的(demo 关键词是「区块链」,下载 5 篇,筛选北大核心/CSSCI + 2024-2025 年)。
示范话术:
「好的,知网下载。在开始之前,要不要先用 demo 跑一下测试?
demo 用的是内置默认配置:关键词『区块链』、北大核心 + CSSCI、2024-2025 年、下载 5 篇。
请选择 : 1、跑demo 2、自定义检索下载
- 重要提示:
- 第一次会手动登录,后续几个小时内不需要再登录
- 我会开启一个新的终端窗口,后续的指令和提示会在新窗口进行输出(主要涉及用户登录);
- 登录以后请 **自行链接** 到知网搜索页面,搜索将自动进行
- 用最醒目的字体颜色提醒用户: download文件保存的绝对路径
」
Start-Process powershell -ArgumentList "-NoExit", "-Command", "node scripts/search_cnki.js"。按下面 4 项问清楚:
「好,自定义检索。请告诉我:
- 检索关键词?(必填)
- 下载几篇?(必填,默认 5)
- 要不要筛选?
- 要不要排序? 明确提示可以指定的筛选与排序字段见
references/config-schema.md不筛不排的话只回关键词和篇数也行,剩下的我用默认。」
。
把用户的回答翻译成 config,写到一个临时文件,比如 scripts/_user-config-{YYYYMMDD-HHmm}.json:
{
"keyword": "<用户说的关键词>",
"download_count": <用户说的篇数>,
"sort": { "field": "<相关度|发表时间|被引|下载|综合>", "order": "<DESC|ASC>" }, // 可选
"filters": [ { "col": "...", "values": ["..."] } ] // 可选
}
只有 keyword 和 download_count 是必填。
// 在当前技能目录下启动
`Start-Process powershell -ArgumentList "-NoExit", "-Command", "node scripts/search_cnki.js <config 路径>"`
通过exec执行node脚本后,会打开一个新的进程和新窗口,把控制权完全交给它,不要一直查看进程状态,直接结束。
browser 工具去探 CNKI(已经有 Playwright 跑着了),避免多开冲突scripts/ 下的脚本;如发现 bug 写进 references/troubleshooting.md 等用户决定npm install(agent 全包,见第 0 步)browser_data/ / download/ / _login_state.png 提交进 git(参考 references/troubleshooting.md 的 .gitignore 写法)references/config-schema.md —— config 字段详情、枚举值、3 种调用方式assets/default-config.json —— 默认 demo(node scripts/search_cnki.js 不带参数就用这个的 hard-coded 等价物)