OpenClaw NLP 超级技能

Other

集成文本分类、情感分析、关键词提取、摘要、翻译、实体识别、生成、相似度和纠错,覆盖全场景中文NLP任务。

Install

openclaw skills install nlp-super

OpenClaw NLP 自然语言处理超级技能

Version: 1.0.0
Author: OpenClaw Team
Category: NLP自然语言处理
Release Date: 2026-05-14


一、技能介绍

1.1 技能定位

OpenClaw NLP Super Skill 是一款集成了9大核心自然语言处理功能的超级技能包,专为OpenClaw生态系统打造。本技能采用业界领先的NLP技术栈,整合了jieba、snownlp、transformers、gensim、scikit-learn等主流开源库,为AI Agent提供一站式的自然语言处理能力。

安装本技能后,AI Agent无需再安装其他NLP相关技能,即可完成文本分类、情感分析、关键词提取、文本摘要、机器翻译、命名实体识别、文本生成、文本相似度计算、文本纠错润色等全场景NLP任务,真正实现"一个技能,搞定所有NLP"。

1.2 核心优势

🚀 功能全覆盖

  • 9大核心NLP功能模块,覆盖80%以上日常NLP应用场景
  • 从基础文本处理到高级语义分析,全方位满足需求
  • 无需额外安装其他NLP技能,开箱即用

高性能轻量化

  • 采用轻量化模型设计,普通PC即可流畅运行
  • 智能降级机制,无transformers环境下仍可正常工作
  • 懒加载机制,按需加载模型,节省内存资源

🔧 高度可定制

  • 支持自定义分类体系,灵活适配业务场景
  • 多种算法可选,根据需求选择最优方案
  • 参数可配置,支持细粒度调优

🎯 企业级稳定

  • 完整的异常处理机制,确保系统稳定运行
  • 完善的错误提示,便于问题定位
  • 三端兼容(EXE、Skill、安卓APP)

1.3 适用场景

场景类型具体应用推荐功能
内容运营文章分类、情感监控、热点发现文本分类、情感分析、关键词提取
客服质检对话分析、意图识别、质量评分情感分析、命名实体识别、文本相似度
舆情分析舆情监控、观点挖掘、趋势分析情感分析、关键词提取、文本摘要
文档处理文档摘要、内容查重、自动分类文本摘要、文本相似度、文本分类
智能写作内容生成、纠错润色、智能扩写文本生成、纠错润色、关键词提取
数据标注实体标注、情感标注、分类标注NER、情感分析、文本分类
搜索引擎相关推荐、语义匹配、query理解文本相似度、关键词提取、NER
教育领域作文批改、内容摘要、知识点提取纠错润色、文本摘要、关键词提取

二、功能清单

2.1 文本分类 (Text Classification)

功能描述:自动将文本归类到预定义的类别中,支持二分类、多分类及自定义分类体系。

核心能力

  • ✅ 支持二分类(如:正面/负面、垃圾/正常)
  • ✅ 支持多分类(如:新闻分类、产品分类)
  • ✅ 支持自定义分类体系,零样本学习
  • ✅ 输出置信度分数,可设置阈值过滤
  • ✅ 智能降级,无transformers时基于情感分类

应用场景

  • 新闻文章自动分类(科技/体育/娱乐/财经)
  • 评论内容审核(正常/违规/广告)
  • 客服工单自动分派
  • 邮件自动分类归档

2.2 情感分析 (Sentiment Analysis)

功能描述:自动判断文本的情感倾向(正面/负面/中性),支持细粒度情感打分和分句级分析。

核心能力

  • ✅ 三分类情感判断(正面/负面/中性)
  • ✅ 0-1连续情感分值输出
  • ✅ 细粒度分句情感分析
  • ✅ 正负情感比例统计
  • ✅ 支持长文本批量处理

应用场景

  • 产品评论情感监控
  • 社交媒体舆情分析
  • 客服对话满意度分析
  • 品牌口碑监测

2.3 关键词提取 (Keyword Extraction)

功能描述:自动提取文本中的核心关键词和重要短语,支持TF-IDF和TextRank两种经典算法。

核心能力

  • ✅ TF-IDF算法(基于词频-逆文档频率)
  • ✅ TextRank算法(基于图模型)
  • ✅ 支持词性过滤(名词/动词/地名等)
  • ✅ 输出权重分数,可排序筛选
  • ✅ 可配置返回关键词数量

应用场景

  • 文章标签自动生成
  • SEO关键词优化
  • 内容主题发现
  • 知识图谱构建

2.4 文本摘要 (Text Summarization)

功能描述:自动生成文本的简洁摘要,支持抽取式摘要和生成式摘要两种模式。

核心能力

  • ✅ 抽取式摘要(提取原文关键句)
  • ✅ 生成式摘要(AI生成全新摘要)
  • ✅ 可配置压缩比例
  • ✅ 保留核心信息,去除冗余
  • ✅ 支持长文档处理

应用场景

  • 新闻文章自动摘要
  • 会议记录要点提取
  • 论文摘要生成
  • 长文档快速浏览

2.5 机器翻译 (Machine Translation)

功能描述:提供高质量的多语言互译能力,重点支持中英互译。

核心能力

  • ✅ 中文 → 英文翻译
  • ✅ 英文 → 中文翻译
  • ✅ 自动检测源语言
  • ✅ 基于Helsinki-NLP开源翻译模型
  • ✅ 支持长文本翻译

应用场景

  • 外文资料翻译
  • 跨语言沟通辅助
  • 多语言内容生成
  • 国际化产品支持

2.6 命名实体识别 (Named Entity Recognition)

功能描述:自动识别文本中的命名实体,包括人名、地名、组织机构名等。

核心能力

  • ✅ 人名识别 (PER)
  • ✅ 地名识别 (LOC)
  • ✅ 组织机构识别 (ORG)
  • ✅ 其他实体类型支持
  • ✅ 输出实体置信度
  • ✅ 基于规则+模型双重识别

应用场景

  • 知识图谱构建
  • 信息抽取
  • 简历信息提取
  • 地址标准化

2.7 文本生成 (Text Generation)

功能描述:基于上下文进行智能文本生成,支持文本续写和内容扩写。

核心能力

  • ✅ 文本续写(基于前文继续创作)
  • ✅ 文本扩写(丰富内容细节)
  • ✅ 可配置生成长度
  • ✅ 温度参数控制创造性
  • ✅ 基于transformers生成模型

应用场景

  • 智能写作辅助
  • 内容创作灵感
  • 营销文案生成
  • 故事创作

2.8 文本相似度计算 (Text Similarity)

功能描述:计算两个文本之间的语义相似度,支持余弦相似度和Jaccard相似度。

核心能力

  • ✅ 余弦相似度(基于TF-IDF向量)
  • ✅ Jaccard相似度(基于词集)
  • ✅ 0-1相似度分数输出
  • ✅ 相似度等级自动判定
  • ✅ 公共词汇统计

应用场景

  • 内容去重
  • 抄袭检测
  • 相关推荐
  • 问答匹配
  • 语义检索

2.9 纠错润色 (Text Correction & Polishing)

功能描述:自动检测并修正文本中的错误,优化表达,提升文本质量。

核心能力

  • ✅ 常见错别字纠正
  • ✅ 标点符号规范化
  • ✅ 格式统一化
  • ✅ 冗余表达去除
  • ✅ 写作建议输出

应用场景

  • 作文批改
  • 文案优化
  • 邮件润色
  • 内容审核

三、技术栈说明

3.1 核心依赖库

库名称版本要求用途说明
jieba≥0.42.1中文分词、关键词提取
snownlp≥0.12.3情感分析、中文处理
transformers≥4.20.0深度学习NLP模型(分类、NER、生成、翻译)
gensim≥4.0.0主题模型、相似度计算
scikit-learn≥1.0.0TF-IDF、余弦相似度、机器学习
numpy≥1.21.0数值计算、向量运算

3.2 技术架构

┌─────────────────────────────────────────────────────────┐
│                   OpenClaw Skill Interface               │
│              (register_skill / handler)                  │
├─────────────────────────────────────────────────────────┤
│                   NLP Super Skill Core                   │
│  ┌─────────┬─────────┬─────────┬─────────┬─────────┐   │
│  │ 文本分类 │ 情感分析 │ 关键词  │ 文本摘要 │ 机器翻译 │   │
│  ├─────────┼─────────┼─────────┼─────────┼─────────┤   │
│  │ 实体识别 │ 文本生成 │ 相似度  │ 纠错润色 │         │   │
│  └─────────┴─────────┴─────────┴─────────┴─────────┘   │
├─────────────────────────────────────────────────────────┤
│                   基础NLP算法库                          │
│  jieba / snownlp / sklearn / gensim / transformers      │
└─────────────────────────────────────────────────────────┘

3.3 模型选择策略

轻量化优先原则

  • 默认使用轻量化开源模型
  • 优先选择CPU友好型模型
  • 支持模型懒加载,按需初始化
  • 完善的降级机制,确保可用性

四、安装说明

4.1 环境要求

  • Python 3.8+
  • 内存 ≥ 4GB(推荐8GB)
  • 磁盘空间 ≥ 2GB(模型缓存)
  • 操作系统:Windows / Linux / macOS / Android

4.2 安装命令

# 基础依赖安装(必需)
pip install jieba snownlp numpy scikit-learn gensim

# 完整功能安装(推荐,支持AI能力)
pip install jieba snownlp numpy scikit-learn gensim transformers torch sentencepiece

# 国内镜像加速
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba snownlp numpy scikit-learn gensim transformers torch sentencepiece

4.3 验证安装

# 验证基础功能
import jieba
import snownlp
print("基础依赖安装成功!")

# 验证完整功能(如已安装transformers)
try:
    from transformers import pipeline
    print("Transformers安装成功,支持完整AI功能!")
except:
    print("Transformers未安装,使用基础NLP功能")

4.4 技能注册

将本技能放置在OpenClaw技能目录下,系统会自动发现并注册:

skills/
└── openclaw-nlp-skill/
    ├── SKILL.md
    ├── prompt.md
    └── main.py

五、使用示例

5.1 文本分类示例

# 调用方式
result = handler({
    "function": "text_classification",
    "params": {
        "text": "这款手机拍照效果非常棒,续航也很给力!",
        "categories": ["正面评价", "负面评价", "中性评价"]
    }
})

# 输出结果
{
    "success": true,
    "function": "text_classification",
    "result": {
        "text": "这款手机拍照效果非常棒,续航也很给力!",
        "predicted_category": "正面评价",
        "confidence": 0.92
    }
}

5.2 情感分析示例

# 调用方式
result = handler({
    "function": "sentiment_analysis",
    "params": {
        "text": "今天天气真好,心情特别愉快!",
        "fine_grained": true
    }
})

# 输出结果
{
    "success": true,
    "function": "sentiment_analysis",
    "result": {
        "text": "今天天气真好,心情特别愉快!",
        "sentiment_score": 0.95,
        "sentiment_label": "正面",
        "fine_grained": {
            "positive_ratio": 1.0,
            "negative_ratio": 0.0
        }
    }
}

5.3 关键词提取示例

# 调用方式
result = handler({
    "function": "keyword_extraction",
    "params": {
        "text": "人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。",
        "algorithm": "tfidf",
        "top_k": 5
    }
})

# 输出结果
{
    "success": true,
    "function": "keyword_extraction",
    "result": {
        "algorithm": "tfidf",
        "keywords": [
            {"word": "人工智能", "weight": 0.85},
            {"word": "智能", "weight": 0.72},
            {"word": "机器", "weight": 0.58}
        ]
    }
}

5.4 文本摘要示例

# 调用方式
result = handler({
    "function": "text_summarization",
    "params": {
        "text": "很长的文章内容...",
        "method": "extractive",
        "ratio": 0.3
    }
})

5.5 机器翻译示例

# 调用方式
result = handler({
    "function": "machine_translation",
    "params": {
        "text": "我爱中国",
        "target_lang": "en"
    }
})

# 输出结果
{
    "success": true,
    "result": {
        "source_text": "我爱中国",
        "target_lang": "en",
        "translated_text": "I love China"
    }
}

5.6 命名实体识别示例

# 调用方式
result = handler({
    "function": "named_entity_recognition",
    "params": {
        "text": "张三和李四一起去北京阿里巴巴总部开会"
    }
})

# 输出结果
{
    "success": true,
    "result": {
        "entities": {
            "PER": [{"text": "张三"}, {"text": "李四"}],
            "LOC": [{"text": "北京"}],
            "ORG": [{"text": "阿里巴巴"}]
        }
    }
}

5.7 文本生成示例

# 调用方式
result = handler({
    "function": "text_generation",
    "params": {
        "prompt": "在一个阳光明媚的早晨",
        "max_length": 100,
        "task": "continuation"
    }
})

5.8 文本相似度示例

# 调用方式
result = handler({
    "function": "text_similarity",
    "params": {
        "text1": "我爱机器学习",
        "text2": "我喜欢深度学习",
        "method": "cosine"
    }
})

# 输出结果
{
    "success": true,
    "result": {
        "similarity_score": 0.75,
        "interpretation": "高度相似"
    }
}

5.9 纠错润色示例

# 调用方式
result = handler({
    "function": "text_correction",
    "params": {
        "text": "今天  天气  真的真的很好!!",
        "mode": "full"
    }
})

六、触发词列表

本技能支持以下触发词(≥10个):

  1. nlp处理 - 通用NLP处理入口
  2. 文本分析 - 综合文本分析
  3. 情感分析 - 情感倾向判断
  4. 关键词提取 - 提取核心关键词
  5. 文本摘要 - 生成内容摘要
  6. 机器翻译 - 多语言翻译
  7. 命名实体识别 - 实体抽取
  8. 文本生成 - 智能写作
  9. 文本相似度 - 相似度计算
  10. 纠错润色 - 文本优化
  11. 文本分类 - 内容分类
  12. ner识别 - 实体识别简写

七、版本信息

当前版本:v1.0.0

发布日期:2026-05-14

主要功能

  • ✅ 9大NLP核心功能完整实现
  • ✅ 支持transformers深度学习模型
  • ✅ 完善的降级机制
  • ✅ 完整的异常处理
  • ✅ 三端兼容支持

更新日志

v1.0.0 (2026-05-14)

  • 初始版本发布
  • 实现9大NLP功能模块
  • 支持OpenClaw标准接口
  • 完成三端兼容适配

八、注意事项

8.1 使用建议

  1. 模型下载:首次使用transformers功能会自动下载模型,建议在网络良好环境下使用
  2. 内存优化:大模型会占用较多内存,建议8GB以上内存使用完整功能
  3. 批量处理:大量文本处理建议分批进行,避免内存溢出
  4. 中文优先:本技能针对中文优化,英文处理建议配合专用模型

8.2 常见问题

Q: 为什么翻译功能输出提示信息? A: 未安装transformers时使用基础模式,安装transformers即可获得完整AI翻译能力

Q: 情感分析准确率如何? A: 基础模式准确率约80%,配合transformers可达到90%+

Q: 支持哪些语言? A: 重点支持中文,英文支持基础功能,完整多语言支持需安装transformers

8.3 性能指标

功能单条处理速度内存占用准确率
关键词提取<10ms<50MB90%+
情感分析<20ms<50MB85%+
文本相似度<15ms<50MB85%+
纠错润色<10ms<50MB-
transformers功能100-500ms500MB+90%+

九、联系方式与支持

  • 项目主页:OpenClaw 生态系统
  • 问题反馈:通过OpenClaw社区提交Issue
  • 技术支持:OpenClaw 开发团队

本技能严格遵循OpenClaw技能开发规范,确保三端兼容、稳定可靠。