Skill flagged — suspicious patterns detected

ClawHub Security flagged this skill as suspicious. Review the scan results before using.

Data Governance

v1.10.1

数据治理与资产管理技能。用于数据质量评估、元数据管理、数据血缘追踪、数据标准制定、数据合规检查等任务。

1· 309·0 current·0 all-time

Install

OpenClaw Prompt Flow

Install with OpenClaw

Best for remote or guided setup. Copy the exact prompt, then paste it into OpenClaw for xingjianliu0417/data-governance.

Previewing Install & Setup.
Prompt PreviewInstall & Setup
Install the skill "Data Governance" (xingjianliu0417/data-governance) from ClawHub.
Skill page: https://clawhub.ai/xingjianliu0417/data-governance
Keep the work scoped to this skill only.
After install, inspect the skill metadata and help me finish setup.
Use only the metadata you can verify from ClawHub; do not invent missing requirements.
Ask before making any broader environment changes.

Command Line

CLI Commands

Use the direct CLI path if you want to install manually and keep every step visible.

OpenClaw CLI

Bare skill slug

openclaw skills install data-governance

ClawHub CLI

Package manager switcher

npx clawhub@latest install data-governance
Security Scan
VirusTotalVirusTotal
Benign
View report →
OpenClawOpenClaw
Suspicious
medium confidence
Purpose & Capability
技能名与描述(数据质量、元数据、血缘、合规)与包含的脚本一致:所有脚本都以访问数据库并读取表/schema 为核心功能,这与声称的用途相符。值得注意的差异是注册表元数据声明“无需环境变量/主要凭据”,但实际脚本明确依赖 DB_HOST/DB_USER/DB_PASS/DB_NAME/DB_PATH 或接受包含凭据的连接字符串。
Instruction Scope
SKILL.md 明确指导创建虚拟环境、通过环境变量提供数据库连接并运行本地脚本,且包含安全建议(最小权限、不要在命令行明文传密码、脱敏等)。总体上说明与脚本行为相符。需要注意:脚本同时接受 --db/connection 字符串,可能允许将明文凭据放在命令行或 URL 中;SKILL.md 建议使用 env vars,但并未强制化或限制传入方式。
Install Mechanism
这是 instruction-only + 内置 Python 脚本的包;无 install spec、无远程下载、仅列出常见 Python 依赖(sqlalchemy、pymysql、psycopg2、pandas)。没有发现从不受信任源提取代码或创建系统级二进制的行为。
!
Credentials
注册表元数据显示“无需环境变量/主要凭据”,但 SKILL.md 和所有脚本均从环境变量(DB_HOST, DB_PORT, DB_USER, DB_PASS, DB_NAME, DB_PATH)读取数据库凭据或会接受包含凭据的连接字符串。这是一处不一致:请求的凭据本身与技能用途相关(数据库访问是必要的),但未在元数据中声明会增加意外泄露敏感凭据的风险。
Persistence & Privilege
技能未请求 always:true,也不修改其他技能或系统范围配置;运行方式为本地执行脚本,权限范围受所提供数据库凭据限制。没有迹象表明技能会保持长期驻留或提升自身至平台级特权。
What to consider before installing
这是一个功能上合理的数据治理工具,但在安装/运行前请注意: - 元数据遗漏:注册表没有声明所需的环境变量/主凭据,但脚本确实会读取 DB_HOST、DB_USER、DB_PASS、DB_NAME、DB_PATH 或接受包含凭据的连接字符串。不要在不了解这一点时把生产凭据交给技能。 - 最小权限:为测试/评估使用只读、受限的数据库账户;绝不要用管理员/写权限生产凭据直连。 - 避免在命令行明文传密码:优先通过短时环境变量会话(export ... 在当前 shell)或使用本地受控 SQLite 副本进行分析,避免把凭据放在 shell 历史或脚本中。 - 代码审查:如果你信任要在敏感环境运行,先在隔离环境中审查并运行脚本(本地或容器),确认脚本不会向网络外发出请求或将数据发布到外部终端。脚本看起来只与数据库交互并在本地生成报告,但最好 grep/监控任何网络相关调用(requests、socket、urllib 外发等)。 - 期望修复:理想情况下,发布者应在 registry 元数据中明确列出所需环境变量/主要凭据(primaryEnv),并在 SKILL.md 中强制推荐只读连接与示例最小权限策略。若发布者无法说明来源或无法更新元数据,谨慎使用并优先在脱敏/非生产副本上运行。 如需更高置信度判断,请提供:发布者/源码仓库链接;是否有维护者签名或发布记录;或让发布者更新 registry 元数据以列出所需环境变量(这会把不一致问题解决)。

Like a lobster shell, security has layers — review code before you run it.

latestvk97b5pqyp1c7wtaczhmgs3apg183m2w6
309downloads
1stars
12versions
Updated 15h ago
v1.10.1
MIT-0

Data Governance Skill

数据治理(Data Governance)是指对数据资产管理行使权力和控制的活动集合。

⚠️ 安全警示

使用前请阅读以下安全建议:

  1. 仅使用环境变量 - 不写入配置文件
  2. 使用最小权限账户 - 生产环境使用只读用户
  3. 勿在命令行明文传密码 - 使用环境变量
  4. 敏感数据脱敏 - 分享报告前移除真实数据

首次配置

1. 安装依赖

# 创建虚拟环境(推荐)
python3 -m venv venv
source venv/bin/activate

# 安装依赖
pip install -r requirements.txt

2. 配置环境变量

当前会话有效:

# MySQL
export DB_HOST=localhost
export DB_PORT=3306
export DB_USER=your_user
export DB_PASS=your_password
export DB_NAME=your_database

# PostgreSQL
export DB_HOST=localhost
export DB_PORT=5432
export DB_USER=your_user
export DB_PASS=your_password
export DB_NAME=your_database

# SQLite(无需凭证)
export DB_PATH=/path/to/your/database.db

使用前导入:

# 每次使用前source环境变量文件(不推荐写入~/.bashrc)
source ~/db-env.sh
python scripts/data_quality_check.py --table users --db-type mysql

3. 运行脚本

# 数据质量检查(必须指定 --db-type)
export DB_HOST=localhost DB_USER=admin DB_PASS=xxx DB_NAME=mydb
python scripts/data_quality_check.py --table users --db-type mysql

# 元数据生成
python scripts/generate_metadata.py --source users --db-type postgresql

# 数据血缘分析(可选加数据库)
python scripts/lineage_analysis.py --table orders --db-type sqlite

# 合规检查
python scripts/compliance_check.py --table users --db-type mysql

依赖

依赖版本用途
sqlalchemy==2.0.25数据库抽象层
pymysql==1.1.0MySQL 连接
psycopg2-binary==2.9.9PostgreSQL 连接
pandas==2.1.4数据处理

详见 requirements.txt

何时使用

当用户提及以下内容时使用此 skill:

  • 数据质量、数据标准、数据血缘
  • 元数据管理、数据目录、数据资产
  • 数据合规、隐私保护、数据安全
  • 数据治理框架、数据资产管理

核心能力

1. 数据质量评估

评估数据的完整性、准确性、一致性、时效性:

检查维度:

  • 缺失值检测
  • 重复记录检测
  • 格式校验
  • 范围校验
  • 业务规则验证

2. 元数据管理

帮助构建和管理元数据:

技术元数据: 表结构、字段类型、数据来源 业务元数据: 字段定义、业务规则、所有者 运营元数据: 更新频率、ETL信息、访问统计

3. 数据血缘追踪

追踪数据的来龙去脉:

来源追溯: 数据从哪来 转换追踪: 经过哪些处理 下游影响: 谁在使用这些数据

4. 数据标准

制定和执行数据标准:

命名规范: 表名、字段名命名规则 类型规范: 数据类型、格式标准 编码规范: 枚举值、代码表

输出格式

完成数据治理任务后,输出结构化报告:

## 数据治理报告

### 数据质量
- 完整性:XX%
- 准确率:XX%
- 发现问题:N个

### 元数据
- 表数量:N
- 字段数量:N

### 建议
1. ...
2. ...

常见场景

场景输出
数据质量评估质量报告 + 问题清单
元数据梳理数据字典 + 关系图
血缘分析链路图 + 影响分析
合规检查合规报告 + 风险点

Comments

Loading comments...