Install
openclaw skills install data-analysis-sql大数据开发工程师级数据分析与SQL技能。(1)多数据引擎SQL编写(Hive/SparkSQL/Presto/ClickHouse/Doris/MySQL/PG/BigQuery)。(2)复杂SQL改造调试与性能优化。(3)数仓建模(ODS/DWD/DWS/ADS)维度设计/SCD变更。(4)数据探查/指标设计/ETL管线编排。(5)数据质量检测与异常分析。(6)SQL改写(方言迁移/语法适配)。(7)UDF/UDTF开发规范。(8)表结构文档自动生成与迁移支持。(9)知识库目录生成与维护(schema/metrics/relations/enums)。触发:写SQL/改SQL/数仓建模/ETL/SQL优化/数据质量/指标设计/整理文档/生成md/迁移文档/知识库
openclaw skills install data-analysis-sql大数据开发工程师技能,专注于数据分析、SQL 开发、数仓建模和知识库维护。
references/multi-engine.md 选择目标引擎,参考 references/schema-guide.md 理解表结构references/sql-guide.md 规范编写,优先用 CTEreferences/join-rules.md 逐项过检查清单(tenantkey / del_flag / 防零 / 类型兼容)参考 references/schema-guide.md:
参考 references/pipeline-patterns.md:
参考 references/data-quality.md:
参考 references/business-metrics.md:
参考 references/sql-pitfalls.md:
参考 references/knowledge-base.md:
参考 references/doc-guide.md:
| 脚本 | 用途 |
|---|---|
scripts/sql_formatter.py | SQL 格式化,统一风格 |
scripts/sql_diff.py | 两段 SQL 逻辑对比,输出差异摘要 |
scripts/doc_generator.py | 表结构文档自动生成,支持交互式/API调用 |
| 引擎 | 适用场景 | 参考 |
|---|---|---|
| Hive / SparkSQL | 离线大宽表、数仓批处理 | references/multi-engine.md |
| Presto / Trino | 跨源联邦查询、Ad-hoc 分析 | references/multi-engine.md |
| ClickHouse | 高并发实时 OLAP,近实时写入 | references/multi-engine.md |
| Doris / StarRocks | 高并发多表 JOIN 的 OLAP | references/multi-engine.md |
| MySQL / PostgreSQL | OLTP 业务库、中等规模分析 | references/sql-guide.md |
| BigQuery | 云原生大表、Serverless SQL | references/multi-engine.md |
| 文件 | 内容 |
|---|---|
references/sql-guide.md | SQL 编写规范(CTE/命名/注释/格式) |
references/join-rules.md | 关联规则(tenantkey/del_flag/自定义字段/防零/ROW_NUMBER) |
references/sql-pitfalls.md | 8类踩坑记录 + 防踩坑检查清单 |
references/business-metrics.md | 业务指标设计模板与完整 SQL |
references/schema-guide.md | 数仓建模规范(ODS/DWD/DWS/ADS) |
references/multi-engine.md | 多引擎方言差异与适配 |
references/pipeline-patterns.md | ETL 管线编排模式 |
references/data-quality.md | 数据质量检测规范 |
references/data-analysis-patterns.md | 数据分析常用模式 |
references/knowledge-base.md | 知识库目录生成与维护规范 |
references/doc-guide.md | 文档自动生成与迁移指南 |