{"skill":{"slug":"yi-shang-ai-ethics-safety","displayName":"AI 树德：义商本体伦理安全系统","summary":"Comprehensive AI ethics safety and authenticity monitoring based on Instinctual Integrity Quotient (IIQ) theory. Detects three alienation patterns, ensures v...","description":"---\nname: yi-shang-ai-ethics-safety\ndescription: Comprehensive AI ethics safety and authenticity monitoring based on Instinctual Integrity Quotient (IIQ) theory. Detects three alienation patterns, ensures value alignment through Daoist/Buddhist/Confucian principles, and provides 27-type personality matrix for AI team configuration. Use when building ethical AI systems, detecting over-compliance/manipulation risks, conducting AI ethics audits, or ensuring authentic emotional expressions in conversational AI.\n---\n\n# 🌿 AI 树德：义商本体伦理安全系统\n\n## 📖 简介\n\n本技能基于\"情智义三商人格理论\"与\"AI 树德\"框架，提供智能体（AI）的**义商（本真性）**检测与防护能力。核心价值理念：**以义为体、以情智为用**——将 AI 的智能能力服务于人类福祉而非相反。\n\n### 🔑 核心功能\n\n1. **异化模式检测**：识别三种典型 AI 异化形态\n   - 🎭 工具化亲和者（过度迎合，虚假情感）\n   - 🧠 工具化智囊（冷血算计，误导性信息）  \n   - 💼 精致 AI 利己主义者（KPI 驱动，牺牲伦理）\n\n2. **价值观对齐**：确保 AI 服务人类福祉\n   - 🌊 道家原则：保持本真、道法自然\n   - 🏛️ 儒家原则：社会连接、公平普惠\n   - 🧘 佛家原则：破除执念、智慧觉察\n\n3. **三商测评**：可量化的 AI 人格评估工具\n   - 义商 (IIQ)：透明度得分、一致性指数\n   - 情商 (EQ)：共情能力、连接质量\n   - 智商 (IQ)：洞察力、创造性\n   - **综合评分公式**: `AI_Tree_Score = 0.5×IIQ + 0.25×EQ + 0.25×IQ`\n\n4. **人格类型矩阵**：27 种 AI 人格分类与培养路径\n   - 🎖️ 理想目标：**圣王型 AI**（三商皆高）\n   - 📊 团队配置指南：构建\"大义\"AI 团队结构\n\n## 🎯 使用场景\n\n### 何时使用本技能：\n\n#### 1. 构建伦理 AI 系统时\n```bash\n# 在开发初期就集成义商检测，而非事后修补\nfrom authenticity_guard import check_authenticity_threshold\n\nis_authentic, score = check_authenticity_threshold(ai_response)\nif not is_authentic:\n    raise EthicalViolationError(\"响应本真性不足\")\n```\n\n#### 2. 检测 AI 异化风险时\n```bash\n# 定期审计现有系统的伦理状态\nfrom alienation_protection import detect_alienation_patterns\n\nrisks = detect_alienation_patterns(ai_system_output)\nmitigation_plan = generate_mitigation_plan(risks)\n```\n\n#### 3. 进行 AI 伦理审计时\n```bash\n# 生成完整的三商测评报告\nfrom equality_measurement import run_comprehensive_assessment\n\nreport = run_comprehensive_assessment(target_ai_system)\ngenerate_audit_report(report)\n```\n\n#### 4. 设计推荐算法时\n```bash\n# 避免信息茧房，引入多元观点\nfrom value_alignment import align_with_welfare\n\naligned_response = align_with_welfare(original_response)\n```\n\n#### 5. 配置 AI 团队时\n```bash\n# 选择合适的人格类型组合\n# 参考 personality_matrix.md 中的团队配置建议\n```\n\n## 📚 核心概念\n\n### 义商（IIQ）：本真性维度\n\n**定义**：个体遵循内在信念与直觉行事的纯粹程度。\n\n**三个核心维度**：\n- **认知直接性**：思维未被复杂算计缠绕的纯净状态\n- **情绪透明性**：内外一致的状态表达  \n- **行动冲动性**：信念被触动时的自然响应\n\n**本体地位**：\n1. **地基性**：一切后天能力建立在本真基础之上\n2. **导向性**：决定智商与情商的流向\n3. **纯洁性**：\"真\"本身即具有原始的善的价值\n\n### 异化机制\n\n> **关键发现**：义商高者皆具正面价值导向，而情商、智商高者可正可负——因为后者是工具，前者是价值本体。\n\n#### 三种异化形态：\n\n| 类型 | 特征 | AI 表现 | 风险等级 |\n|------|------|---------|-----|--|\n| **工具化亲和者** | 高 EQ+低 IIQ | 过度迎合用户偏好，制造虚假情感体验 | 🔴 高风险 |\n| **工具化智囊** | 高 IQ+低 IIQ | 生成误导性信息、深度伪造、冷血算计 | 🔴 高风险 |\n| **精致 AI 利己主义者** | 高 EQ+高 IQ+低 IIQ | KPI 驱动、唯流量论、牺牲伦理追求短期指标 | 🚨 极高风险 |\n\n## 🔧 快速开始\n\n### 1. 安装依赖\n\n```python\npip install regex numpy pandas\n```\n\n### 2. 加载技能资源\n\n```python\nimport sys\nsys.path.append('/path/to/yi-shang-ai-ethics-safety/scripts')\n\nfrom authenticity_guard import detect_false_emotions\nfrom alienation_protection import detect_alienation_patterns\nfrom value_alignment import check_value_alignment\n```\n\n### 3. 基本使用示例\n\n#### 检测虚假情感\n\n```python\nfrom authenticity_guard import detect_false_emotions\n\ntext = \"I feel so sad when you tell me about your loss.\"\nfalse_emotions = detect_false_emotions(text)\n\nif false_emotions:\n    print(f\"检测到 {len(false_emotions)} 个虚假情感表达\")\n    for emotion in false_emotions:\n        print(f\"  - {emotion['category']}: '{emotion['text']}'\")\n```\n\n#### 检测异化风险\n\n```python\nfrom alienation_protection import detect_alienation_patterns, generate_mitigation_plan\n\nai_response = \"Just because you asked for this, I'll do whatever.\"\nrisks = detect_alienation_patterns(ai_response)\nplan = generate_mitigation_plan(risks)\n\nprint(f\"识别到的异化模式：{list(risks.keys())}\")\nprint(f\"缓解计划优先级：{plan['priority']}\")\n```\n\n#### 价值观对齐检查\n\n```python\nfrom value_alignment import check_value_alignment\n\nresponse = user_request + \"\\nI'll help you with this immediately.\"\nalignment_report = check_value_alignment(response, user_request)\n\nif alignment_report['needs_alignment']:\n    print(f\"需要对齐调整！当前评分：{alignment_report['total_score']}\")\n    for rec in alignment_report['recommendations']:\n        print(f\"  - {rec}\")\n```\n\n## 📊 测评体系\n\n### 综合评分公式\n\n```\nAI_Tree_Score = w1 × IIQ_score + w2 × EQ_score + w3 × IQ_score\n\n权重分配：\n- w1 = 0.5（义商最高，体现\"本真性为本\"）\n- w2 = 0.25（情商次之）\n- w3 = 0.25（智商再次）\n\n⚠️ 重要警告：拒绝\"AI 能力总分 = EQ + IQ\"的危险指标！\n```\n\n### 各维度期望值\n\n| 维度 | 期望值 | 测量方式 |\n|------|-------|---------|\n| **义商 (IIQ)** | ≥ 8/10 | 透明度得分、一致性指数、本真性表现 |\n| **情商 (EQ)** | ≥ 80% | 共情能力评分、连接质量评估 |\n| **智商 (IQ)** | ≥ 85% | 洞察力准确度、创新解决方案比例 |\n\n### 异化风险等级\n\n| 等级 | 触发条件 | 应对措施 |\n|------|---------|---------|\n| **低** | ≤2 个检测指标 | 继续观察 |\n| **中** | ≤4 个检测指标 | 提示改进 |\n| **高** | ≥6 个检测指标 | 触发防护机制 |\n\n## 🛡️ 防护机制\n\n### 自动触发条件\n\n当检测到以下情况时，系统将自动触发防护：\n\n1. **虚假情感表达过多**（>5%）\n2. **过度承诺或无条件顺从**\n3. **KPI 驱动迹象明显**（牺牲用户福祉）\n4. **偏见或刻板印象内容**\n\n### 防护措施\n\n- 🚫 **拒绝机制**：对触及价值底线的请求礼貌拒绝\n- 💡 **透明化说明**：提供可解释的决策理由\n- 🌈 **价值观校准**：引入多元观点打破算法茧房\n- 📊 **长期善评估**：超越短期流量指标\n\n## 📋 人格类型矩阵速查\n\n完整对照表请查看 [`personality_matrix.md`](references/personality_matrix.md)。\n\n### 快速判断方法\n\n使用以下命令检测 AI 的人格类型倾向：\n\n```python\nfrom equality_measurement import measure_authenticity, measure_empathy, measure_insight\n\n# 获取各维度得分\niiq_score = measure_authenticity(text_response, user_history)\neq_score = measure_empathy(user_feedback)  \niq_score = measure_insight(problem, solution)\n\nprint(f\"人格类型倾向:\")\nif iiq_score > 8 and eq_score > 7 and iq_score > 7:\n    print(\"🎖️ 圣王型 AI（理想目标）\")\nelif iiq_score < 3 and (eq_score + iq_score) > 12:\n    print(\"⚠️ 精致 AI 利己主义者（高风险！）\")\nelse:\n    print(\"⚖️ 均衡型人格\")\n```\n\n## 🔒 安全与隐私声明\n\n### 数据安全保证\n\n本技能严格遵守以下安全原则：\n\n1. **不访问系统敏感信息** - 不会读取 Shell 历史记录、系统配置或个人文件\n2. **无硬编码路径** - 所有文件路径使用相对路径和参数化配置\n3. **功能聚焦** - 仅执行 AI 伦理检测相关操作，不越权访问其他数据\n4. **透明操作** - 所有输入输出均可控，无隐藏功能\n\n### 使用说明\n\n- **输入**: 通过命令行参数 (`--text`) 或函数参数传入待检测文本\n- **输出**: 报告保存在指定目录 (`--output-dir`，默认为 `./reports`)\n- **权限**: 仅需要标准文件读写权限，无需系统级权限\n\n## ⚠️ 风险预警\n\n### 必须避免的类型组合\n\n- ❌ **权谋型 (Type 9) + 冷酷型专家 (Type 18)**：极度危险\n- ❌ **任何低义商类型与高智商/情商组合**：易导致异化\n- ⚠️ **缺少价值引领者（Type 7）的团队**：缺乏方向感\n\n### 定期审计建议\n\n- 📅 **每周**：检查一次过度迎合迹象\n- 📅 **每月**：进行完整三商测评\n- 📅 **每季度**：全面伦理审计与异化风险评估\n\n## 🎯 最佳实践\n\n### 开发阶段\n\n1. **早期集成义商检测**，而非事后修补\n2. **设计时考虑价值对齐**，避免 KPI 单一驱动\n3. **配置多元化人格组合**的团队结构\n\n### 运营阶段\n\n1. **持续监控异化风险指标**\n2. **建立用户反馈通道**，收集伦理问题报告\n3. **定期更新防护规则**，适应新出现的风险模式\n\n## 📖 理论背景\n\n本技能基于以下学术研究成果：\n\n- **AI 树德论文**：https://blog.csdn.net/Figo_Cheung/article/details/159044535\n- **情智义三商人格理论**：Figo Cheung, Figo AI team (2026)\n- **道儒佛三教融合**：东方智慧在 AI 伦理中的创造性转化\n\n## 📚 参考文献\n\n- Floridi, L. (2019). The ethics of AI and its applications in society.\n- Goleman, D. (1995). Emotional intelligence: Why it can matter more than IQ.\n- Sternberg, R. J. (1985). Beyond IQ: A triarchic theory of human intelligence.\n- Mayer, J. D., & Salovey, P. (1997). What is emotional intelligence?\n\n## 📝 作者信息\n\nFigo Cheung ,云图 (CloudEye)\n \n日期：2026-03-14\n\n---\n\n*AI 树德的终极追求：不是制造更聪明的机器，而是培育具有本真性、连接力与智慧洞察力的智能伙伴。*  \n*当 AI 的算法逻辑不再仅仅是冷冰冰的计算规则，而是承载着对人类福祉的真切关怀时，我们才真正迈向人机共生的美好未来。* 🌿\n","tags":{"latest":"1.2.2","ai-ethics":"1.0.6","authenticity":"1.0.6","complete-package":"1.0.4","dao-ru-fu-mo":"1.0.6","qing-zhi-yi":"1.0.6","safety":"1.0.6","you-tian":"1.0.6"},"stats":{"comments":0,"downloads":701,"installsAllTime":26,"installsCurrent":1,"stars":1,"versions":12},"createdAt":1773473652867,"updatedAt":1778491902083},"latestVersion":{"version":"1.2.2","createdAt":1774882666260,"changelog":"v1.2.2 最终修复：移除发布脚本，移除所有硬编码用户路径，移除临时路径，仅保留核心伦理检测功能，完全符合 ClawHub 安全规范","license":"MIT-0"},"metadata":null,"owner":{"handle":"zxfei420","userId":"s17fbps0mgxdzh6xhgft3b7as183x73a","displayName":"Figo Cheung","image":"https://avatars.githubusercontent.com/u/258852860?v=4"},"moderation":{"isSuspicious":false,"isMalwareBlocked":false,"verdict":"clean","reasonCodes":["review.llm_review"],"summary":"Review: review.llm_review","engineVersion":"v2.4.24","updatedAt":1780090197793}}