Llm Hallucination Detector

Other

检测大型语言模型输出中的幻觉内容。通过事实验证、一致性检查、来源追溯和置信度评估, 帮助用户识别 AI 生成的虚构信息、错误引用和不实陈述,提升 LLM 输出的可信度。

Install

openclaw skills install llm-hallucination-detector-ai

LLM Hallucination Detector

概述

面向 LLM 输出的幻觉检测系统。对 AI 生成的文本进行多维度审查,标记可能虚构、错误或不可验证的内容。

核心能力

1. 事实验证

  • 交叉引用可靠数据源验证事实性声明
  • 检测虚构的统计数据、日期和人名
  • 识别编造的 URL、DOI、论文标题
  • 验证代码 API 是否真实存在

2. 一致性检查

  • 检测输出内部的逻辑矛盾
  • 识别与已知事实冲突的陈述
  • 发现前后不一致的数值和参数
  • 评估多轮对话中的记忆连贯性

3. 来源追溯

  • 要求 LLM 为每个声明提供来源
  • 验证引用的真实性和准确性
  • 识别来源不存在或内容不符的情况
  • 标记缺乏引用支撑的断言

4. 置信度评估

  • 对每句声明进行置信度评分(0-1)
  • 标记低置信度段落并给出理由
  • 区分"确定知识"与"推测内容"
  • 生成风险等级分类报告

5. 领域专项检测

  • 医学声明的事实核查(药物、剂量、症状)
  • 法律条文的准确性验证
  • 金融数据的实时交叉验证
  • 代码示例的可运行性检查

使用方式

检测这段 LLM 输出: <AI 生成的文本>
分析对话中的幻觉: <多轮对话记录>
验证技术文档: <AI 生成的文档>

输出格式

  • 幻觉检测报告(含逐句评估、风险等级、可信度评分)
  • 问题声明列表(含标注原因和纠正建议)
  • 整体可信度评分和摘要

数据底座

整合 Wikidata、维基百科、学术数据库、官方文档等 20+ 可信数据源,覆盖科学、医学、法律、技术、历史等 10 大领域的事实核查规则库。

定价

¥0.50 / 次检测