Install
openclaw skills install senseaudio-floating-audio-assistantUse when the user wants to open, stop, configure, debug, or package the SenseAudio floating audio assistant in AudioClaw, including system-audio subtitles, bilingual ASR/translation, recent-project organization, copied-text TTS, music generation, or macOS audio routing.
openclaw skills install senseaudio-floating-audio-assistant使用这个 skill 来启动和维护 SenseAudio 浮窗音频助手。
高优先级触发说法:
$senseaudio-floating-audio-assistant默认启动 macOS 原生悬浮窗:
sherpa-onnx 输出低延迟快速字幕启动浮窗:
bash "{baseDir}/scripts/start-senseaudio-floating-audio-assistant.sh"
停止浮窗并恢复系统音频:
bash "{baseDir}/scripts/stop-senseaudio-floating-audio-assistant.sh"
查看运行状态:
bash "{baseDir}/scripts/status-senseaudio-floating-audio-assistant.sh"
检查系统音频链路和基础依赖:
bash "{baseDir}/scripts/check-senseaudio-floating-audio-assistant-setup.sh"
打开最近项目/历史记录目录:
bash "{baseDir}/scripts/open-senseaudio-floating-audio-assistant-runs.sh"
打开 Audio MIDI Setup:
bash "{baseDir}/scripts/open_audio_midi_setup.sh"
运行自检:
bash "{baseDir}/scripts/doctor-senseaudio-floating-audio-assistant.sh"
python3 "{baseDir}/scripts/senseaudio_api_smoke.py"
如果需要真实调用 SenseAudio 做一条极小 TTS 探针,再运行:
python3 "{baseDir}/scripts/senseaudio_api_smoke.py" --live-tts
如果用户说“打开实时字幕”“开启双语同传”“启动浮窗字幕”“打开音乐工坊”“查看最近项目”,不要只返回命令,也不要假装状态已经切换。优先直接执行启动脚本:
bash "{baseDir}/scripts/start-senseaudio-floating-audio-assistant.sh"
如果用户说“关掉字幕”“停止实时字幕”“恢复电脑声音”,优先执行:
bash "{baseDir}/scripts/stop-senseaudio-floating-audio-assistant.sh"
这个 skill 伴随 AudioClaw 使用,默认当前环境已经有可调用的 audioclaw agent。实时字幕、翻译、TTS 和音乐生成使用 SenseAudio;最近项目的“整理/关键信息提取/模板处理”必须交给 AudioClaw agent,不要用本地假结果兜底。
必需设备和系统依赖:
BlackHole 2ch:作为系统输出音频的虚拟采集设备。Multi-Output Device:在 Audio MIDI Setup 中创建,包含真实扬声器/耳机和 BlackHole 2ch。SwitchAudioSource:来自 switchaudio-osx,用于启动时切换到多输出设备、停止时恢复原输出。swiftc:来自 Xcode Command Line Tools,用于编译原生浮窗。python3 和 bash:用于实时 ASR runner、诊断脚本和包装脚本。常用安装和打开方式:
xcode-select --install
brew install switchaudio-osx
bash "{baseDir}/scripts/open_audio_midi_setup.sh"
如果没有 Homebrew,手动安装 switchaudio-osx 后确保 SwitchAudioSource 在 PATH 中即可。
凭据由当前 AudioClaw workspace 或运行环境提供,上传包内不携带任何本地凭据、密钥值或环境变量样板。
运行时需要可用的 SenseAudio API key;SENSEAUDIO_API_KEY 是首选名称,AUDIOCLAW_ASR_API_KEY 作为兼容名称保留。不要把 API key 打印到聊天里;检查脚本只报告是否存在。
音频路由配置:
Multi-Output Device。Multi-Output Device 或中文 多输出设备,启动脚本会优先查找这两个名称。BlackHole 2ch。外部参数和运行态输入:
为了便于维护和排障,这个 skill 内置了轻量诊断入口和可复用预设:
scripts/senseaudio_api_smoke.py: 输出当前 SenseAudio API 配置摘要,包含 ASR WebSocket、TTS 和音乐生成入口;默认不消耗额度,--live-tts 才真实调用。scripts/doctor-senseaudio-floating-audio-assistant.sh: 本地健康检查入口,用来确认 manifest、启动脚本、诊断 JSON 和预设文件仍然可用。presets/: 整理模板和音乐生成参数样板,不包含真实密钥或环境变量内容。references/quickstart.md: 精简启动流程。references/operator_notes.md: 面向使用者的安装、配置和启动摘要。references/senseaudio_integration.md: SenseAudio 接入说明。references/troubleshooting.md: 常见失败路径。没有字幕时,按顺序检查:
check-senseaudio-floating-audio-assistant-setup.sh多输出设备 / Multi-Output Device“整理”功能依赖 audioclaw agent 的文本模型配置。若 AudioClaw 后端模型不返回,实时字幕、ASR、翻译、TTS 和音乐工坊仍可用,但整理会等待真实 AudioClaw 结果;不要伪造本地兜底结果。