#feishu#飞书

Feishu Voice Note via FFmpeg

解决飞书 IM 语音气泡问题——通过 ffmpeg 将 TTS 输出的 mp3 转为飞书支持的 ogg-opus 格式。适用场景：(1) 在飞书机器人的 TTS 回复中需要显示语音气泡而非文件附件, (2) Edge TTS 或其他只支持 mp3/webm 输出的 TTS 引擎需要适配飞书, (3) 自定义 TTS provider 的飞书集成。包含核心原理、ffmpeg 命令、OpenClaw pipeline 集成方案。

Install

openclaw skills install @17329971/feishu-voice-note-ffmpeg

飞书语音气泡 ffmpeg 方案

在飞书机器人中，语音消息只有以 ogg-opus 格式发送才会显示为可播放的语音气泡。纯文本附件或其他格式会显示为文件附件，无法内联播放。

使用方式

适合在以下场景直接套用：

TTS 已经能正常生成音频，但飞书里只显示为附件
希望把现有 mp3 / webm-opus 输出适配成飞书语音气泡
正在做 OpenClaw / 自定义机器人 / 自定义消息管线的飞书语音集成

核心原理

text

TTS 引擎（Edge TTS）
  → 输出 mp3（Edge TTS 原生仅支持 mp3 和 webm-opus）
    → ffmpeg 转码为 ogg-opus
      → 飞书 API 接收 ogg → 显示语音气泡 ✅

为什么需要转码：

Edge TTS 仅支持 audio-24khz-48kbitrate-mono-mp3（mp3）和 webm-opus 格式
飞书官方只将 ogg-opus 识别为语音消息（msg_type: audio）
webm 容器的 opus 文件飞书不识别，可能被当作视频或未知格式
mp3 文件在飞书中只能作为文件附件发送

飞书官方推荐命令

bash

ffmpeg -i input.mp3 -acodec libopus -ac 1 -ar 16000 output.opus

参数说明：

-acodec libopus — 使用 Opus 编码器
-ac 1 — 单声道（语音消息标准）
-ar 16000 — 16kHz 采样率（语音质量与文件大小的平衡点）

在 OpenClaw 中的集成方案

方案概述

在 TTS provider 的 synthesize 函数中，检测当前通道是否要求语音气泡（通过 target 参数判断），如果是则：

调用目标 TTS 引擎生成 mp3
自动调用 ffmpeg 转成 ogg-opus
返回 .opus 文件路径给消息发送管线
飞书通道检测到 fileType: "opus" 后以 msg_type: "audio" 发送 → 语音气泡

关键集成点