Install
openclaw skills install telegram-multilingual-voice-replySmart Telegram reply workflow for OpenClaw: if the user sends text, reply with text; if the user sends a voice note/audio, transcribe locally using the insta...
openclaw skills install telegram-multilingual-voice-reply目标:在 Telegram 跟 OpenClaw 聊天时实现“语音优先 + 多语言跟随”的智能回复:
mlx-community/Qwen3-ASR-0.6B-8bitmlx-community/Qwen3-ForcedAligner-0.6B-8bit需要模型清单/更多上游用法:
references/qwen3-asr-notes.md
reply_textreply_text,且与语音内容一致)python3 scripts/mlx_asr.py --audio /path/to/audio.ogg --language Chinese
注:Telegram 常见是 ogg/opus。
mlx_asr.py已支持 CLI fallback,并会在需要时用 ffmpeg 转 wav。
Telegram 支持给 voice note 附带 caption,使得“语音条 + 下方文字”显示为同一条消息(你截图里的效果)。
scripts/mlx_tts_voice.py 生成 Telegram 友好的 .ogg/opus:python3 scripts/mlx_tts_voice.py --text "<reply_text>" --out /tmp/reply.ogg
message 工具发送(voice note + caption):asVoice: truepath/filePath: 上一步生成的 reply.oggcaption: 同一段 reply_text(必须与语音内容一致)说明:OpenClaw 的
tts工具通常会把语音作为单独消息发送,无法保证 caption 同条承载。
failed to import mlx_audio:当前 python3 环境里没有安装到 mlx_audio。请用安装 mlx_audio 的同一个解释器/venv 运行。ogg/opus。如转写失败,优先把音频转成 wav 再试(或确保系统具备相应解码能力)。