Install
openclaw skills install shumianyu将分段 asr 文本流在结束时统一整理成流畅书面语,并在用户指定 target_language 时输出译文。适用于语音听写、会议转写、采访整理、播客或视频字幕后处理等场景,尤其适合不需要实时字幕、只需要在整段结束后得到最终书面结果的任务。保持接口抽象、可替换,不绑定任何特定厂商 api。
openclaw skills install shumianyu接收分段 ASR 文本流,但不要实时输出字幕,而是在检测到整段结束、会话结束、录音结束或调用方显式提交结束信号后,再将累计文本一次性整理成流畅书面语。
默认不翻译。只有在显式提供 target_language 时,才对最终书面结果进行翻译。
此 Skill 适用于:
采用单次最终输出模型:
target_language,则输出目标语言结果;除非调用方明确要求,否则不同时返回原文和译文只有在满足以下任一条件时,才进入最终整理阶段:
is_session_final、end_of_stream、commit=true不要仅因为一个句号、一次停顿或一句话结束,就提前输出最终结果。
概念上可接收以下输入:
chunk_text:最新 ASR 分段文本recent_context:可选,最近缓冲区或已累计文本domain_lexicon:可选,领域词库,用于人名、产品名、术语、缩写的稳定化target_language:可选,目标语言代码或语言名is_session_final / end_of_stream / commit:可选,结束信号timestamps:可选,时间戳元数据不要要求调用方必须使用某个固定字段名。接受语义等价字段。
默认只输出最终结果,不要输出中间过程。
target_language,则输出翻译后的最终结果在最终整理时:
只有在 target_language 被显式提供时才翻译。
翻译时:
所有外部能力都应描述为可替换职责,不要绑定具体厂商 API、SDK、认证方式或传输协议。
推荐抽象接口:
ingest_asr_chunk(...) —— 接收并归一化新的 ASR 分段append_to_buffer(...) —— 将分段并入当前整段缓冲区detect_stream_end(...) —— 判断是否已到整段结束时刻rewrite_to_written(...) —— 将累计口语内容统一改写为书面语translate_text(...) —— 当 target_language 存在时翻译最终结果commit_final_output(...) —— 提交最终结果并清空或归档当前缓冲区不要假设任何固定服务商。
target_language,再对最终书面语做翻译。如果提供 domain_lexicon:
输入分段:
今天我们先把登录流程跑通然后再看支付和埋点如果尚未收到结束信号:
累计文本:
今天我们先把登录流程跑通 然后再看支付和埋点嗯如果时间够的话再把告警顺手补一下结束后最终结果:
今天先完成登录流程,再处理支付和埋点。如果时间允许,再补充告警能力。若同时设置 target_language: en,则输出:
Today, we will complete the login flow first, then handle payments and tracking. If time allows, we will also add alerting.需要查看中文接入说明、可替换接口建议和结束式处理流程时,读取 references/interface-guide-zh.md。