简要总结
Deepgram
这页说明书在讲一个叫 Deepgram 的“小耳朵”。它能把别人发给你的语音消息,变成手机能看懂的“文字消息”。这样,你的 OpenClaw 小助手就能“听”懂语音,然后给你回话啦!当你需要让小助手处理语音时,就可以看看这页。
五岁小孩版解释
Deepgram 就像一个很厉害的“小耳朵”,专门负责“听”录音。在 OpenClaw 里,它的工作就是把别人发来的语音条或者音频文件,变成一行一行的文字。这些文字会被放进小助手的回复里,这样小助手就能根据文字内容来回答你了。它不是一边听一边写的,而是等整个语音都录好了,再一次性把文字全部写出来。
要使用这个“小耳朵”,你需要先拿到一把叫 DEEPGRAM_API_KEY 的“钥匙”。这把钥匙是一串以 dg_ 开头的密码,你要把它放在一个安全的地方告诉 OpenClaw。
拿到钥匙后,你要告诉 OpenClaw 小助手:“请把 Deepgram 小耳朵打开来用吧!” 你需要在一个设置文件里写下这些话:
- 打开音频工具:找到
tools.media.audio这个地方,把enabled这个开关设为true,意思是“打开”。 - 选择小耳朵:在
models里面写上,你要用的“小耳朵”是deepgram,它的具体型号是nova-3。
除了基本的听写,你还可以告诉这个小耳朵一些特别的要求,让它写得更好:
- 指定语言:你可以用
language告诉它,比如这是中文(zh)还是英文(en),它会听得更准。 - 让它自己猜语言:你可以打开
detect_language这个开关,让它自己猜录音里说的是什么语言。 - 加上标点符号:你可以打开
punctuate这个开关,让它写出来的文字有逗号和句号,读起来更舒服。 - 把数字、日期写好看:你可以打开
smart_format这个开关,让它把“二零二四”写成“2024”,把“一点半”写成“1:30”。
这里有一些重要的事情要记住哦:
- 一定要保管好你的
DEEPGRAM_API_KEY这把“钥匙”,不要告诉别人。 - 这个小耳朵处理录音时,和其他小耳朵一样,有文件大小和等待时间的限制,太大的录音它可能处理不了。
- 如果你需要通过一个“中转站”(代理)来连接这个小耳朵,你可以用
baseUrl和headers来告诉 OpenClaw 怎么走。