OC
OpenClaw 中文解释版

给五岁小朋友也能看懂的说明书

简要总结

Deepgram

这页说明书在讲一个叫 Deepgram 的“小耳朵”。它能把别人发给你的语音消息,变成手机能看懂的“文字消息”。这样,你的 OpenClaw 小助手就能“听”懂语音,然后给你回话啦!当你需要让小助手处理语音时,就可以看看这页。

五岁小孩版解释

Deepgram 就像一个很厉害的“小耳朵”,专门负责“听”录音。在 OpenClaw 里,它的工作就是把别人发来的语音条或者音频文件,变成一行一行的文字。这些文字会被放进小助手的回复里,这样小助手就能根据文字内容来回答你了。它不是一边听一边写的,而是等整个语音都录好了,再一次性把文字全部写出来。

要使用这个“小耳朵”,你需要先拿到一把叫 DEEPGRAM_API_KEY 的“钥匙”。这把钥匙是一串以 dg_ 开头的密码,你要把它放在一个安全的地方告诉 OpenClaw。

拿到钥匙后,你要告诉 OpenClaw 小助手:“请把 Deepgram 小耳朵打开来用吧!” 你需要在一个设置文件里写下这些话:

  1. 打开音频工具:找到 tools.media.audio 这个地方,把 enabled 这个开关设为 true,意思是“打开”。
  2. 选择小耳朵:在 models 里面写上,你要用的“小耳朵”是 deepgram,它的具体型号是 nova-3

除了基本的听写,你还可以告诉这个小耳朵一些特别的要求,让它写得更好:

  • 指定语言:你可以用 language 告诉它,比如这是中文(zh)还是英文(en),它会听得更准。
  • 让它自己猜语言:你可以打开 detect_language 这个开关,让它自己猜录音里说的是什么语言。
  • 加上标点符号:你可以打开 punctuate 这个开关,让它写出来的文字有逗号和句号,读起来更舒服。
  • 把数字、日期写好看:你可以打开 smart_format 这个开关,让它把“二零二四”写成“2024”,把“一点半”写成“1:30”。

这里有一些重要的事情要记住哦:

  • 一定要保管好你的 DEEPGRAM_API_KEY 这把“钥匙”,不要告诉别人。
  • 这个小耳朵处理录音时,和其他小耳朵一样,有文件大小和等待时间的限制,太大的录音它可能处理不了。
  • 如果你需要通过一个“中转站”(代理)来连接这个小耳朵,你可以用 baseUrlheaders 来告诉 OpenClaw 怎么走。