功能
两种说话方式 — 取决于你的思考方式。
选择您偏好的快捷方式。
[按下听写]
用于简短精确的输入。
按下听写
按下并释放
免提模式
免提
键盘与鼠标快捷键
键盘
免提
同样的话。正确的输出 — 无处不在。
更好的上下文工程,在不同应用程序上智能适配合适的输出。
自动上下文适配,有能力定义工作模式在不同的上下文上。
使用不同的语言模型、不同的声音模型,配置不同的输出风格。在不同的应用程序上能智能的适配合适的输出。你也可以通过快捷键换出不同的模式,实现更好的上下文工程。
不同的场景对输出有不同的要求:写邮件、回客户的message、vibe coding、使用AI工具与AI交互。每个场景都有特定的格式要求和对专业词汇的增强。不同的应用程序需要不同的输出格式,不同的对象(老板、客户、同事、家人)需要不同的语气和风格。
你说:
"你能看一下这个吗?"
在 Slack
简短随意
在邮件
礼貌结构化
在 IDE
技术简洁
应用程序
语音
Slack
消息
Word
邮件
IDE
Teams
Discord
场景
老板
专业
客户
正式
同事
随意
家人
友好
活泼
幽默
创意
表达力强
100+ 种语言
支持 100 多种语言的转录和翻译,从英语、中文和西班牙语等广泛使用的语言到地区方言和不太常见的语言。
你可以随时切换语言。
混合 LLM 引擎
隐私重要时用本地。
智能重要时用云端。
控制重要时用你的密钥。
OpenAI
Grok
Gemini
DeepSeek
Meta
Mistral AI
Qwen
Ollama
语音模型和大语言模型完全在设备上运行
完全的数据安全、更低的延迟、更便宜的成本。
你可以结合自己的需求去定制和下载不同的语言模型。有些模型可以保证低延迟,适合需要快速响应的场景;有些模型虽然延迟稍高,但可以保证更高的准确度,适合对精度要求较高的场景。你可以在不同的场景下选择最适合你的模型。
完全在设备上运行
生物特征语音数据永远不会离开你的设备
毫秒级延迟
生物特征数据已保护
延迟 vs 准确度
低延迟
高准确度
生物特征语音数据
高度敏感 • 完全保护
它会适应你。
为什么它会越用越顺。
Dictionary
Vocabulary
→ 更少修正通过定义一些字典,大大的提高语音识别的准确度,以及解决一些错误拼写的场景。比如说一些人的名字、一些特定的专业领域的词汇。
Snippet
→ 更快回复通过 snippet 可以快速的去定义一些经常用的内容,比如说你的邮政地址、比如说你的一个产品的介绍、比如说一些常用的一些消息的短语。这些词汇和 snippet 也都是可以在跨应用上去使用的。
Audio
→ 随处可用在各种场景下无缝工作,适配不同的输入设备:AirPods、蓝牙耳机、内置麦克风、笔记本合上模式、有线麦克风以及录音设备。
当你的笔记本合上时,系统会智能适配不同的麦克风配置,即使在合盖模式下也能确保最佳的音频捕获效果。
先进的降噪算法会自动过滤嘈杂环境(如咖啡馆)中的背景噪音,同时在安静的办公室中保持清晰的语音。
智能静音检测能够处理语音中的长时间停顿和空白,自动识别你是在思考、暂停还是已经说完。系统理解自然语音模式,包括频繁的停顿和大量的空白时间。
Dictionary
个人姓名
John Smith, Olivia Zhang, Neo Ruan, Jim Sang
专业术语
API, Kubernetes, CyberWhisper, LLM, Transformer, GPT, Claude
输入设备
内建麦克风
合盖状态麦克风
有线耳机
蓝牙耳机
外接 USB 麦克风
系统音频回录
BYOK LLM 集成
支持自带密钥 (BYOK) 的 LLM 服务。使用您自己的 OpenAI、Anthropic 或其他提供商的 API 密钥,完全控制您的 AI 成本、使用情况和数据路由。非常适合需要遵守数据治理政策的企业团队。
非常适合需要完全控制的团队和高级用户。
自带密钥
立即看到差异。
在提交前比较模式。
一个塑造您的声音如何变成文本的地方。
切换不同模型、麦克风、参数,实时看效果变化。
对比不同 Mode 的输出风格与速度。实验并保存属于您的最终模式组合。
Real-time output area