功能

一个声音。每个工作流。

CyberWhisper 能在任何可以输入的地方工作 — 跨应用。

CyberWhisper Features
快速触发

两种即时激活语音输入的方式

选择您偏好的快捷方式。

CyberWhisper 提供两种快速触发语音输入的方式:

按下听写

Push-to-Dictation 是用于短语音的触发方式,完美适用于精确、可控的输入。按下并释放听写的快捷键,为每一个简短的想法提供高精度高质量的输出。

免提模式

当你需要一些时间边思考边输入的时候。当你需要在输入的同时查阅一些资料的时候 你可以按下免提快捷键进入免提模式,开始说出你的想法和需要输入的内容。在这个过程中,你可以随意停顿,甚至可以停顿很长的时间。你也可以在这个过程中去浏览一些相关的资料,把在看资料的过程中想说的内容说出来。你可以在不同的应用和内容之间做切换。到最终,你按下结束免提的时候,你说的所有内容都会转换成输出,输出到你的程序、你的应用当中。

按下听写

按下并释放

免提模式

免提

Shortcuts

Fn

键盘

⌃⌥

免提

模式

自动上下文适配。

更好的上下文工程,在不同应用程序上智能适配合适的输出。

自动上下文适配,有能力定义工作模式在不同的上下文上。

使用不同的语言模型、不同的声音模型,配置不同的输出风格。在不同的应用程序上能智能的适配合适的输出。你也可以通过快捷键换出不同的模式,实现更好的上下文工程。

不同的场景对输出有不同的要求:写邮件、回客户的message、vibe coding、使用AI工具与AI交互。每个场景都有特定的格式要求和对专业词汇的增强。不同的应用程序需要不同的输出格式,不同的对象(老板、客户、同事、家人)需要不同的语气和风格。

应用程序

语音

Slack

消息

Word

邮件

IDE

Teams

Discord

场景

老板

专业

客户

正式

同事

随意

家人

友好

活泼

幽默

创意

表达力强

端侧大模型

语音模型和大语言模型完全在设备上运行

完全的数据安全、更低的延迟、更便宜的成本。

你可以结合自己的需求去定制和下载不同的语言模型。有些模型可以保证低延迟,适合需要快速响应的场景;有些模型虽然延迟稍高,但可以保证更高的准确度,适合对精度要求较高的场景。你可以在不同的场景下选择最适合你的模型。

速度是即时的。因为模型完全运行在端侧,没有网络的开销,处理速度非常快,可以在毫秒级完成。

保证数据隐私安全。你的声音是你的生物特征,非常敏感。所有数据都完全在你的设备上处理,确保不会有任何泄露,是完全安全的。对于一些高度敏感的内容,比如企业内部文件或客户的高度敏感信息,通过端侧大模型可以完全把数据控制在你的端侧,而不会传到云端。

生物特征数据已保护

延迟 vs 准确度

延迟
准确度

低延迟

高准确度

生物特征语音数据

高度敏感 • 完全保护

已加密
设备端
自定义字典

字典。

提高准确度,加快工作流程。

我们的字典支持 vocabulary 和 snippet,可以大大提高语音识别的准确度。

Vocabulary

通过定义一些字典,大大的提高语音识别的准确度,以及解决一些错误拼写的场景。比如说一些人的名字、一些特定的专业领域的词汇。

Snippet

通过 snippet 可以快速的去定义一些经常用的内容,比如说你的邮政地址、比如说你的一个产品的介绍、比如说一些常用的一些消息的短语。这些词汇和 snippet 也都是可以在跨应用上去使用的。

在这个字典当中,这个数据都是跟着你走的,不会跟具体的厂商、大语言模型的厂商绑定,不会跟具体的应用进行绑定。你的词汇和片段始终属于你,无论你使用哪个服务或应用,都可以随时随地访问。

Vocabulary

个人姓名

John Smith, Olivia Zhang, Neo Ruan, Jim Sang

专业术语

API, Kubernetes, CyberWhisper, LLM, Transformer, GPT, Claude

Snippets

Postal Address

123 Main St, City, State

产品介绍

Cyber Whisper 是一款智能语音输入解决方案,支持设备端处理,实现无缝的语音转文字转换,确保隐私保护和快速响应。

自适应音频

任何场景。任何设备。智能适配。

智能选择设备,精确调教,适应任何环境。

在各种场景下无缝工作,适配不同的输入设备:AirPods、蓝牙耳机、内置麦克风、笔记本合上模式、有线麦克风以及录音设备。

当你的笔记本合上时,系统会智能适配不同的麦克风配置,即使在合盖模式下也能确保最佳的音频捕获效果。

先进的降噪算法会自动过滤嘈杂环境(如咖啡馆)中的背景噪音,同时在安静的办公室中保持清晰的语音。

智能静音检测能够处理语音中的长时间停顿和空白,自动识别你是在思考、暂停还是已经说完。系统理解自然语音模式,包括频繁的停顿和大量的空白时间。

输入设备

内建麦克风

合盖状态麦克风

有线耳机

蓝牙耳机

外接 USB 麦克风

系统音频回录

环境

嘈杂咖啡厅

安静办公室

自带密钥

使用您自己的 API 密钥、基础设施和算力。

完全掌控性能、成本和安全性。

使用您自己的 API 密钥连接任何 LLM 提供商,或在您自己的基础设施和算力资源上部署模型。我们无缝支持基于云和自托管的解决方案。

这种灵活性让您可以优化性能、降低成本,并完全控制您的数据和安全性。无论您偏好云端 API 还是本地部署,您都可以自由选择最适合您特定需求的解决方案。

GPT
Claude
DeepSeek
Grok
实验场

探索。比较。完善您的模式。

一个塑造您的声音如何变成文本的地方。

切换不同模型、麦克风、参数,实时看效果变化。

对比不同 Mode 的输出风格与速度。实验并保存属于您的最终模式组合。

Mic
Whisper
LLM

Real-time output area

多说话,少打字

让声音融入你的工作流。

在你的 Mac 上本地运行。

你的音频永远不会离开设备。