微软开源超强语音输入法：Vibing（Windows + macOS）

随着大模型与多模态能力持续爆发，语音交互正成为新一代输入风口。像手机端的豆包语音输入法（豆包输入法正式版发布！搜狗输入法代替品！），凭借精准识别、智能断句、自然流畅，收获大量好评。

但豆包语音输入法目前尚未发布 Windows 版本，电脑端想用上同款体验并不容易。市面上其它语音输入工具，要么依赖云端 API、需要按量付费。

最近，微软直接甩出王炸，开源了超强语音转文本模型 VibeVoice-ASR，并基于它推出了一款开箱即用的语音识别输入工具「Vibing」提供了 Windows 和 macOS 客户端。

VibeVoice-ASR 是微软开源的90 亿参数统一语音识别大模型，在 GitHub 上收获海量 Star，堪称当前 ASR 领域的 “长语音王者”。50 + 语言支持：中英混合、多语种切换都能稳识别，不切片、不拼凑：一次性处理长达 60 分钟音频，64K 超长上下文，全程语义连贯。

免费、开源、开箱即用的 Windows 语音识别输入工具「Vibing」使用很简单，按下快捷键 Ctrl+Win 即可快速激活语音转文本，在 Word、浏览器、聊天窗口等任意输入框都能直接用，不用切换软件。

按下 Ctrl+Win+Alt 支持语音翻译，可直接外语转中文，也能中文转其他语言，翻译准确、延迟极低，跨境沟通、外文听写都能用。

自定义热词，专业场景更准支持添加行业术语、专属名词，解决专业词汇识别不准的问题，科研、法务、技术岗都适配。

功能介绍

在语音输入成为刚需的今天，微软 VibeVoice-ASR + Vibing 组合，不用花钱买 API，一键唤起、超长语音、多语言翻译、说话人区分，全部拉满。可以说是目前最省心的开源语音输入法之一。