在电脑上用语音输入,最大的门槛不是技术,是尴尬
Typeless 过完年改了一条规则:免费用户超出每周 4000 字,直接停用。以前超了顶多弹个窗,现在不行了。
小红书上哀嚎了好几天。
我装过多少款,我自己都没数清楚
于我倒还好,因为我不是主力使用 Typeless。但是我之前主力在用的那款——秒言,早就"死了"。
从 Typeless,到 sayso、秒言、言出、闪电说、Lazy Typer,再到 Voiceink 和 Spokenly,差不多能叫上名字的,我都装过。
Voiceink 花了 100 多块,买的终身买断版。用的时候发现,在 M2 MacBook Air 上会导致整台电脑卡死,唯一的解决方法是重启(据说是因为它会调用本地的性能来做 OCR 识别)。后来就没再打开过。

Spokenly 更离谱。它支持调用 Apple 原生语音识别模型,但要升级到 macOS 26。我真的升了。用了一段时间,最后是受不了 macOS 26,手动降级回来。不是 Spokenly 的问题,是系统的问题。
为了一个输入工具,把操作系统升了又降。
最好用的那款,没了
秒言是我用得最顺手的。杭州一家公司做的,专注中文识别,定价比 Typeless 便宜,当时还处于推广阶段。我是他们的早期用户,反馈问题,他们改得也快。
然后有一天,群里一条消息:团队解散,产品停运。
12 点还在用,12 点 01 分就没了。(我在另一篇文章里写过这件事。)

秒言停了之后找替代品,言出让我觉得最有意思:不是因为识别最准,而是做它的独立开发者,明显是从自己的使用场景出发,把界面和交互做成了跟同类产品完全不一样的逻辑。你一眼就能感觉出,这个人是真的在给自己做工具,不是对标竞品照着抄的。
只是识别准确度和速度,还有进步的空间。
现在主力用的是 SaySo。倒不是因为它最好,是因为我在群里批评过它「文字上屏卡卡的」,他们负责人主动加了我微信,让我再试试。再次使用时发现,确实进步了,我也答应帮他多体验多反馈。
所以现在的状态是:带着一点义务感在用。
一个月前提了一堆意见,到现在改进了一些了。我最想要的那个:说错了按 ESC 取消,不用重新触发,这个还没做。倒是粗口过滤修了:原来 AI 润色太强,连骂人的话都给你优化掉,现在好很多了。
用嘴这件事,没你想的那么自然
从我的体验出发,语音输入要改变两层习惯,不是一层。
第一层:用语音替代键盘。这个已经不容易了。我刚开始在家用的时候,说着说着,老婆或者小孩会以为我在跟他们说话,扭过头来回应我。后来他们习惯了,我也习惯了。
第二层:用语音操控电脑。这是很多产品往 Agent 方向走的野心:打开应用、发指令、控制其他软件。但这个习惯的改变难度比第一层大得多。
锤子做 TNT 的时候,罗永浩在台上演示语音操控电脑,台下有人喊:「别说话,你打扰到我用 TNT 了。」这句话后来成了梗。但在公共场合对着屏幕说话,本身就需要克服一道心理门槛:不只是自己的,还有旁边人的。
在办公室,你用语音输入,同事可能觉得你在打扰他。
这次回老家过年,我几乎没用过语音输入,因为父母不知道电脑上可以这样用,我也不知道怎么解释,索性算了。

夹在中间,往哪儿走
这块市场,做起来很难。
前面有 Typeless 定着,年付 $12/月,换算下来 80 多块人民币(月付 $30,约 200 块钱人民币)。后面有大厂在追:豆包据说在做 PC 端输入法,一旦出来基本是降维打击;智谱的 AutoGLM 已经出了语音输入功能,我体验下来效果一般,但大厂的迭代速度在那里。
夹在中间的小团队,大多打的牌是:我比 Typeless 便宜。
但是,这张牌能打多久?
另一条路是做 Agent,「语音操纵一切」。Typeless 自己也在往这个方向走。但我用下来,Agent 功能几乎没碰。大部分时间,我只是需要一个好用的「嘴巴」:打开它,说,文字出现在屏幕上,就这样。
这块市场的问题,可能不是功能不够多,而是还没有人把最基础的体验做到真正好用。
$12 是一道筛选题
Typeless 收紧免费额度,我仔细想了想,这其实是一道筛选题。$12/月在问你:你有多在乎用嘴说话这件事?
国内用户可能已经习惯给大模型 token 付费了,但为软件工具订阅,还差得远。连 QQ 音乐会员都要纠结的人,不会为语音输入花 80 多块。
被筛掉的,有些是真用不起,有些是还没感受到这件事的价值。后者也许只是还没到那个时刻:等他们真的开始每天用嘴说话,回头看,可能会觉得 $12 并不贵。
但这个时刻,不一定会来。