硅基流动 × 说点啥:开口即成品,让语音输入“长脑子”
在移动办公与即时沟通成为常态的今天,如何快速将口语化的灵感、待办或回复转化为精准的文字,仍是许多人的效率痛点。说点啥(https://github.com/BryceWG/BiBi-Keyboard/releases)是一款基于 Kotlin 的搭载于 Android 平台的智能语音输入工具,已服务于数万名追求效率与数据安全的日常用户。说点啥近期完成了核心智能引擎的升级,深度集成硅基流动(Sili
对于一名经常需要跨部门沟通的产品经理而言,一场两小时的会议往往意味着要快速记录几十条零散信息,会后还需手动整理成待办事项;对于频繁与海外客户沟通的商务人士,收到客户发来的英文长消息时,需要先理解内容、再组织回复,过程还涉及翻译和润色,若用打字逐一敲出,既耗时又容易出错......
在移动办公与即时沟通成为常态的今天,如何快速将口语化的灵感、待办或回复转化为精准的文字,仍是许多人的效率痛点。传统的语音输入往往止步于“语音转文字”的初级层面,识别结果口语化严重、需要手动修改,更无法理解用户的深层意图,你是想记录、翻译还是总结?
如今,依托能力越来越强的 AI 语音输入产品,这些高强度的基础文字工作正被重塑。
说点啥(https://github.com/BryceWG/BiBi-Keyboard/releases)是一款基于 Kotlin 的搭载于 Android 平台的智能语音输入工具,已服务于数万名追求效率与数据安全的日常用户。它并非一款普通的语音输入键盘,而是一套 “系统级的智能语音能力外设”。凭借 10+ 语音识别引擎的自由切换、首创 AI 智能后处理对识别结果进行二次精修、打破应用壁垒的 “悬浮球跨键盘输入”,同时坚持隐私优先、核心代码开源,让用户的每一句话只属于自己。
为了应对语音输入场景对识别精度、语义理解与后处理能力的多重高要求,说点啥近期完成了核心智能引擎的升级,深度集成硅基流动(SiliconFlow)提供的免费大模型 API,大幅提升了用户体验。

语音输入任务的本质并非简单的声波转文字,而是涉及多重理解的复杂链条。多轮严格的内测显示,硅基流动提供的模型服务能够稳定满足此类高难度、多层次的语音处理需求:
- 识别精度:硅基流动平台集成的免费 ASR 模型(TeleAI/TeleSpeechASR,FunAudioLLM/SenseVoiceSmall)在嘈杂环境、专业术语、多语言混合等复杂场景下保持稳定的识别准确率。
- 理解深度:依托 Qwen/Qwen-3-8B、THUDM/GLM-4-9B-0414 等推理模型,无论是简单转录、翻译、总结待办,还是提炼要点,说点啥的“智能后处理”功能能够准确理解用户意图,并根据不同场景输出符合预期的结果。
- 响应效率:硅基流动提供的模型 API 在保证推理质量的同时,实现了流畅的响应速度,让用户几乎感知不到 AI 处理的存在,只感觉到“它懂我”。
手把手教你配置硅基流动 API
配置语音识别模型 API
在软件首页可以进入语音识别设置和 AI 后处理设置两个入口。进入语音识别设置,可以选择切换语音识别供应商。在硅基流动(SiliconFlow)渠道,可以选择是否使用免费服务。免费服务提供 TeleSpeechASR、SenseVoiceSmall 这两个 ASR 模型。

关闭使用免费服务,即可使用自己的API Key,以使用更多模型:
- Qwen/Qwen3-Omni-30B-A3B-Instruct(多模态模型,可输入音频,更好更快)
- Qwen/Qwen3-Omni-30B-A3B-Thinking(多模态模型,可输入音频,效果最好但略慢)
- TeleAI/TeleSpeechASR
- FunAudioLLM/SenseVoiceSmall

配置后处理模型 API
后处理功能帮助优化语音识别效果或完成部分特色功能,例如识别完成后进行翻译、总结识别内容中的代办信息等。硅基流动免费提供两个快速模型:
- Qwen/Qwen-3-8B(推理模型)
- THUDM/GLM-4-9B-0414
关闭免费服务后,可以配置自己的 API Key,使用更多模型:

除了内置的已适配模型,还可以通过自定义选项填入其他模型ID。部分模型支持深度思考模式切换开关,帮助用户在更快的响应速度和更好的处理效果之间选择。
使用示例
完成配置后,可以测试一下语音识别是否正常工作:
-
1. 打开输入框
-
2. 进行语音输入
- 确认当前输入法为说点啥
- 长按键盘上的麦克风按钮(大按钮),开始说话
- 说完后松开按钮,等待识别结果

-
3. 查看结果
- 如果配置正确,识别结果会自动输入到文本框中
- 如果出现错误,报错信息会自动复制到粘贴板中,请检查:
- API Key 是否正确
- 网络连接是否正常
- 麦克风权限是否已授予
- 是否有语音输入(检查音量波形)
(更多详细使用说明可见说点啥官方文档:https://bibidocs.brycewg.com/)
结语
在语音输入这一高频刚需领域,硅基流动的模型服务已成为说点啥的重要能力支撑。通过硅基流动内置的免费模型入口,让用户可以直接体验智能语音输入,大幅降低了产品的使用门槛,让原本需要复杂配置的 AI 能力得以在日常工作中实现“开箱即用”。
目前,说点啥已服务数万名安卓用户,并将持续迭代。搭载于说点啥的新一代 AI 语音输入能力,深度融合先进的模型能力与独特的产品设计,正将用户从繁琐的文字敲打中解放出来,使其回归到“表达本身”的核心任务上。
预计随着底层 AI 模型能力的持续提升,说点啥将支持更复杂、更智能的语音交互,移动时代的表达效率边界也将持续获得突破。
更多硅基流动平台使用场景与应用案例:https://docs.siliconflow.cn/cn/usercases/awesome-user-cases
更多推荐

所有评论(0)