硅基流动 × 说点啥：开口即成品，让语音输入“长脑子”

在移动办公与即时沟通成为常态的今天，如何快速将口语化的灵感、待办或回复转化为精准的文字，仍是许多人的效率痛点。说点啥（https://github.com/BryceWG/BiBi-Keyboard/releases）是一款基于 Kotlin 的搭载于 Android 平台的智能语音输入工具，已服务于数万名追求效率与数据安全的日常用户。说点啥近期完成了核心智能引擎的升级，深度集成硅基流动（Sili

硅基流动

420人浏览 · 2026-03-05 12:20:42

硅基流动 · 2026-03-05 12:20:42 发布

对于一名经常需要跨部门沟通的产品经理而言，一场两小时的会议往往意味着要快速记录几十条零散信息，会后还需手动整理成待办事项；对于频繁与海外客户沟通的商务人士，收到客户发来的英文长消息时，需要先理解内容、再组织回复，过程还涉及翻译和润色，若用打字逐一敲出，既耗时又容易出错......

在移动办公与即时沟通成为常态的今天，如何快速将口语化的灵感、待办或回复转化为精准的文字，仍是许多人的效率痛点。传统的语音输入往往止步于“语音转文字”的初级层面，识别结果口语化严重、需要手动修改，更无法理解用户的深层意图，你是想记录、翻译还是总结？

如今，依托能力越来越强的 AI 语音输入产品，这些高强度的基础文字工作正被重塑。

说点啥（https://github.com/BryceWG/BiBi-Keyboard/releases）是一款基于 Kotlin 的搭载于 Android 平台的智能语音输入工具，已服务于数万名追求效率与数据安全的日常用户。它并非一款普通的语音输入键盘，而是一套 “系统级的智能语音能力外设”。凭借 10+ 语音识别引擎的自由切换、首创 AI 智能后处理对识别结果进行二次精修、打破应用壁垒的 “悬浮球跨键盘输入”，同时坚持隐私优先、核心代码开源，让用户的每一句话只属于自己。

为了应对语音输入场景对识别精度、语义理解与后处理能力的多重高要求，说点啥近期完成了核心智能引擎的升级，深度集成硅基流动（SiliconFlow）提供的免费大模型 API，大幅提升了用户体验。

语音输入任务的本质并非简单的声波转文字，而是涉及多重理解的复杂链条。多轮严格的内测显示，硅基流动提供的模型服务能够稳定满足此类高难度、多层次的语音处理需求：

识别精度：硅基流动平台集成的免费 ASR 模型（TeleAI/TeleSpeechASR，FunAudioLLM/SenseVoiceSmall）在嘈杂环境、专业术语、多语言混合等复杂场景下保持稳定的识别准确率。
理解深度：依托 Qwen/Qwen-3-8B、THUDM/GLM-4-9B-0414 等推理模型，无论是简单转录、翻译、总结待办，还是提炼要点，说点啥的“智能后处理”功能能够准确理解用户意图，并根据不同场景输出符合预期的结果。
响应效率：硅基流动提供的模型 API 在保证推理质量的同时，实现了流畅的响应速度，让用户几乎感知不到 AI 处理的存在，只感觉到“它懂我”。

手把手教你配置硅基流动 API

配置语音识别模型 API

在软件首页可以进入语音识别设置和 AI 后处理设置两个入口。进入语音识别设置，可以选择切换语音识别供应商。在硅基流动（SiliconFlow）渠道，可以选择是否使用免费服务。免费服务提供 TeleSpeechASR、SenseVoiceSmall 这两个 ASR 模型。

关闭使用免费服务，即可使用自己的API Key，以使用更多模型：

Qwen/Qwen3-Omni-30B-A3B-Instruct（多模态模型，可输入音频，更好更快）
Qwen/Qwen3-Omni-30B-A3B-Thinking（多模态模型，可输入音频，效果最好但略慢）
TeleAI/TeleSpeechASR
FunAudioLLM/SenseVoiceSmall

配置后处理模型 API

后处理功能帮助优化语音识别效果或完成部分特色功能，例如识别完成后进行翻译、总结识别内容中的代办信息等。硅基流动免费提供两个快速模型：

Qwen/Qwen-3-8B（推理模型）
THUDM/GLM-4-9B-0414

关闭免费服务后，可以配置自己的 API Key，使用更多模型：

除了内置的已适配模型，还可以通过自定义选项填入其他模型ID。部分模型支持深度思考模式切换开关，帮助用户在更快的响应速度和更好的处理效果之间选择。

使用示例

完成配置后，可以测试一下语音识别是否正常工作：

1. 打开输入框
2. 进行语音输入

确认当前输入法为说点啥
长按键盘上的麦克风按钮（大按钮），开始说话
说完后松开按钮，等待识别结果

3. 查看结果

如果配置正确，识别结果会自动输入到文本框中
如果出现错误，报错信息会自动复制到粘贴板中，请检查：
- API Key 是否正确
- 网络连接是否正常
- 麦克风权限是否已授予
- 是否有语音输入（检查音量波形）

（更多详细使用说明可见说点啥官方文档：https://bibidocs.brycewg.com/）

结语

在语音输入这一高频刚需领域，硅基流动的模型服务已成为说点啥的重要能力支撑。通过硅基流动内置的免费模型入口，让用户可以直接体验智能语音输入，大幅降低了产品的使用门槛，让原本需要复杂配置的 AI 能力得以在日常工作中实现“开箱即用”。

目前，说点啥已服务数万名安卓用户，并将持续迭代。搭载于说点啥的新一代 AI 语音输入能力，深度融合先进的模型能力与独特的产品设计，正将用户从繁琐的文字敲打中解放出来，使其回归到“表达本身”的核心任务上。

预计随着底层 AI 模型能力的持续提升，说点啥将支持更复杂、更智能的语音交互，移动时代的表达效率边界也将持续获得突破。

更多硅基流动平台使用场景与应用案例：https://docs.siliconflow.cn/cn/usercases/awesome-user-cases

开源鸿蒙跨平台开发者社区

开源鸿蒙跨平台开发社区汇聚开发者与厂商，共建“一次开发，多端部署”的开源生态，致力于降低跨端开发门槛，推动万物智联创新。

更多推荐

#基于Flutter+三方库+鸿蒙开发的高考题目设计系统全流程实战

欢迎加入开源鸿蒙跨平台社区： https://openharmonycrossplatform.csdn.net本项目是一套跨平台高考题目设计、管理、预览系统，核心采用Flutter搭建跨端主应用，集成优质Flutter三方库实现高效开发，同时适配鸿蒙（HarmonyOS）平台，实现一套逻辑多端运行。项目包含题目录入、题型编辑、题库管理、预览导出、鸿蒙端适配发布等完整功能，全程提供可落地的详细步骤

开源鸿蒙跨平台开发者社区

Flutter深度实战、主流三方库精通与鸿蒙原生开发全栈路线规划系统

欢迎加入开源鸿蒙跨平台社区： https://openharmonycrossplatform.csdn.net本路线规划系统从零起步、循序渐进，覆盖Flutter基础夯实、主流三方库实战落地、鸿蒙（HarmonyOS）原生开发全流程，最终实现Flutter项目与鸿蒙生态融合、全端跨平台开发能力。全程包含可直接落地的项目实践、详细操作步骤、环境配置、代码示例，你可完全按照步骤完成所有开发任务，最终