当前位置: 首页 > news >正文

中文语音识别不建议使用VOSK

40几MB的vosk-model-small-cn-0.3,识别率极低,识别速度极慢。

1.3GB的vosk-model-cn-0.22没试,想必速度不会更快。

网站上Models里只有vosk-model-small-cn-0.22,没有0.3

vosk-transcriber --list-models

vosk-transcriber -n model -i input -o output 会下载model

输入可以是有视频的.mp4。

ffmpeg -i $1 -ac 1 -ar 16000 -acodec pcm_s16le t.wav 提取.mp4里的音频。

vosk-transcriber -l cn -n model 把语言也指定上,输入换成wav,识别结果一样。

pip uninstall 卸载。

vosk-transcriber自动下载的模型在~/.cache/vosk下。

http://www.hskmm.com/?act=detail&tid=30922

相关文章:

  • 213123123123123
  • 时序数据库 IoTDB 集成 DataGrip,支撑跨模态多库融合管理
  • Sql Server安装报错“服务没有及时响应启动或控制请求”
  • 题解:CF1830E Bully Sort
  • 斑马日记2025.10.10
  • 斑马日记2025.10.12
  • Androidify:基于Gemini AI的安卓机器人定制应用
  • 入门指南:使用 Playwright MCP Server 为你的 AI Agent 赋予浏览器自动化能力
  • 实战教程:构建能交互网页的 AI 助手——基于 Playwright MCP 的完整项目
  • popcount 题
  • 2025 年国内卷板机源头厂家最新推荐排行榜:涵盖不锈钢 / 大型 / 锥形 / 数控等多类型设备,助力企业精准采购优质设备
  • mysql5.7 AUTO_INCREMENT 问题
  • Flash游戏浏览器
  • vi/vim 的使用及 CentOS 静态网络配置并链接 Xshell
  • 微信支付
  • 102500410 杜惟真 10月14日作业
  • alpline 构建lnmp
  • 2025 年最新推荐操作台厂家排行榜:覆盖指挥中心 / 控制室 / 中控室 / 监控室 / 调度室场景,为用户选购优质产品提供专业参考
  • NVR设备ONVIF接入平台EasyCVR智慧小区视频监控系统建设方案
  • FPGA开发流程
  • 毕业论文技巧:Word中使用Mathtype对公式自动编号(带章节号)
  • 试验2
  • 浩辰CAD 2025 SP2安装包下载与安装教程
  • 高级程序语言设计第一次作业
  • Java word文档中的图片抽离方法
  • Kerberos认证(Elasticsearch)
  • 2025 年聚氨酯砂浆厂家最新推荐排行榜:聚焦欧洲技术与一站式服务的国内优质企业甄选指南水性聚氨酯砂浆/聚氨酯砂浆自流平厂家推荐
  • 在Anolis OS 8.10 GA上安装和配置VNC系统
  • 钩子(HOOK):改变系统行为的 “隐形抓手”
  • 浅谈InheritableThreadLocal---线程可继承的小书包