电脑DIY圈 AI模型类 Ai说话实时转文字,Ai离线语音输入工具

Ai说话实时转文字,Ai离线语音输入工具

百度

Ai说话实时转文字,Ai离线语音输入工具缩略图

软件介绍

  1. Ai说话实时转文字,Ai同步语音转录工具
    • 这款工具是一个实时语音转文字的应用程序,可以在本地运行,支持Windows 10和Windows 7操作系统。
    • 使用这个工具可以直接说话,无需打字,对那些经常需要打字进行聊天的朋友来说非常方便。
  2. 使用准备和系统要求
    • 在使用这个工具之前,需要准备一台装有Windows操作系统的电脑和一个可正常工作的麦克风,以便进行语音输入。
    • 该工具的模型文件大小为1.1GB,主程序分为两个版本:
      • CapsWriter-Offline-Windows-64bit.zip:适用于Windows 10系统。
      • CapsWriter-Offline-Windows-32bit-Client.zip:适用于Windows 7系统。
    • 需要注意的是,Windows 7系统只能作为客户端使用该工具,因此如果想要使用这个工具,必须使用Windows 10系统。
    • 如果您的电脑是Windows 7系统,则需要另外一台安装有Windows 10系统的电脑作为服务端。
软件特性
    1. 离线功能
      • 可完全离线运行,无需网络连接。
    2. 无限时长
      • 支持长时间录音,没有时间限制。
    3. 低延迟
      • 实时转录,延迟极低。
    4. 高准确率
      • 转录准确率高,识别精准。
    5. 中英混输
      • 支持中英文混合输入。
    6. 自动处理数字
      • 自动识别并转录阿拉伯数字。
    7. 自动调整中英文间隔
      • 自动调整中英文之间的间隔,提升转录质量。
    8. 热词功能
      • 可在指定的热词文件中添加热词,客户端动态加载。
    9. 日记功能
      • 默认将每次录音识别结果记录在特定的年/月/日.md文件中,录音文件保存在年/月/assets目录下。
    10. 关键词日记
      • 若识别结果以关键词开头,会被记录在特定的年/月/关键词-日期.md文件中,关键词在keywords.txt中定义。
    11. 转录功能
      • 支持将音视频文件拖动到客户端打开,生成srt字幕文件。
    12. 服务端与客户端分离
      • 可以同时服务多台客户端,实现多用户同时使用。
    13. 配置灵活
      • 可通过编辑config.py文件配置服务端地址、快捷键、录音开关等功能。

懒人包说明:

Windows端:

  • 请确保在Windows电脑上已安装Microsoft Visual C++ Redistributable运行库(如未安装可通过百度下载)。
  • 服务端载入模型所需的onnxruntime仅适用于Windows 10及以上版本系统。
  • 服务端载入模型需要系统内存至少4GB,仅支持64位系统。
  • 针对32位系统的用户,额外提供了可用的客户端,适用于Windows 7及以上版本系统。
  • 模型文件较大,单独打包,请解压后将模型放入软件目录下的models文件夹中。

其他系统:

  • 对于其他操作系统,可以下载模型并安装所需依赖后,通过Python源码运行。
  • 由于没有Mac电脑,无法提供Mac版本的打包,只能从源码运行,可能会遇到一些问题(客户端需要使用sudo启动,且默认快捷键为右Shift键)。

模型说明:

  • 由于模型文件较大,为了方便更新单独打包。
  • 解压模型后,请将其放入软件目录下的models文件夹中。

软件截图

Ai说话实时转文字,Ai离线语音输入工具插图

软件获取

VIP可高速下载,永久VIP可进专属群,享受群内福利。
下载地址
夸克
密码:无
迅雷
密码:无

百度

百度

本文来自网络,不代表电脑DIY圈立场,转载请注明出处。 VIP购买指南 https://www.10zv.com/archives/26531

作者: 电脑DIY

上一篇
下一篇

发表回复

联系我们

联系我们

13006117758

在线咨询: QQ交谈

邮箱: huguang007@vip.qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部
首页
联系我们
购买vip
搜索