软件介绍
- Ai说话实时转文字,Ai同步语音转录工具
- 这款工具是一个实时语音转文字的应用程序,可以在本地运行,支持Windows 10和Windows 7操作系统。
- 使用这个工具可以直接说话,无需打字,对那些经常需要打字进行聊天的朋友来说非常方便。
- 使用准备和系统要求
- 在使用这个工具之前,需要准备一台装有Windows操作系统的电脑和一个可正常工作的麦克风,以便进行语音输入。
- 该工具的模型文件大小为1.1GB,主程序分为两个版本:
- CapsWriter-Offline-Windows-64bit.zip:适用于Windows 10系统。
- CapsWriter-Offline-Windows-32bit-Client.zip:适用于Windows 7系统。
- 需要注意的是,Windows 7系统只能作为客户端使用该工具,因此如果想要使用这个工具,必须使用Windows 10系统。
- 如果您的电脑是Windows 7系统,则需要另外一台安装有Windows 10系统的电脑作为服务端。
软件特性
-
- 离线功能
- 可完全离线运行,无需网络连接。
- 无限时长
- 支持长时间录音,没有时间限制。
- 低延迟
- 实时转录,延迟极低。
- 高准确率
- 转录准确率高,识别精准。
- 中英混输
- 支持中英文混合输入。
- 自动处理数字
- 自动识别并转录阿拉伯数字。
- 自动调整中英文间隔
- 自动调整中英文之间的间隔,提升转录质量。
- 热词功能
- 可在指定的热词文件中添加热词,客户端动态加载。
- 日记功能
- 默认将每次录音识别结果记录在特定的年/月/日.md文件中,录音文件保存在年/月/assets目录下。
- 关键词日记
- 若识别结果以关键词开头,会被记录在特定的年/月/关键词-日期.md文件中,关键词在keywords.txt中定义。
- 转录功能
- 支持将音视频文件拖动到客户端打开,生成srt字幕文件。
- 服务端与客户端分离
- 可以同时服务多台客户端,实现多用户同时使用。
- 配置灵活
- 可通过编辑config.py文件配置服务端地址、快捷键、录音开关等功能。
- 离线功能
懒人包说明:
Windows端:
- 请确保在Windows电脑上已安装Microsoft Visual C++ Redistributable运行库(如未安装可通过百度下载)。
- 服务端载入模型所需的onnxruntime仅适用于Windows 10及以上版本系统。
- 服务端载入模型需要系统内存至少4GB,仅支持64位系统。
- 针对32位系统的用户,额外提供了可用的客户端,适用于Windows 7及以上版本系统。
- 模型文件较大,单独打包,请解压后将模型放入软件目录下的models文件夹中。
其他系统:
- 对于其他操作系统,可以下载模型并安装所需依赖后,通过Python源码运行。
- 由于没有Mac电脑,无法提供Mac版本的打包,只能从源码运行,可能会遇到一些问题(客户端需要使用sudo启动,且默认快捷键为右Shift键)。
模型说明:
- 由于模型文件较大,为了方便更新单独打包。
- 解压模型后,请将其放入软件目录下的models文件夹中。