Voxly 语音转录与字幕处理工具
- 版本: 2.8.5
- 版权所有: © 2025-2026 团子 (tuanzi)
- 官方网站: https://voxly.cn
软件简介
Voxly 是一款专为内容创作者、后期剪辑师及播客制作人打造的专业级桌面端语音转录与字幕处理工作站。
本应用致力于打破传统视听制作的繁琐流程,将离线 AI 语音识别、大语言模型智能校对/排版、多引擎机器翻译与专业数字音频工作站(DAW)无缝衔接。通过高度自动化的工作流,Voxly 能够大幅提升视频加字幕、播客文字化及多语言内容出海的制作效率。
核心工作流与第三方组件声明
Voxly 的强大功能得益于开源社区的无私贡献以及顶尖 AI 服务商的支持。为尊重知识产权并遵守开源协议,特在此详细声明本软件所使用的第三方技术组件及其许可信息:
一、 核心转录引擎(本地离线处理)
Voxly 的语音识别完全在用户本地设备上运行,保障最高级别的数据隐私。
- OpenAI Whisper 语音识别模型
- 应用场景: 提供高精度、支持多语种的底层语音识别能力。
- 版权声明: 原始模型由 OpenAI 发布,遵循 MIT 许可协议。
- 项目地址: https://github.com/openai/whisper
- whisper.cpp (ggerganov/whisper.cpp)
- 应用场景: 本应用通过调用
whisper-cli.exe可执行文件完成本地转录推理。该项目是 Whisper 模型的高效 C/C++ 移植实现,大幅降低了硬件门槛并提升了推理速度。其配套的 GGML 格式模型权重文件同样来源于该项目。 - 版权声明: 遵循 MIT 许可协议。
- 项目地址: https://github.com/ggerganov/whisper.cpp
- 应用场景: 本应用通过调用
二、 媒体处理基建
- FFmpeg (多媒体处理框架)
- 应用场景: 本应用以独立子进程的方式调用随附的
ffmpeg.exe。无论用户导入何种格式的视频(MP4, MOV 等)或音频(WAV, MP3 等),均由 FFmpeg 进行无损的音频轨道提取、重采样与格式转换,以为转录引擎提供标准化的音频输入。 - 版权声明: 本软件安装包内置并分发了已编译的 FFmpeg 可执行文件(当前内置版本:8.1)。该组件遵循 LGPL / GPL 许可协议。Voxly 未修改其源代码,也未将其链接(Link)至本软件的核心程序中,仅通过命令行(CLI)以完全独立进程的方式进行外部调用,符合开源协议中关于“独立程序聚合”的隔离要求。基于该开源协议,用户有权根据自身需求,自行升级或替换安装目录下的
ffmpeg.exe文件。 - 项目地址: https://ffmpeg.org
- 应用场景: 本应用以独立子进程的方式调用随附的
三、 智能大语言模型(AI 校对与上下文翻译)
Voxly 引入了先进的 LLM(大语言模型)以解决传统机翻生硬、字幕断句不合理的问题。
- DeepSeek API
- 应用场景: 默认的高阶 AI 驱动引擎。通过 HTTP 接口对接,深入理解上下文语境,执行高精度的多语言翻译、语气修正、错别字智能校对,以及基于语义的智能字幕自动换行排版。
- 服务协议: 遵循 DeepSeek 官方服务条款。用户需自行注册、申请并合法使用个人的 API Key,相关产生的数据与费用由用户与服务商结算。
- 官方网站: https://platform.deepseek.com
- OpenRouter API (模型聚合网关)
- 应用场景: 为高阶用户提供极大的模型选择自由度。支持通过兼容接口一键接入 Claude 4.6、GPT-5.4、Llama 等全球顶尖大模型,满足不同垂直领域的专业翻译与润色需求。
- 服务协议: 使用者须遵循 OpenRouter 及对应底层模型提供商的官方服务条款。
- 官方网站: https://openrouter.ai
四、 传统机器翻译服务(NMT)
针对需要快速、批量处理且对上下文语境依赖较低的场景,Voxly 提供了传统的高效机翻接口。
- 百度翻译开放平台 API
- 服务协议: 使用者须自行申请 AppID 与密钥,并严格遵循百度翻译开放平台服务协议。
- 官方网站: https://fanyi-api.baidu.com
- 有道智云翻译 API
- 服务协议: 使用者须自行申请 AppKey 与密钥,并严格遵循有道智云服务协议。
- 官方网站: https://ai.youdao.com
五、 DAW 深度集成(REAPER 专属工作流)
这是 Voxly 区别于传统字幕软件的核心特性,允许音频工程师和视频剪辑师在时间线上直观地处理文本。
- REAPER (Cockos Incorporated)
- 应用场景: 本应用通过专属的外部脚本联动技术,与 REAPER 数字音频工作站实现深度握手。支持将生成的字幕数据直接转化为 REAPER 时间线上的「空媒体条目 (Empty MIDI/Text Items)」,实现字幕与音轨的逐帧对齐与后期精修。
- 版权声明: REAPER 为 Cockos Incorporated 拥有的商业软件产品。Voxly 仅作为桥接工具,用户请务必合法购买并持有 REAPER 的商业或个人授权。
- 官方网站: https://www.reaper.fm
- js_ReaScriptAPI (REAPER 扩展插件)
- 应用场景: 本应用安装包随附了由开发者 juliansader 编写的
reaper_js_ReaScriptAPI.dll扩展。该插件为 Voxly 提供了在 REAPER 内部执行底层外部脚本调用的权限,是实现跨软件通信的桥梁。 - 版权声明: 遵循 LGPL 2.1 许可协议。
- 项目地址: https://github.com/juliansader/ReaExtensions
- 应用场景: 本应用安装包随附了由开发者 juliansader 编写的
六、 视频合成与媒体播放引擎
为了提供流畅的媒体预览与高效的视频合成能力,Voxly 集成了业界领先的开源媒体播放框架。
- libvlc 及 .NET 绑定库
- 应用场景: 本应用内置了基于 libvlc 的 .NET 包装库(绑定版本),主要用于驱动软件内的“视频合成器”模块以及时间线上的音视频实时预览功能,提供对绝大多数媒体格式的底层解码与渲染支持。
- 版权声明: 底层的 libvlc 核心媒体框架由 VideoLAN 社区开发,遵循 LGPL 2.1(或更高版本)许可协议。本软件作为独立的专有商业软件,仅通过 .NET 接口以“动态链接(Dynamic Linking)”的方式调用 libvlc 的动态链接库(如
.dll文件),不修改、不静态编译其核心源码,完全符合 LGPL 协议对商业闭源软件的调用隔离要求。基于此协议,用户有权根据自身需求,自行升级或替换软件安装目录下的 libvlc 相关库文件。 - 项目地址: https://www.videolan.org/vlc/libvlc.html
软件授权与服务条款
在安装、使用或以任何方式访问 Voxly 之前,请务必完整阅读以下授权与服务条款。您下载、安装或使用本软件的行为即视为您已阅读、理解并同意受以下所有条款的约束。若您不同意以下任何条款,请立即停止使用并卸载本软件。
第一条 授权范围
- 授权类型: Voxly 采用商业授权模式。用户需通过官方渠道获取合法授权后方可正常使用全部功能。
- 授权用途: 授权仅限于授权用户本人在个人或工作中合法使用,不得转让、转售、出租、分发或以任何形式向第三方提供授权信息。
- 试用权利: 用户可在授权购买前试用本软件的部分功能。试用版可能存在功能限制或使用时间限制。
- 未成年人使用限制: 本软件及集成的第三方 AI 服务主要面向成年人提供。未成年人应在法定监护人的指导、监督和同意下使用本软件。因未成年人使用第三方 AI 模型产生的不可控内容或相关费用,由其监护人承担相应责任。
第二条 「现状提供」与服务级别
- 按现状提供(AS IS): 本软件及其所有功能均按「现状」(As Is)和「可用」(As Available)标准提供。开发者在法律允许的最大范围内,不对软件做出任何形式的保证或承诺(无论是明示、暗示还是法定的),包括但不限于对适销性、特定用途适用性、不侵权性、数据完整性或运行不中断的保证。
- 软件可能存在的限制: 由于软件开发的复杂性,本软件可能包含缺陷(Bug)。开发者会尽合理努力修复已知问题,但无法保证软件在任何环境下完全无错误地运行。
- 服务中断: 本软件不承诺服务等级协议(SLA)。开发者可能因维护、升级或其他原因暂停或终止部分功能或服务,恕不另行通知。
第三条 免责声明
- 损失免责: 在法律允许的最大范围内,无论基于何种法律理论(合同、侵权、严格责任或其他),开发者及其关联方均不对以下情况承担任何责任:
- 因使用或无法使用本软件所导致的任何直接损失、间接损失、偶发损失、特殊损失、惩罚性损失或后果性损失;
- 数据丢失、数据损坏或数据泄露;
- 利润损失、商誉损失或业务中断;
- 因软件缺陷、系统崩溃或程序异常退出造成的工作成果丢失。
- 合理建议: 用户在进行重要工作时,应当定期保存并备份工程文件和字幕数据。开发者强烈建议使用"导出任务数据"功能定期备份。
- 不可抗力: 因自然灾害、罢工、暴乱、战争、政府行为、司法行政命令、核心骨干网络故障、黑客攻击等不可抗力因素导致的服务中断、软件异常或数据丢失,开发者不承担法律责任。
第四条 第三方服务与内容责任
- 第三方服务声明: 本软件集成的所有云端 AI 服务(包括但不限于 DeepSeek、OpenRouter、百度翻译、有道翻译等)和本地开源组件(Whisper、FFmpeg 等)均由其各自独立的服务提供商或开源社区开发并维护。Voxly 仅提供 API 请求转发与流程集成的工具角色。
- AI 输出内容: 开发者不对第三方 AI 模型生成、修改或翻译内容的准确性、正确性、完整性、合法性或合规性做出任何承诺或担保。AI 模型可能产生不准确、具有偏见或不恰当的输出。用户必须自行审核所有 AI 生成的内容,并对其最终的发布和使用承担全部责任。
- 服务可用性: 第三方 API 服务可能因服务商侧的维护、故障、策略调整或网络问题而暂时不可用或发生变更。开发者无法控制且不对此类中断负责。
第五条 费用与账户
- 软件授权费用: 用户通过官方渠道购买的 Voxly 授权费用,仅包含软件本体的使用权。此费用不包含任何第三方 API 的调用费用。
- 第三方 API 费用: 用户在 Voxly 中调用的任何第三方付费 API 接口(翻译服务、AI 大模型服务等),其产生的所有费用、额度消耗及账单事宜,均由用户直接与对应的服务提供商之间结算,与 Voxly 开发者无关。开发者不代收、不代缴、不经手任何第三方服务费用。
- 费用知情: 建议用户在使用 AI 相关功能前,充分了解所选 API 服务商的计费规则。本软件提供了余额查询和低余额预警功能以辅助用户管理额度,但不对因用户操作(包括批量处理、重复请求等)产生的超额费用负责。
第六条 知识产权与合法使用
- 用户义务: 用户在使用 Voxly 进行音视频提取、转录、翻译和字幕编辑时,必须确保自身拥有该媒体内容的合法使用权、版权或已取得相关权利人的明确书面授权。
- 禁止行为: 严禁使用本软件处理、转录或翻译以下内容:
- 侵犯第三方知识产权、著作权、肖像权或其他合法权益的素材;
- 含有违法、违规、歧视、恶意、诽谤或其他不当内容的文件;
- 任何法律法规禁止传播的内容。
- 侵权责任: 因用户违反本条约定而导致的任何法律纠纷、索赔或行政处罚,均由用户自行承担全部法律责任和经济赔偿。Voxly 开发者对此不承担任何连带责任,且保留向违规用户追偿因此给开发者造成的损失的权利。
第七条 隐私与数据安全
- 本地处理优先: Voxly 的核心语音转录功能完全在用户本地设备上运行,原始音视频文件不会上传至任何服务器。
- 网络请求透明: 当用户主动使用 AI 校对、翻译、说话人在线识别等需要联网的功能时,相关文本数据将通过 HTTPS 加密通道发送至用户自行配置的 AI 服务商。Voxly 开发者不运营任何中间服务器,不存储、不窃取、不分析用户发送的任何数据。
- 用户责任: 用户应知悉,使用第三方 API 服务时,其数据将受到对应服务商的隐私政策约束。建议用户在处理敏感或机密内容时,优先使用本地离线功能。
第八条 退款政策
- 数字产品特性: 由于本软件为可即时交付的数字产品,且授权信息一经激活即已完成服务交付,因此依据国家相关法律法规关于数字商品的规定,原则上不支持退款。
- 特殊情况: 若因软件自身存在严重缺陷导致完全无法使用且开发者在合理时间内未能修复的,用户可联系开发者协商解决方案。
- 非软件原因: 因用户自身设备环境(操作系统版本、硬件限制、驱动不兼容等)、第三方服务故障、用户操作失误或主观不满意等非软件本身缺陷导致的问题,不构成退款理由。
第九条 软件更新与终止
- 更新说明: 开发者可能不定期发布软件更新以修复问题、改进功能或增加新特性。更新不构成对持续更新的承诺。
- 兼容性: 软件更新可能对系统环境、依赖组件有新的要求。开发者会尽量保持向后兼容,但不保证所有版本在所有环境下均能正常运行。
- 终止权利: 开发者保留在任何时候出于任何原因终止本软件的开发、维护或分发的权利。
第十条 适用法律与争议解决
- 适用法律: 本条款的解释与适用受中华人民共和国法律管辖。
- 争议解决: 因本软件或本条款产生的任何争议,双方应首先友好协商解决。协商不成的,任何一方均有权向开发者所在地有管辖权的人民法院提起诉讼。
- 条款可分割性: 如本条款中的任何条款被管辖法院认定为无效或不可执行,其余条款仍继续有效。
第十一条 联系方式
如您对本条款有任何疑问,或在使用过程中遇到问题,请通过以下方式联系:
- 官方网站: https://voxly.cn
- 官方支持邮箱: support@voxly.cn
*本条款最后更新于 2026 年 4 月。开发者保留随时修改本条款的权利,修改后的条款将在官方网站或软件内公布后生效。*