字幕大师(OKVoice)是一款专业从事智能语音技术和人工智能的软件。字幕大师(OKVoice)基于OKVoice自主研发的高准确率语音识别技术,能够将视频中的声音自动识别为文字,自动将声频文字匹配为时间轴(对齐声音和文字),生成字幕文件,并拥有自动对齐、批量上传、断点续传三个特点,让字幕工作者告别传统的“手拍字幕”,操作起来更便捷,更节省时间。
字幕大师(OKVoice)功能介绍
1、语音合成
是将文本状态的文字信息转换为可闻其声的语音信息处理技术。
它涉及语音学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
随着语音合成技术不断的发展与成熟,文字信息不仅限于眼睛的阅读,而是耳朵对文字的聆听,让生活更加的方便快捷。
2、语音识别
将人类的自然语言转化为计算机可以理解的数据语言,这种转化是达成语音识别的基础。
语音识别的应用范围广泛,如:语言拨号、语音导航、语音智能家居、语音检索、听写录入等。
随着语音识别技术的发展和完善,不同语言语音机器翻译就会出现,人类将迎来无语言沟通障碍的世界。
3、声纹识别
是根据语音波形反映说话人声音和行为特征的语音参数,能自动识别说话人身份的技术。
与语音识别不同的是,声纹识别是采取语音信号中说话人的身份信息,并不考虑语音中的字词意思。
由于每个人的生物特征具有与其他人不同的唯一性,不易伪造和假冒,所以利用声纹识别技术进行身份认证,更加安全可靠。
4、低速率编码
先进的编码技术,最低通讯编码可以在600bps以下。
高质量的语音通讯质量,600bps以下速率的PESQ分可达2.6。
稳定的通讯效率,可在各种极端环境下保证信道传输稳定。
5、智能对话
精准智能的对话理解,支持多种应用场景对话内容理解。
面向垂直领域的语义解析准确率高达95%以上。
自有的数千G规模互联网语料,确保各种词汇的理解。
字幕大师(OKVoice)使用教程
1、下载软件
这是一款非常方便的软件,一句话概括就是导进去TXT文件就可以直接生成SRT文件。简直是做时间轴的理想选择。
2、解压下载后解压,打开oksrtmaster.exe
导入音视频文件和文本文件音视频文件支持普遍格式如mp3、mp4、wav、wmv、avi、mpg、mpeg;文本文件仅支持txt文件。点击“打开文件”按钮
进入该界面
然后依次选择音视频文件和文本文件(注:二者需是对应关系),点击“添加”
如需批量处理多个字幕文件,可重复“选择音视频+选择文本+添加”步骤。
3、生成字幕文件
依次导入音视频文件和文本文件后,点击“确认”,即可开始对齐工作。稍等片刻,页面下进度条完成后,时间轴即可生成,如下图:
各处功能如图所示:
各处功能如图所示:
一般字幕对齐没有问题的情况下,字体为黑色,如果机器识别该处不准确或不正确,会标红提示,如图:
此时可以拖动时间轴上的竖线来完成修改(或手动修改“开始时间”和“结束时间”的数值)
校对完成之后,选择保存即可,默认为srt格式。
字幕大师(OKVoice)常见问题
1、能不能把字幕翻译成别的语言?
A字幕大师暂时没有翻译功能哦,处理过程中均需要音频和文本语种保持一致。
2、怎么操作?
A各项功能都有详细的操作说明,可以查看操作说明,如果它没有完美解答你的疑问,也可以联系客服哦~
3、输出文件是什么?
A目前输出的是SRT、VTT、ASS三种格式的外挂字幕文件。
4、能不能把视频和外挂字幕压制在一起?
A字幕大师目前只输出单独的外挂字幕文件,没有压制功能哦~
5、外挂字幕怎么用?
A只需要在播放音视频文件的同时,将外挂字幕拖进播放器即可。或者将音视频文件和外挂字幕命名为同一个文件名,放在同一文件夹下,即可在播放时自动加载。
6、生成的外挂字幕文件能不能导入PR,Edius等视频剪辑工具中?
A需要视该视频剪辑软件是否支持。目前仅有会声会影支持SRT外挂字幕的导入编辑。
字幕大师(OKVoice)更新日志
1、全新界面,底层优化
2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作
下载仅供下载体验和测试学习,不得商用和正当使用。
下载体验