古体诗根据内容分类:如何将SUB字幕转换为SRT字幕

来源:百度文库 编辑:杭州交通信息网 时间:2024/04/28 00:37:09

转不了的 SUB字幕是图形模式的而SRT字幕是文本模式的而且有必要转,哪种格式都 一样用呀

一. 概念

1. 从DVD中直接制作出来的字幕一般都是sub格式,由一个sub文件和一个idx文件组成。
2. sub文件中其实是一幅幅背景透明的图片,而idx则是index文件,引导显示每幅图片的时间。
3. sub格式的文件比较大(一种语言就4M左右,压缩成rar后还有1M左右大小),不利于网上传播,而转换成srt或ssa格式后,大小只有100K不到,而且可以自由更改以及修正错误的字幕。
4. 转换成ssa格式以后可以自己更改字体,这方面ssa比srt好,事先可以预设字体,或临时增加特效,格式看起来也非常直观。
5. sub字幕不能直接转换,而是要通过一种叫OCR(Optical Character Recognition)的方法,也就是光学字符识别技术。
6. Vobsub自带的Subresync的效果不是很好,每次都要重新记忆字库,每次转换都要花费一个小时以上;而SubRip支持的只是英文字幕;至于SubOCR,体积庞大30多MB不说,是大略地OCR,所以能认识所有的字,但是每次的校对工作将是半个小时到一个小时;本软件SubToSrt3.11改进了字库结构,识别速度飞快,而且是用精确识别的技术,不认识的字会要求用户输入字库,同时可以直接转繁体为简体/简体为繁体。
7. 有了记忆字库的功能,每次转换sub字幕的时间将越来越少,当你转换了很多种字体的字幕以后,每次转换将只需要1-5分钟!
8. 字库可以导入导出,3.x版本已经改进了程序结构,再也不会出现2.0的假死机的情况。
9. 作者会不定时放出新字库更新,扩充你的本地字库,增强识别能力。

二. 详细转换过程(一) 用SubRip将sub文件转换为bmp图片

1. 本文采用《红猪》的字幕作为例子,一步一步教大家如何转换sub为srt或ssa。用熟了以后,过程是十分简单的。
2. 首先安装SubRip 1.17.1,选择安装所有。
3. 打开SubRip->文件->打开Vob文件
4. 打开文件目录->选定sub->语言数据流选Chinese->右面操作里选字幕图片保存为4bit的BMP文件,以及在加时间和尺寸上打勾->开始
5. 输入任意文件名->保存
6. 预设里选I-Author->选取Custom Colors and Contrast->把颜色#1-4全部选择成白色(#1-4分别代表字芯、字框、背景、消除走样,每个字幕的#1-4所代表的都不一样)->一一测试哪一个为字芯,设为黑色,其他3项全部为白色,重要!->点选确定
7. SubRip自动将每一幅图片保存为BMP,并且加上相应时间顺序。
输出格式->设置输出格式->Text Formats下的SubRip(*.srt)->转换成此格式。
文件->另存为->保存

三. 详细转换过程(二) SubToSrt 3.11的使用

1. 本软件为完全绿色软件,直接解压开即可使用。
2. 运行SubToSrt.exe->文件->打开SRT或SSA文件->选取刚才保存的srt文件
3. 图片处理->自动裁剪->确定(推荐使用此步骤,可以使识别更快)
4. 依照字幕调节空格检测设置、空格宽度设置、行高检测设置的灵敏度
5. 识别->开始识别
当遇到不认识的字时,会自动跳出小窗口要求丰富字库,输入该字,按回车即可。
当遇到半个字的时候,如图,按扩展(Alt+E),即可显示全字。
如果前面一个字打错,可以在小框中修改该字,程序会自动从该字所在行开始识别。
6. 识别完毕后,会自动替换已知错误词组。
7. 这时,可以随便看一下字幕,如有需要,可以略做修改(如:原sub字幕中就是错误的)
8. 文件->保存为SRT或SSA格式->推荐为ssa,自由度比srt更大。

四. 字幕修改校对

1. 文件->打开可对照的字幕文件->选取已经转换好的ssa文件
2. 修改左面或者右面的字幕都可以,修改完毕后,点击保存

五. 操作技巧

1. 在丰富字库前,设置->程序设置->输入法设置->智能ABC(或者你习惯的输入法)->确定,这样就不需要每次都按Ctrl+Space了。
2. 如果sub字幕中的字是错别字,不要输入正确的字,以便以后识别该字。错别字可以在校正过程中修改。
3. 设置->程序设置->保存设置里可以选择加入制作者信息
4. 设置->程序设置->检查替换设置 和 词组替换设置 里可以把经常见到的错别字加入,以便自动识别修正。
5. ssa字幕中的字体可以设置最为常用的字体(如:宋体、黑体、楷体),以供大家使用。
6. 导出字库给别人合并时,只要导出后面的一部分即可,前面的原带字幕都是相同的。
7. 如果发现字库中有错字,识别->分析当前行数据,找到该字的序号,然后字库->修改即可。