[原创]用esrXP提取内嵌字幕|『字幕制作交流区』

echoIII

级别: 圣骑士

注册时间:: 2002-12-10

在线时间:: 0小时

发帖:: 2024

只看楼主更多操作楼主发表于: 2006-11-21

esrXP作者主页：http://ideasoft.hp.infoseek.co.jp/esrXP/
但是好像国内是被屏蔽的，所以只好把所有东西都打包上传了
尚书OCR是商业软件，恕不提供，请勿询问如何获得。

附件包括：
esrXP Beta 10
esrXP Beta 9.2
esrXP Beta 8.1
esrXP Beta 7
esrXP Beta 6
esrXP Beta 5
英文语言档案
繁体中文语言档案
简体中文语言档案
esrXP 簡易說明.mht
esrXP 進階設定.mht

附件下载：
http://202.38.64.240/person/echoIII/subsoft/esrXP.rar

esrXP简单教程（1）--基本操作篇

去年写的，稍微改改贴上来，可能有需要的。
其实作者的主页上都有写，但是位置不醒目，经常会忽略，我就把常用的功能和流程提一下。具体的还是参考这个：esrXP 簡易說明（见附件）
1.File—〉Open Video，打开一个视频文件，可以是avi，rm，mpg等。

2.Subtitle—〉Filter，就会出现如下画面

用鼠标圈定，或者直接在左边的Region框内填写数字就能把字幕的范围标出来，一般来说，横向的全选就是了，所以点一下Full Width，结果就像这样：

3.点Advance，出现Filter Setting框，在这里细调参数。这部分是整个软件的核心所在，也比较麻烦，参见esrXP 進階設定（见附件）

4.此外，配合Filter还有Postprocessing这个设置，如图：

Remove single pixel dot：移除只有一像素的点
Remove single pixel line：移除只有一像素的线
（以上两顶对VCD作用不大, 因为VCD的字很多也只有一点粗）
Remove block lager than移除过大区块
Remove block touch edge移除接触边缘的区块
Remove block pass center 移除通过中央的区块（对双行字幕有用）
设完后点Enable Filter可以看到白底黑字的结果：

5.关闭Filter画面，回到主界面，Subtitles—〉Rip Option

Frame Skip: 每隔..个影像才分析 (可以加快速度)
Pixel Difference: 多少点不同判断为新字幕一般来说，对于画质好的，设为400没什么问题，但对于VCD来说，很可能会丢字幕，这时可以适当调低，最低到100肯定是不会丢了，不过会造成大量的空白（即非字幕被识别为字幕）
Ignore Change (%): 如果有..%相同则取消新字幕，一般来说60%-80%为宜，过小也会丢，过大则造成大量的重复句（即本来是同一句被识别为不同的字幕）

6.基本设置项就是Filter Setting，Postprocessing和Rip Option，全部设置完毕在工具栏最右侧起个名字点save保存一下，以后可以直接调用

7.点击主画面最下方的Start就可以开始抽取字幕了，这个视机器不同可能会耗费不少的时间。字幕抽取结束一般先保存一个原始版本File—〉Save成一个esr文件。然后进行字幕的后期处理，包括删空白和重复句，请看下一篇esrXP使用方法（2）--字幕管理篇

esrXP简单教程（2）--字幕管理篇
这一篇其实很简单，就2个操作而已。

1.上回讲到用esrXP抽取了字幕，保存了原始的esr文件，现在就File—〉Open打开它。因为我们目前采用的方法是放大了字幕，所以导致文件很大，很占内存，所以要参与此项工作的机器内存要在512M以上，而且虚拟内存也要设得大。

然后Subtitles—〉Manger，进入字幕管理画面。会发现字幕很大，一页显示不了几个，不要紧，点上门工具条上的放大缩小的按钮，直到一个看得清字，又能多显示一些的状态。

可以看到，前面有大量的空白（即非字幕被识别为字幕），中间有大量的重复句（即本来是同一句被识别为不同的字幕），这些都是需要处理的，就是说，空白的要删掉，重复的要合并。下面讲讲基本操作。

（1）删除：左键单击选中，点工具条上的红叉删除。选中后会反白，就像这样

再点一次恢复。

（2）批量删除：先右键单击起始的一格，结果是这样：

然后左键单击结束的一格，就会大片反白

然后删除就行了。因为是可以复选的，所以建议把全部要删除的都选中后一次性删掉。也可以按住鼠标左键滑动，滑动的部分都会被选中。

（3）合并：先右键单击起始的一格

再右键单击结束的一格

，可以看到选中的也会反白，但起始和结束分别有一个箭头。然后在合并字幕的这个范围内点鼠标左键来选择字幕最清楚的一格作为保留的一格，

，可以看到这一格颜色更灰一些，默认的情况下保留的一格是最后一格。然后点删除就可以了。在合并字幕的范围内点右键就会取消。

总结：
在未更动字幕 Left Click: 删除/复原字幕
在未更动的字幕第一下 Right Click, 第二下 Left Click: 大量删除字幕
在未更动的字幕第一下 Right Click, 第二下 Right Click: 合并字幕
在合并字幕范围 Left Click: 选择此字幕为合并字幕后使用的字幕
在合并字幕范围 Right Click: 取消合并字幕

2.完成删空和并重之后，保存一下。然后再保存成bmp文件让OCR软件去识别。File—〉Save OCR Image，保存过程中会出现这个选框

Subtitle Per Image: 一个 Bitmap 含多少字幕，一般来说，一集动画会有200-400句，最省事的就是直接填一个大数让它保存成一个bmp文件，但是这样很费内存，有时候会操作失败，所以也可以多分几个文件保存，比如默认的是25条字幕一个，这样就会有10几个bmp文件
Scale Subtitle Image: 将字幕 Bitmap 放大, OCR 对大的影像有较好效果，不过我们目前用了别的方法放大，所以这个可以选1
Divid each subtitle into 2 lines: 将字幕分成两行，视情况钩上（就是说，如果原本字幕是一行的就选1，两行的就选2）。

3.OCR识别。目前试了几款主流的OCR软件，的确是尚书六号效果最好（现在已经升级到尚书七号，使用方法大同小异），所以先安装尚书，然后文件—〉打开图像页，打开刚才保存的bmp文件

记得要选中繁体字库，因为我们处理的大多数是繁体的。然后编辑—〉设定识别区域，鼠标把整个框起来，注意顶部和底部不要圈少了。

接着识别—〉文字识别，不管识别结果如何，直接保存成txt文件。
假如一集有多个bmp文件，则一个个识别完后并到同一个txt文件中。

OK字幕管理就到这里，下面就是最后的 esrXP简単教程（3）--字幕校对篇

esrXP简单教程（3）--字幕校对篇

我们前面提到，删空和并重后保存过一个esr文件，用尚书OCR后保存过一个txt文件，用esrXP打开esr文件，用记事本打开txt文件，全选复制，然后粘贴到主界面左边的框中。我们看到，尚书OCR识别的效果不如预想的好，这是因为片源是VCDrip的rm，本身素质太差，如果是TVrip的avi就好得多。

然后可以看到，当鼠标点中左边的字幕时，右边会有对应的字幕显示。那么，我们就可以对照着右边的字幕进行校对了。值得注意的是，由于换行等问题，有时候会发现对不上的情况，只要依次下来删掉空行又会对应上的。

校对完毕，File—〉Save as，在文件类型的下拉菜单中选择Subrip（*.srt）（也可以存为ssa，随意）

完工。

esrXP簡単教程（4）--技巧篇

在这里介绍几个好用的技巧。

1.批处理。作者在beta10中增加了批处理的功能，File—〉Batch Processing
先在下拉框中选好参数，然后Add Files选择文件（可以一次多选），最后Start。

2.参数导入导出。因为esrXP的参数是保存在注册表里的，所以我们通过注册表编辑器就可以很容易地完成导入导出的工作。开始—〉运行—〉regedit，打开注册表编辑器，找到esrXP的键值[HKEY_CURRENT_USER\Software\esrXP]
右键点中esrXP导出就行了，其实我们不必导出esrXP的整个设置，点setting可以看到我们设置的几个参数表，直接导出它们就行了。导出的reg文件传给朋友，他双击一下就导入了，很方便。

3.与AviSynth配合使用。avs是款强大的软件，利用它对VCD进行放大和加滤镜等可以大幅提高esrXP的识别效果
具体的做法是新建一个文本文件，后缀名为avs，写上脚本，让esrXP去打开。目前的常用脚本是：
LoadPlugin("E:\Program Files\GordianKnot\AviSynthPlugins\asharp.dll")
DirectShowSource("Gokudo-kun_Manyuki_01.rm").KillAudio().crop(8,174,340,46).Lanczos4Resize(680,92).Asharp(4,8).ConvertToRGB()
第一行是加载锐化滤镜asharp；
DirectShowSource("Gokudo-kun_Manyuki_01.rm")指明要打开的文件
KillAudio(),如字面意思,干掉里面的audio,我们曾遇到过一个问题,就是文件拖进esrxp之后,esrxp无响应,然后声音开始响起来,估计esrxp把音频视频搞错了= =,用这个之后就没事了,因为只剩下视频
crop的4个参分别是左上宽高,左和宽这两个数最好都是4的倍数,另两个得是偶数
Lanczos4Resize(680,92)就是把crop的后2个参数扩大2倍，扩大4倍就是1360，184了
当然除了Asharp还有无数的滤镜可以慢慢去试。

其实在beta10中作者提供了Scale Video和Sharpen Video，有类似效果，不过不如avs有那么多滤镜可选来得自由而已，也可以用自带的。

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

用esrXP提取内嵌字幕
如何便捷地分话提取DVD字幕
用专业OCR软件进行字幕识别


	关闭选中1篇全选