『漫游』酷论坛>『字幕制作交流区』>[求助] 请教 SubToSrt ..
[求助] 请教 SubToSrt 字库的问题
目击者@2004-10-05 08:08
SubToSrt 字库是怎么生成的呢,有工具可以用来直接生成字库的吗?
哪里可以更新到最新的字库呢?
怎么样才可以识别 日文 的字体呢,怎么可以生成一个 日语 字库呢?
不胜感激!!
shihaix@2004-10-07 14:16
楼主所问的问题
最好的答案就是 自己手动输入
我也都是这样建立字库的
因为每个字幕的字型大小都不尽相同
因此即使你拥有字库,也不见得能辨识出来的
因扎吉@2004-10-07 16:22
而且现在的字库有的不全
午后の红茶@2004-10-07 22:49
SubToSrt的字库一直有更新,作者也很卖力
hanstyleyekai.vicp.net 端口9988
用户名update
密码update
这是subtosrt的相关ftp资源,里面有最新的字库,去下载更新吧。
还有一点要说一下,subtosrt是利用SUBRIP从DVD里把字幕读成图片,然后再对这些图片里的字进行OCR,所以在识别繁体中文时,如果那繁体字写得还算规范,那OCR时会很顺利,如果字体有些斜或变形什么的,这时会提示你手动输入这个字,不过这些字只要你输入一次,会自动加入到字库里。方便以后使用。
曾半仙@2004-10-08 12:21
输入一次以后要合并临时识别的结果,要不然当前还是要再次叫你识别.
Subtosrt因为字体的缘故,会把一些日文显示为?或者空字符.
感觉上他是点阵的方式进行匹配,而不是像通用的OCR那样按照字形相似度匹配,同一部片子同样字体,因为哪个地方多了几个边缘的点,他还是会当作新字要求识别.
有的时候还不如手动输入的快,不过频繁的切换日语注音和中文输入也麻烦,
关键是不知道有些字怎么发音,后来发现开了ms的日语输入法的手写板,能凑合着用.
所以俺Subtosrt都是跳过,跳过,最后再手动输一遍
有点想写一个ocr工具或者接口的打算了,可惜之前研究过的ocr内核属于交任务性质的,如果真的作可能还是设法弄到成熟的ocr引擎了,再采集一些D商的日文字模,不知道写了会不会有人donate来,哈哈,没有就不去消耗生命了
| TOP