『漫游』酷论坛>『字幕制作交流区』>[原创]IdxSubOcr v1.07

[原创]IdxSubOcr v1.07

strnghrs@2008-02-17 21:32

Version 1.07
错误修正:如果原始字幕文件有错,会中断退出。
错误修正:如果原始字幕文件信息有错,OCR后出现无时间轴的空白行,导致结果文件被截断。

Version 1.06
功能增强:加强繁简转换时的纠错能力。

Version 1.05
重写OCR后处理部分,减小文字错位、错行的概率。

Version 1.04
错误修正:如果字幕编号不是从0开始,则不能正常OCR。

Version 1.03
功能修正:对于Unknown的字幕语言,在提醒后允许继续OCR。

Version 1.02
功能修正:考虑到宽屏逐渐普及,初始界面不再最大化。
错误修正:界面缩小到正常大小时,“黑白图像”选项会被遮挡。

Version 1.01
错误修正:如果字幕第一行为空,则在“OCR选项”中,不能再选择文字颜色。

Version 1.00
提供字幕OCR、校对功能。
OCR采用MODI引擎,支持英文、简体中文、繁体中文、日文。

功能: 一个专门用来OCR(光学字符识别)Vobsub格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。OCR引擎为微软Office 2003所带的Microsoft Office Document Imaging (MODI),支持英文、简体中文、繁体中文、日文。
动机: 目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下:
希望能够使用方便性方面有所改善。Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文、日文字符。
SubOCR实在太庞大,而且在某些机器上运行出错。

说明: 本软件的中文、日文识别结果为GBK字符,因此只能在支持GBK编码的环境下使用。一般Windows 2000/XP没有问题,Windows Me看运气,Windows 98多半不行。配置MODI以支持简体中文、繁体中文、英文的方法见《在简体中文Office 2003下OCR繁体中文、日文、韩文》:
http://www.comicer.com/stronghorse/water/software/officeocr.htm

官方网站免费下载:http://www.comicer.com/stronghorse/software/index.htm#IdxSubOcr

繁体中文、日文、韩文所需文件下载见第二页。网络存储,有效期不敢保证,要下请早。
引用

alphaa@2008-02-17 21:55

好东西,谢谢分享~~
引用

mattliu@2008-02-17 21:55

支持原创
试一下识别率如何

=================
试了几个
识别率相当不错了,我是装的Office 2007
subtosrt字库不全的也可以识别了
只是对空格检测的支持还不是很好,能改进一下就好了

SUBOCR的历史又翻过了一页[/ku]
引用

softworm@2008-02-17 22:52

原来楼主就是传说中的编程牛人

好东东,支持一下
引用

feelingmtg@2008-02-17 23:23

软件收下
正好有些要OCR的东西
拿去看看
感谢!
引用

真宫寺一马@2008-02-18 19:34

又见老马了
话说,我现在还在用你那里的avi2jpg
我也是在你的帖子里才知道minidvd。一晃好多年过去了。
引用

feelingmtg@2008-02-18 20:46

LS很久没出现过了
老前辈啊
引用

openicq@2008-02-18 21:00

进来拜楼主的 Orz
(ComicsViewer是PC上看漫画最伟大的软件啊啊啊啊~)
引用

dfdfdg@2008-02-18 22:10

拜老马……
看看效果如何,敲字库确实很痛苦
常用汉字2500,这回某片字库弄了快3500字。。。
引用

雷鸣@2008-02-18 22:57

非常牛的软件。
subresync很痛苦,subocr经常出来奇怪的结果,载个这个来试试看
引用

真宫寺一马@2008-02-18 23:30

正好要rip繁体。。。。无奈找不到繁体组件。。。。
引用

gaoshu@2008-02-19 00:07

http://www.namipan.com/d/tradicn.rar/08fbfa83fe369bc68fb0a4ec3eb6516cce42e63a05ef5f00

繁体组件
引用

MeteorRain@2008-02-19 00:25

老前辈!(眼泪汪汪
引用

strnghrs@2008-02-19 08:21

繁体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/6586690247092923
日文识别.rar
匿名提取文件连接 http://pickup.mofile.com/3450460086308631
韩文识别.rar
匿名提取文件连接 http://pickup.mofile.com/0440810023559326
简体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/2008820428172679
引用

chiman@2008-02-19 10:00

comicviewer使用者来拜谢前辈
引用

«1234»共4页

| TOP