搜索 社区服务 统计排行 帮助
  • 36399阅读
  • 55回复

[原创]IdxSubOcr v1.07

楼层直达
级别: 侠客
注册时间:
2001-11-21
在线时间:
0小时
发帖:
461
Version 1.07
错误修正:如果原始字幕文件有错,会中断退出。
错误修正:如果原始字幕文件信息有错,OCR后出现无时间轴的空白行,导致结果文件被截断。

Version 1.06
功能增强:加强繁简转换时的纠错能力。

Version 1.05
重写OCR后处理部分,减小文字错位、错行的概率。

Version 1.04
错误修正:如果字幕编号不是从0开始,则不能正常OCR。

Version 1.03
功能修正:对于Unknown的字幕语言,在提醒后允许继续OCR。

Version 1.02
功能修正:考虑到宽屏逐渐普及,初始界面不再最大化。
错误修正:界面缩小到正常大小时,“黑白图像”选项会被遮挡。

Version 1.01
错误修正:如果字幕第一行为空,则在“OCR选项”中,不能再选择文字颜色。

Version 1.00
提供字幕OCR、校对功能。
OCR采用MODI引擎,支持英文、简体中文、繁体中文、日文。

功能: 一个专门用来OCR(光学字符识别)Vobsub格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。OCR引擎为微软Office 2003所带的Microsoft Office Document Imaging (MODI),支持英文、简体中文、繁体中文、日文。
动机: 目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下:
希望能够使用方便性方面有所改善。Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文、日文字符。
SubOCR实在太庞大,而且在某些机器上运行出错。

说明: 本软件的中文、日文识别结果为GBK字符,因此只能在支持GBK编码的环境下使用。一般Windows 2000/XP没有问题,Windows Me看运气,Windows 98多半不行。配置MODI以支持简体中文、繁体中文、英文的方法见《在简体中文Office 2003下OCR繁体中文、日文、韩文》:
http://www.comicer.com/stronghorse/water/software/officeocr.htm

官方网站免费下载:http://www.comicer.com/stronghorse/software/index.htm#IdxSubOcr

繁体中文、日文、韩文所需文件下载见第二页。网络存储,有效期不敢保证,要下请早。

级别: 工作组
注册时间:
2007-08-23
在线时间:
0小时
发帖:
683
只看该作者 1楼 发表于: 2008-02-17
好东西,谢谢分享~~
级别: 骑士
注册时间:
2004-12-25
在线时间:
0小时
发帖:
1106
只看该作者 2楼 发表于: 2008-02-17
支持原创
试一下识别率如何

=================
试了几个
识别率相当不错了,我是装的Office 2007
subtosrt字库不全的也可以识别了
只是对空格检测的支持还不是很好,能改进一下就好了

SUBOCR的历史又翻过了一页[/ku]

级别: 圣骑士
注册时间:
2007-03-01
在线时间:
82小时
发帖:
968
只看该作者 3楼 发表于: 2008-02-17
原来楼主就是传说中的编程牛人

好东东,支持一下
级别: 工作组
注册时间:
2006-01-10
在线时间:
2小时
发帖:
1080
只看该作者 4楼 发表于: 2008-02-17
软件收下
正好有些要OCR的东西
拿去看看
感谢!

级别: 精灵王
注册时间:
2003-01-10
在线时间:
1小时
发帖:
2981
只看该作者 5楼 发表于: 2008-02-18
又见老马了
话说,我现在还在用你那里的avi2jpg
我也是在你的帖子里才知道minidvd。一晃好多年过去了。
级别: 工作组
注册时间:
2006-01-10
在线时间:
2小时
发帖:
1080
只看该作者 6楼 发表于: 2008-02-18
LS很久没出现过了
老前辈啊

级别: 新手上路
注册时间:
2004-09-27
在线时间:
0小时
发帖:
5693
只看该作者 7楼 发表于: 2008-02-18
进来拜楼主的 Orz
(ComicsViewer是PC上看漫画最伟大的软件啊啊啊啊~)

-=eDtoon=-☆openicq☆㊣POPGO_Fans㊣







__________________

级别: 工作组
注册时间:
2005-04-22
在线时间:
82小时
发帖:
3769
只看该作者 8楼 发表于: 2008-02-18
拜老马……
看看效果如何,敲字库确实很痛苦
常用汉字2500,这回某片字库弄了快3500字。。。

退休老干部

级别: 工作组
注册时间:
2005-05-03
在线时间:
0小时
发帖:
2914
只看该作者 9楼 发表于: 2008-02-18
非常牛的软件。
subresync很痛苦,subocr经常出来奇怪的结果,载个这个来试试看
级别: 精灵王
注册时间:
2003-01-10
在线时间:
1小时
发帖:
2981
只看该作者 10楼 发表于: 2008-02-18
正好要rip繁体。。。。无奈找不到繁体组件。。。。
级别: 圣骑士
注册时间:
2004-06-27
在线时间:
2小时
发帖:
1793
只看该作者 11楼 发表于: 2008-02-19

自裁
级别: 工作组
注册时间:
2003-08-26
在线时间:
13小时
发帖:
6600
只看该作者 12楼 发表于: 2008-02-19
老前辈!(眼泪汪汪

催片请点此处: http://bbs.popgo.org/bbs/read.php?tid=502402&displayMode=1#19103164
级别: 侠客
注册时间:
2001-11-21
在线时间:
0小时
发帖:
461
只看该作者 13楼 发表于: 2008-02-19
繁体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/6586690247092923
日文识别.rar
匿名提取文件连接 http://pickup.mofile.com/3450460086308631
韩文识别.rar
匿名提取文件连接 http://pickup.mofile.com/0440810023559326
简体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/2008820428172679

级别: 工作组
注册时间:
2004-11-14
在线时间:
0小时
发帖:
8093
只看该作者 14楼 发表于: 2008-02-19
comicviewer使用者来拜谢前辈

快速回复

限150 字节
上一个 下一个