查看完整版本: [-- [原创]IdxSubOcr v1.07 --]

『漫游』酷论坛 -> 『字幕制作交流区』 -> [原创]IdxSubOcr v1.07 [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

<<   1   2  >>  Pages: ( 2 total )

strnghrs 2008-02-17 21:32

[原创]IdxSubOcr v1.07

Version 1.07
错误修正:如果原始字幕文件有错,会中断退出。
错误修正:如果原始字幕文件信息有错,OCR后出现无时间轴的空白行,导致结果文件被截断。

Version 1.06
功能增强:加强繁简转换时的纠错能力。

Version 1.05
重写OCR后处理部分,减小文字错位、错行的概率。

Version 1.04
错误修正:如果字幕编号不是从0开始,则不能正常OCR。

Version 1.03
功能修正:对于Unknown的字幕语言,在提醒后允许继续OCR。

Version 1.02
功能修正:考虑到宽屏逐渐普及,初始界面不再最大化。
错误修正:界面缩小到正常大小时,“黑白图像”选项会被遮挡。

Version 1.01
错误修正:如果字幕第一行为空,则在“OCR选项”中,不能再选择文字颜色。

Version 1.00
提供字幕OCR、校对功能。
OCR采用MODI引擎,支持英文、简体中文、繁体中文、日文。

功能: 一个专门用来OCR(光学字符识别)Vobsub格式字幕的软件,能够将idx/sub格式的字幕转成srt格式,并提供srt格式校对功能。OCR引擎为微软Office 2003所带的Microsoft Office Document Imaging (MODI),支持英文、简体中文、繁体中文、日文。
动机: 目前已经有一些免费的字幕OCR软件,英文的可以用Subresync,中文的可以用SubOCR。但是在使用了这些软件后,我还是决定开发IdxSubOcr,理由如下:
希望能够使用方便性方面有所改善。Subresync自带的OCR引擎的识别率很棒,但是每次都要敲几十个字母实在太麻烦;而且还不支持中文、日文字符。
SubOCR实在太庞大,而且在某些机器上运行出错。

说明: 本软件的中文、日文识别结果为GBK字符,因此只能在支持GBK编码的环境下使用。一般Windows 2000/XP没有问题,Windows Me看运气,Windows 98多半不行。配置MODI以支持简体中文、繁体中文、英文的方法见《在简体中文Office 2003下OCR繁体中文、日文、韩文》:
http://www.comicer.com/stronghorse/water/software/officeocr.htm

官方网站免费下载:http://www.comicer.com/stronghorse/software/index.htm#IdxSubOcr

繁体中文、日文、韩文所需文件下载见第二页。网络存储,有效期不敢保证,要下请早。

alphaa 2008-02-17 21:55
好东西,谢谢分享~~

mattliu 2008-02-17 21:55
支持原创
试一下识别率如何

=================
试了几个
识别率相当不错了,我是装的Office 2007
subtosrt字库不全的也可以识别了
只是对空格检测的支持还不是很好,能改进一下就好了

SUBOCR的历史又翻过了一页[/ku]

softworm 2008-02-17 22:52
原来楼主就是传说中的编程牛人

好东东,支持一下

feelingmtg 2008-02-17 23:23
软件收下
正好有些要OCR的东西
拿去看看
感谢!

真宫寺一马 2008-02-18 19:34
又见老马了
话说,我现在还在用你那里的avi2jpg
我也是在你的帖子里才知道minidvd。一晃好多年过去了。

feelingmtg 2008-02-18 20:46
LS很久没出现过了
老前辈啊

openicq 2008-02-18 21:00
进来拜楼主的 Orz
(ComicsViewer是PC上看漫画最伟大的软件啊啊啊啊~)

dfdfdg 2008-02-18 22:10
拜老马……
看看效果如何,敲字库确实很痛苦
常用汉字2500,这回某片字库弄了快3500字。。。

雷鸣 2008-02-18 22:57
非常牛的软件。
subresync很痛苦,subocr经常出来奇怪的结果,载个这个来试试看

真宫寺一马 2008-02-18 23:30
正好要rip繁体。。。。无奈找不到繁体组件。。。。

gaoshu 2008-02-19 00:07
http://www.namipan.com/d/tradicn.rar/08fbfa83fe369bc68fb0a4ec3eb6516cce42e63a05ef5f00

繁体组件

MeteorRain 2008-02-19 00:25
老前辈!(眼泪汪汪

strnghrs 2008-02-19 08:21
繁体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/6586690247092923
日文识别.rar
匿名提取文件连接 http://pickup.mofile.com/3450460086308631
韩文识别.rar
匿名提取文件连接 http://pickup.mofile.com/0440810023559326
简体中文识别.rar
匿名提取文件连接 http://pickup.mofile.com/2008820428172679

chiman 2008-02-19 10:00
comicviewer使用者来拜谢前辈

真宫寺一马 2008-02-19 18:58
感谢
再次拜老马
=========================

测试繁体中文ocr。很强大。
完全省去了打字库的步骤,识别速度也很快。
不过不知道校对模式中怎么编辑文字。我用txt另外打开,配合替换功能。校对效率也不错。(主要错字比较少)

星之失 2008-02-19 20:45
用ComicViewer的晚辈前来膜拜。

大大好~

dfdfdg 2008-02-21 13:50
问题:
繁体中文支持文件已保存到
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0
注册表文件也已导入,但是打开繁体的sub,选择中文(繁体),ocr出来的只有时间没有文字?
这是什么原因

试过英文的字幕可以正常OCR,简中的一时还没找到例子,没法试

bomber1984 2008-02-21 16:57
在群里看到的时候已经未这个软件深深的折服,谢谢大大发片

MeteorRain 2008-02-21 17:33
引用
最初由 bomber1984 发布
在群里看到的时候已经未这个软件深深的折服,谢谢大大发片
发片……囧

真宫寺一马 2008-02-21 19:26
引用
最初由 dfdfdg 发布
问题:
繁体中文支持文件已保存到
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0
注册表文件也已导入,但是打开繁体的sub,选择中文(繁体),ocr出来的只有时间没有文字?
这是什么原因

试过英文的字幕可以正常OCR,简中的一时还没找到例子,没法试

颜色没选对?
我这里e文会发生这样的问题。好在e文字数比较少。就用vobsub了

openicq 2008-02-21 23:27
引用
最初由 dfdfdg 发布
问题:
繁体中文支持文件已保存到
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0
注册表文件也已导入,但是打开繁体的sub,选择中文(繁体),ocr出来的只有时间没有文字?
这是什么原因

试过英文的字幕可以正常OCR,简中的一时还没找到例子,没法试

先确定是否有字幕 用subresync打开看看
有些DVD的字幕抽出来只有时间没有字幕....
之前kingking给我的字幕就有这个问题 比如高機動幻想第二部

dfdfdg 2008-02-22 00:07
字幕是有的,我都ocr好了的=w=

高机动2啊....曼迪字幕吗,好想要(连RAW= =)..

kiasushou 2008-02-23 19:28
難得達人來 膜拜 comicviewer 我3年來一直在用^^

txbbqq 2008-02-26 00:03
膜拜大大......神一般的人物

熊熊*揍敌客 2008-02-27 14:56
神贴留爪,拜老马前辈~

SoMaster 2008-03-04 16:47
请问有方法可以不用装office也可以用modi吗?
因为我在用openoffice
用m$的office实在太慢了

strnghrs 2008-08-24 11:01
有需要的请升级至v1.01

dfdfdg 2008-08-24 13:34
报个错吧
有时会碰到ocr的内容连续几行错行

还有这种错误:

瑪拉聽到|笑死人了|就會跳盤|不由自主)

上面这个正确的内容是 瑪拉聽到搖滾樂就會跳舞|笑死人了(身體不由自主)

Galaxy001 2008-08-26 00:40
用ComicViewer的晚辈前来膜拜+1

大大咋不出个解图片pdf的工具?

————————————————
为啥不支持Office2007 ?

暗影翔 2008-08-26 09:27
膜拜老马,感谢你的制作的好用的软件

strnghrs 2008-08-26 09:39
引用
最初由 Galaxy001 发布
用ComicViewer的晚辈前来膜拜+1

大大咋不出个解图片pdf的工具?

————————————————
为啥不支持Office2007 ?

你想怎么解PDF?UnicornViewer已经支持PDF了。
Office2007缺省不安装MODI,需要手工安装。

mot 2008-09-01 09:12
收下试用试用,感谢LZ的分享..

Galaxy001 2008-09-03 22:52
比如,对全是图片的pdf,我想解出图片用ComicViewer之类的软件看。
或者说,我想忽视pdf的文字(比如文字做的“软”水印),直接看图片。
记得你做过图片包pdf的工具,我想要反过来的,最好jpeg2000的也直接导出为.jp2文件。

Office2007的OCR我用了,是正常的。

UnicornViewer,你网站上没……

feifeiyu_cn 2008-12-11 04:18
经常发生识别错行情况,最好避免这种情况,或者至少增加批量平移OCR结果的功能

jerry07 2008-12-14 18:02
是..錯行問題嚴重..最好是有插入刪除...但不要影響時間軸..
還有網頁被刪了嗎?...找不到了

strnghrs 2009-03-22 07:47
有需要的请自行升级至v1.04

strnghrs 2009-03-29 12:28
引用
最初由 feifeiyu_cn 发布
经常发生识别错行情况,最好避免这种情况,或者至少增加批量平移OCR结果的功能

请升级至v1.05

jackswei 2009-04-10 18:17
我是繁體系統+0ffice2007 在用idxsubocr v1.05時,遇到有英文字就會跳出錯誤,整個程式就關了,請問有人會這樣嗎 中文字與英文字共存 ocr 感謝

srta 2009-04-28 21:48
07+简体XP OCR开始2句就弹出错误关闭~~~苦恼

q215 2009-05-10 01:43
谢谢朋友的好软件。不过,我使用时,识别出来的字幕十分错乱,即:不准确,连30/100都不到,不知何故?原影片sub字幕是繁中,而我安装Office2007是简中,是这个原因吗?

真宫寺一马 2009-05-10 13:13
繁体你得装繁体的modi包

9500159178 2009-05-10 14:48
能否给个繁体组件下载~~~
之前的链接好像都失效了

q215 2009-05-10 15:12
谢真宫寺一马朋友的回复。繁体的modi包已经装了,选中繁体点确定后,系统提示不支持你所选的ocr语言,请更正。莫非要换繁中操作系统才行,是否如此。

264768502 2009-05-10 17:24
注册表里添加过信息了么

q215 2009-05-10 22:22
注册表里添加过信息了

goodzone 2009-06-11 11:02
谢谢了!终于在这找到日语补丁了
日语里的识别还是有些错误,但总的来说已经很强大了!!!!!

talent1988 2009-10-16 08:29
搜索了这么久终于看到希望了


组件啊!!

谢谢

talent1988 2009-10-16 08:41
可以用了


奇怪昨天怎么都用不了呢~~~

怪事

午后の红茶 2009-10-17 18:17
很奇怪呀,繁体中文识别也添加了,最后的srt文件里只有时间轴,没有文字,用的1.05版


查看完整版本: [-- [原创]IdxSubOcr v1.07 --] [-- top --]


Powered by phpwind v8.5 Code ©2003-2011 phpwind
Time 0.053107 second(s),query:3 Gzip disabled