『漫游』酷论坛>『字幕制作交流区』>[另外的异想天开]关于 ..

[另外的异想天开]关于语音自动识别等等

S.Asuka.L@2005-12-06 21:57

第一个瞎想

是关于抄写字幕
。。。貌似字幕总是出现在某一个固定位置。
在这个固定位置取一个NxN的方框,把它的颜色进行平均处理。
看白色所占的比率达于某个常数。。就认为是字幕的开始。。
不知道这样能不能说明白。


第二个瞎想

关于分析波谱
。。。既然人声识别很困难,能不能把声音的波谱截下来,
把对比度调整得很高,能不能用类似ocr的方式识别时间轴。。


纯粹瞎想。。。
引用

h2o2shadow@2005-12-07 00:58

声音做时间已经很常用了吧
引用

不败的魔术师@2005-12-07 10:17

搂住说的是自动..

再搭配个语言识别系统就完美了

把RAW扔进去 睡觉

然后起来 什么都有了- -
引用

Sygen@2005-12-07 15:37

记得以前IBM出过一个语音输入系统,错误率还是比较高的……
引用

dizyh@2005-12-07 15:56

语音输入,OFFICE2003已经很好了。

前提是多多朗读给电脑听,最好标标准准的普通话,咬字一定要清楚。

尤其是语音控制打开菜单时比较好玩~~
引用

MeteorRain@2005-12-07 19:41

根据图像的时间轴自动识别已经可以了。
引用

kutinasi@2005-12-08 22:54

楼上好厉害
引用

ArchonXP1412+@2005-12-09 20:12

第一个瞎想MS也有啊,原理和LZ说的差不多
忘记软件叫什么名字了
引用

东方不败2@2005-12-10 18:09

语音输入 在 office xp 就有,不过错误率较高,但输入政治性文章错误率非常低,我照着政治书读了一段文字,没错几个,其他的就不行了,office 2003 应该会更好些,不过没用过,机器太破了,不过语音输入打开 菜单真的是很厉害的!
引用

MeteorRain@2005-12-11 17:34

现在第一个方案已经实现出来了,不过还是有些小问题。
比如效率上的,另外而且只能识别白色字幕……
接下来还要继续研究……
引用

S.Asuka.L@2005-12-13 16:40

....晚出生了几年。。。
引用

S.Asuka.L@2005-12-13 16:41

引用
最初由 东方不败2 发布
语音输入 在 office xp 就有,不过错误率较高,但输入政治性文章错误率非常低,我照着政治书读了一段文字,没错几个,其他的就不行了,office 2003 应该会更好些,不过没用过,机器太破了,不过语音输入打开 菜单真的是很厉害的!

其实是图像识别。。。看光谱。。。
引用

S.Asuka.L@2005-12-13 17:22

研究显示,大部分人的说话频率介于65Hz到600Hz之间

奉上某些实验产品。大家看着办。。
http://rierie.miyahost.com/sample.rar
引用

Galaxy001@2005-12-13 20:00

引用
最初由 MeteorRain 发布
现在第一个方案已经实现出来了,不过还是有些小问题。
比如效率上的,另外而且只能识别白色字幕……
接下来还要继续研究……


哪个软件?我想试试。
引用

hfhfg@2006-06-04 02:02

引用
最初由 MeteorRain 发布
根据图像的时间轴自动识别已经可以了。

什么软件?叫什么名?
引用

«12»共2页

| TOP