搜索 社区服务 统计排行 帮助
  • 3126阅读
  • 15回复

[另外的异想天开]关于语音自动识别等等

楼层直达
级别: 侠客
注册时间:
2005-01-15
在线时间:
0小时
发帖:
490
第一个瞎想

是关于抄写字幕
。。。貌似字幕总是出现在某一个固定位置。
在这个固定位置取一个NxN的方框,把它的颜色进行平均处理。
看白色所占的比率达于某个常数。。就认为是字幕的开始。。
不知道这样能不能说明白。


第二个瞎想

关于分析波谱
。。。既然人声识别很困难,能不能把声音的波谱截下来,
把对比度调整得很高,能不能用类似ocr的方式识别时间轴。。


纯粹瞎想。。。

架设论坛我在行.....apache+mySQL+ipb+php
级别: 工作组
注册时间:
2005-01-15
在线时间:
0小时
发帖:
1729
只看该作者 1楼 发表于: 2005-12-07
声音做时间已经很常用了吧

级别: 风云使者
注册时间:
2002-09-11
在线时间:
0小时
发帖:
4791
只看该作者 2楼 发表于: 2005-12-07
搂住说的是自动..

再搭配个语言识别系统就完美了

把RAW扔进去 睡觉

然后起来 什么都有了- -

人間五十年 下天のうちをくらぶれば 夢幻の如くなり 一度生を得て 滅せぬ者のあるべきか
服务器 ftp://txxz.share.comic.cn 用户名:txxz 密码:share 1线50K可LIST以上服务器提供TX作品下载 有需要而上面没的请PM我 感谢漫网提供服务器
本社聊天催片OX群:10042749 欢迎插入 重口味满载!
级别: 精灵王
注册时间:
2001-11-21
在线时间:
32小时
发帖:
2196
只看该作者 3楼 发表于: 2005-12-07
记得以前IBM出过一个语音输入系统,错误率还是比较高的……
级别: 侠客
注册时间:
2005-04-09
在线时间:
0小时
发帖:
412
只看该作者 4楼 发表于: 2005-12-07
语音输入,OFFICE2003已经很好了。

前提是多多朗读给电脑听,最好标标准准的普通话,咬字一定要清楚。

尤其是语音控制打开菜单时比较好玩~~

僧:风吹树动
佛:心动树动
切,把佛拖出去斩了

竹与笛:http://www.dizyh.cn/

中国不能用《帽儿山的鬼子兵》这个动漫恶搞日本,否则就是“无耻”、“弱智”、“对不起抗战”、“污蔑智商”。
以上这些帽子通通属于恶搞小日本的愤青;
中国应该拍二战战败的小日本“蝗军高大威猛,战无不胜”的高大全形象。
中国恶搞小日本有些东西可以拿来恶搞,将另一些东西拿出来搞笑却未必可取。
例如不可以恶搞那个“桃太郎”不是日本人,但可以说其实他是中国派过去拯救日本于鬼世界的英雄。
例如中国不可以恶搞“日本人的身高真的很矮。”但可以说其实他们通通应该是10米高的巨人。
例如中国不可以恶搞《源氏物语》其实是中国的一个和尚写的,但可以说其实《源氏物语》后来被“紫式部”这个“人妖”抄袭。

另外呢——

小日本有必要把“三国群雄”全部恶搞成Q版女。
小日本有责任把《红楼梦》恶搞成妓院风云。等等等等……
小日本恶搞中国,那是对中国的赞美。是地球的礼赞,是宇宙的荣幸。

这些都是神论呀!神论!还是扯淡级的!我要说“小日本、网奸、网特、媚日分子,你们其实可以无耻到更高的境界呀!”^0^

“民主法西斯主义!民主法西斯主义!民主法西斯主义!布什立功了,布什立功了!他伟大而前瞻地提出了‘伊斯兰法西斯主义’概念,不给希望地球和平的国家和组织以任何藉口!伟大的美利坚合从国的领导人,他继承了‘做我帮凶者、给我石油就是民主;不从我者,违抗美国就是无赖邪恶轴心国’的美国的光荣的民主法西斯主义传统,成为了民主法西斯主义概念诞生的伟大素材!”

“希特勒、东条英机、墨索里尼、小泉纯一郎在这一刻灵魂附体,布什他代表了人类恐怖主义和地球恐怖主义悠久的历史和传统,这一刻他不是一个人在战斗!他不是一个!”

“这个胜利属于美国,属于布什,属于希特勒,属于墨索里尼,属于东条英机,属于查了多年没见查出伊拉克有大规模杀伤性武器的国际原子能机构,属于所有热爱玩民主法西斯的人!属于宇宙恐怖主义的胜利!”


东京大三光得选楼最多的地段,使最糙的炸弹,用国产轰炸机!弹头上捆一哈日族,染金毛特猥琐那种,一起飞甭管有事没事都让丫嚷嚷:“下回再不当汉奸!”一口地道的东京腔,倍儿带劲!周围战友不是炸议会就是炸内阁,你要炸一民房,都不意思跟人打招呼!你说这样下来一天得死多少小日本儿?我觉得怎么着也得两百万吧?两百万?那是郊区!四百万起!您得理解日本军国主义的冥顽不化!愿意死两百万小日本儿的日本,根本不在乎多死两百万!咱们的口号是:不求精确,但求精光!
级别: 工作组
注册时间:
2003-08-26
在线时间:
13小时
发帖:
6600
只看该作者 5楼 发表于: 2005-12-07
根据图像的时间轴自动识别已经可以了。

催片请点此处: http://bbs.popgo.org/bbs/read.php?tid=502402&displayMode=1#19103164
级别: 工作组
注册时间:
2001-11-21
在线时间:
0小时
发帖:
2314
只看该作者 6楼 发表于: 2005-12-08
楼上好厉害
级别: 新手上路
注册时间:
2004-06-22
在线时间:
0小时
发帖:
86
只看该作者 7楼 发表于: 2005-12-09
第一个瞎想MS也有啊,原理和LZ说的差不多
忘记软件叫什么名字了
级别: 圣骑士
注册时间:
2003-06-20
在线时间:
4小时
发帖:
2437
只看该作者 8楼 发表于: 2005-12-10
语音输入 在 office xp 就有,不过错误率较高,但输入政治性文章错误率非常低,我照着政治书读了一段文字,没错几个,其他的就不行了,office 2003 应该会更好些,不过没用过,机器太破了,不过语音输入打开 菜单真的是很厉害的!
级别: 工作组
注册时间:
2003-08-26
在线时间:
13小时
发帖:
6600
只看该作者 9楼 发表于: 2005-12-11
现在第一个方案已经实现出来了,不过还是有些小问题。
比如效率上的,另外而且只能识别白色字幕……
接下来还要继续研究……

催片请点此处: http://bbs.popgo.org/bbs/read.php?tid=502402&displayMode=1#19103164
级别: 侠客
注册时间:
2005-01-15
在线时间:
0小时
发帖:
490
只看该作者 10楼 发表于: 2005-12-13
....晚出生了几年。。。

架设论坛我在行.....apache+mySQL+ipb+php
级别: 侠客
注册时间:
2005-01-15
在线时间:
0小时
发帖:
490
只看该作者 11楼 发表于: 2005-12-13
引用
最初由 东方不败2 发布
语音输入 在 office xp 就有,不过错误率较高,但输入政治性文章错误率非常低,我照着政治书读了一段文字,没错几个,其他的就不行了,office 2003 应该会更好些,不过没用过,机器太破了,不过语音输入打开 菜单真的是很厉害的!

其实是图像识别。。。看光谱。。。

架设论坛我在行.....apache+mySQL+ipb+php
级别: 侠客
注册时间:
2005-01-15
在线时间:
0小时
发帖:
490
只看该作者 12楼 发表于: 2005-12-13
研究显示,大部分人的说话频率介于65Hz到600Hz之间

奉上某些实验产品。大家看着办。。
http://rierie.miyahost.com/sample.rar

架设论坛我在行.....apache+mySQL+ipb+php
级别: 工作组
注册时间:
2004-11-01
在线时间:
14小时
发帖:
2615
只看该作者 13楼 发表于: 2005-12-13
引用
最初由 MeteorRain 发布
现在第一个方案已经实现出来了,不过还是有些小问题。
比如效率上的,另外而且只能识别白色字幕……
接下来还要继续研究……


哪个软件?我想试试。

[url=ed2k://|friend|[CHN%5D[eDtoon%5D[PPG_FW%5D[VeryCD%5DGalaxy|D46F9E727D0ED77EDA09D21C55386F57|/]点击这里可以把我加入emule好友名单[/url]

#DEEBEA #F6FAFA
还是挂小图,...[:o]
级别: 新手上路
注册时间:
2005-06-30
在线时间:
0小时
发帖:
112
只看该作者 14楼 发表于: 2006-06-04
引用
最初由 MeteorRain 发布
根据图像的时间轴自动识别已经可以了。

什么软件?叫什么名?



字幕制作特效交流:
http://beta.verycd.com/groups/sub/
快速回复

限150 字节
上一个 下一个