搜索 社区服务 统计排行 帮助
  • 4370阅读
  • 21回复

东之伊甸与花季护航

楼层直达
wea
级别: 新手上路
注册时间:
2003-08-25
在线时间:
0小时
发帖:
185
最近那个软件应该所有人都知道了吧

关于图像识别技术
http://www.cnbeta.com/articles/86236.htm
=============
感谢匿名人士的投递
最近由于中国强制安装的一款软件带有色情图像检出功能,这方面的讨论在国内又热了起来。事实上,色情图像检测的研究已经有多年的历史,各大搜索引擎都带有或好或坏的色情图像检出功能(关于Google可参见:Large Scale Image-Based Adult-Content Filtering)。在进入CV领域之初,我也曾研究过一段时间的色情图像过滤技术,但是觉得单独而言没有太大的学术/商业前景而放弃了,要是知道会有4000万这样的单子,就研究下去了。

在90年代人们开始研究这一问题的时候,自然而然地会想到通过检测图像上人的相对位置和动作来获取图像的语义信息。但是,考虑到写Google那篇 文章的H.A.Rowley在98年才做出一个实用的人脸检测器,行人的检测到2004年后才有一些可以见人的结果,在当时要作出和Natal一样的动作 检测器真是太难了。

因此,90年代更有效的方法就是用颜色直方图来训练分类器,得到一些在实际生活中比乱猜好不了多少的结果。

用多了繁琐的颜色直方图和分类器之后,越来越多人意识到如果用颜色的话,色情图像的检测根本就不用分类器这么麻烦,或者说用个简单的分段函数就好了。这就是后来大家常用的肤色统计方法。正巧,这时候很多人也对肤色检测感兴趣了,于是又有了好多的通过肤色统计的色情图像检测法。

通过肤色检测只不过是直方图的一个简化,固有的问题还是没有解决,比如很多风景图片也有大块 的类肤色区域,况且还有肤色高光部分导致的漏判,还有大块人脸等。通过一个人脸检测器来过滤大块的人脸区域于是成了标配。引入更多的图像特征,比如纹理 等,也可以过滤掉一些误判的风景图像。根据提供给官方的谈判响应书说明,这家企业的色情图像过滤无非也是用了这样一些在2000年后成为标配的方法,可能还有一些形态学上进行处理的方法,加一起做出来的罢了。

大家都知道,现在我的兴趣也转向了局部特征描述子,当然了,现在也有一些用局部特征描述子的方法来解决这一问题。事实上,通过局部特征描述字应该是最接近通过语义解决这问题的方法了。当然,检测时间上仍然显得不划算。

另,很多人说国内的那款软件没有OpenCV的版权声明。其实,OpenCV的协议已经很宽松了,只需要含有版权声明就可,实在是很让人费解。

本文部分图片和内容从以下来源获得:
http://gandolf.homelinux.org/~smhanov/blog/?id=63
http://groups.google.com/group/pongba/browse_thread/thread/78095c0bd8a90fe6?hl=zh-CN
http://i.gizmodo.com/5282974/yes-but-which-48-points-does-project-natal-track
=============


上段时间还有一个识别动画人物发色的网站
还有最近e3 360的一段宣传片
http://www.tudou.com/programs/view/sukH7P_rJ18/
图像搜索技术现在是进步的,东之伊甸的用手机作客户端的c/s结构人肉搜索引擎绝不是天方夜谭,而类似的注释功能,google map已经大量应用,相信如果谁有人能将东之伊甸的概念实体话,谁就是下一个马云,NONONONO,是谢尔盖·布林

不要小看痴情男的经济实力,手上这两个已经价值过千!!!
级别: 侠客
注册时间:
2004-11-15
在线时间:
0小时
发帖:
460
只看该作者 21楼 发表于: 2009-06-13
引用
最初由 0 Haku 0 发布
那东西是完全感觉不到延迟的,可不是几秒捕捉一桢,或者用摄像头拍下来手动上传那种..........
现在3G视频通话不也就是那种清晰度和桢率吗,不足以作为提取信息用。

当然,实际中,哪怕1分钟用一次也已经可以商用了。毕竟采样多也要耗费计算单元的资源。


实际上伊甸系统还是有一定的(零点几秒吧)的延迟的

应该是先把图像分块,然后如果图像内区域的数量和相对位置没有变化的话就不向服务器发送新的请求吧。

N/A
级别: 骑士
注册时间:
2006-02-17
在线时间:
17小时
发帖:
888
只看该作者 20楼 发表于: 2009-06-13
级别: 风云使者
注册时间:
2002-09-03
在线时间:
227小时
发帖:
4007
只看该作者 19楼 发表于: 2009-06-13
引用
最初由 goodbear 发布
索爱的Track ID那玩意儿我经常用,觉得没LZ说的那么不堪吧……起码电台里听到的国语流行曲都能搜到,只是仅限于热门的曲子,冷门的曲子有时会搜不到。

但是这个idea非常好。Track ID并不是对整首曲子做搜索,而是采一段大约10s的样本提交到服务器,再由服务器将搜索结果返回到手机的浏览器里,告知这首曲子的名字,作者,专辑,还提供下载相关搜索等的服务。同理,图象搜索也不一定对整张图片做搜索,应该也是通过图片的某些样本或是特征做搜索。可以想象以后看到论坛上某人的签名,就可以搜索到签名图的来源大图,真美好啊。现在google还是通过关键字本搜索相关图片,有时得出的垃圾信息会非常多,非常希望这种技术能早日出现~

以图搜图的话现在 http://tineye.com/ 能做到
当然不是什么图都能搜到~但至少能
原理我是不懂~但有wiki一类的编辑功能

世界中に存する善きものすべてに感謝したい気持ちと共に、筆をおくことにしよう。
じゃ、お先に。
今 敏
我要怀着对世上所有美好事物的谢意,放下我的笔了。
我就先走一步了。
今 敏
级别: 骑士
注册时间:
2008-08-21
在线时间:
9小时
发帖:
1264
只看该作者 18楼 发表于: 2009-06-13
这个笑话……真的丢人了

みるな!見れば殺すよ。
hoh
级别: 精灵王
注册时间:
2008-04-28
在线时间:
166小时
发帖:
1153
只看该作者 17楼 发表于: 2009-06-13
现在愈发确定这玩艺儿是俩信息产业部内部人士骗了人民大众4000多万。跟年前那个雷锋片同出一折。

不对了,加起来有6000万。北京一个公司还拿了2000多万呢,做语言过滤。
hoh
级别: 精灵王
注册时间:
2008-04-28
在线时间:
166小时
发帖:
1153
只看该作者 16楼 发表于: 2009-06-13
其实用machine learning 的方法做比对不难,光比对一些很基本的参数,比如画面某个部分的灰度就可以做到很高的正确率。难的是把要鉴定的文件和learning 用的库map到一个可比较的空间。

比如你要鉴定一个人脸部表情。可能你学习库里的都是有各种表情的正面护照照片,但需要鉴定的是从各种角度拍的照片。直接比较当然会出错,于是需要把这各种角度的照片map到正面护照照的角度才能进行比较,而这个过程就很难了。

说实话大家认真了,据说这绿贝是个搞笑物,直接被当成流氓软件来的。
请看某怪叔叔的使用报告:
http://www.dapenti.com/blog/more.asp?name=xilei&id=20271
级别: 工作组
注册时间:
2002-09-14
在线时间:
4小时
发帖:
525
只看该作者 15楼 发表于: 2009-06-12
索爱的Track ID那玩意儿我经常用,觉得没LZ说的那么不堪吧……起码电台里听到的国语流行曲都能搜到,只是仅限于热门的曲子,冷门的曲子有时会搜不到。

但是这个idea非常好。Track ID并不是对整首曲子做搜索,而是采一段大约10s的样本提交到服务器,再由服务器将搜索结果返回到手机的浏览器里,告知这首曲子的名字,作者,专辑,还提供下载相关搜索等的服务。同理,图象搜索也不一定对整张图片做搜索,应该也是通过图片的某些样本或是特征做搜索。可以想象以后看到论坛上某人的签名,就可以搜索到签名图的来源大图,真美好啊。现在google还是通过关键字本搜索相关图片,有时得出的垃圾信息会非常多,非常希望这种技术能早日出现~

积积复积积,唔识就唔识。测验够刺激,居然无题识。上堂听唔识,捣乱多款式。自修一样识,睬佢都生积。
生系中国人,死系中国魂。要我学英文,梗系冇可能。英语唔合格,更显我性格。数学唔合格,老师负全责。语文唔合格,咁我冇办法。
考试考得好,全靠隔离好。考试考唔好,隔离唔识做。
日日返学愁更愁,老师讲野无离头。我就听到似梦游,次次批评无理由。功课多到似报仇,做野做到似捞头。
返学为左乜,日日被糟质。功课都系抄,一系就唔交。
返学等放学,放学饮可乐。打钟各自飞,就咁又一Day!!
级别: 侠客
注册时间:
2003-04-22
在线时间:
0小时
发帖:
318
只看该作者 14楼 发表于: 2009-06-12
天呢!

居然有人认为开发这个伟大的无以伦比的败家的东西实践了科技的进步!

一monitor
级别: 光明使者
注册时间:
2003-10-04
在线时间:
1062小时
发帖:
4088
只看该作者 13楼 发表于: 2009-06-12
绿坝那个应该叫 东之地狱 - -

如同优美的旋律能够洗涤人的心灵,
 哀伤的乐曲能够使人热泪盈眶,
     在某些时候,
[音乐]会对我们产生更大的影响。
级别: 圣骑士
注册时间:
2004-11-04
在线时间:
0小时
发帖:
2183
只看该作者 12楼 发表于: 2009-06-12
等出了人工智能那样的东西再来过滤吧,现在弄出来也只是闹笑话


===========================================
内裤袜天使/STAR DRIVER 輝きの银河囧少年/侵略!触手娘/心霊探偵 小野八云/水母姬/我的哥哥不可能那么萌
级别: 光明使者
注册时间:
2005-01-12
在线时间:
657小时
发帖:
7912
只看该作者 11楼 发表于: 2009-06-12
那东西是完全感觉不到延迟的,可不是几秒捕捉一桢,或者用摄像头拍下来手动上传那种..........
现在3G视频通话不也就是那种清晰度和桢率吗,不足以作为提取信息用。

当然,实际中,哪怕1分钟用一次也已经可以商用了。毕竟采样多也要耗费计算单元的资源。

[公事中]
wea
级别: 新手上路
注册时间:
2003-08-25
在线时间:
0小时
发帖:
185
只看该作者 10楼 发表于: 2009-06-12
http://mobile.dbw.cn/system/2008/03/06/051165881.shtml
针对上述“软肋”,Vodafone公司大胆提出了一种全新的搜索方式,即:用图片代替文字录入。据Vodafone展台的工作人员介绍,手机用户可以在搜索引擎界面调用摄像头功能,然后对自己感兴趣的人或物按一下快门键,照片就会自动传送到手机搜索引擎,搜索引擎会自动识别照片以及照片中出现的文字内容,然后按照相关程度筛选出所有包括该照片所含内容的图片新闻或其他信息,只需要眨眼的功夫,你就可以在自己的手机上阅读到了,而且一目了然。


不要小看痴情男的经济实力,手上这两个已经价值过千!!!
级别: 侠客
注册时间:
2004-03-31
在线时间:
0小时
发帖:
477
只看该作者 9楼 发表于: 2009-06-12
这4170万如果真的一点都没猫腻,楼主后悔没继续从事图像检测还有点意思
去看看外包任务的地盘,搞个图像检测,开价能开到两三万已经了不起死了
4000多万,呵呵呵呵呵

-F.L.Wirght
-le corbusier
-安藤忠雄
偶像啊偶像
wea
级别: 新手上路
注册时间:
2003-08-25
在线时间:
0小时
发帖:
185
只看该作者 8楼 发表于: 2009-06-12
引用
最初由 0 Haku 0 发布
科技是在进步的,不过当前看来,确实还很有距离。

相关的逻辑计算的瓶颈其实还不如普及化超级带宽无线网络大,如果东之伊甸是把信息发送到主机计算再返回的话。理论当然很难,但这世道最难搞的往往是如何应用。



信息发送到主机计算再返回结果这种多层数据库应用程序,这个已经狠狠很普及了,你的手机冲费,财务软件,大到可乐的调度系统都是这种结构,现在的网络带宽绝不是图片传送瓶颈,你发个彩信才有多久时间,而且在东之伊甸的概念,只需要在数据库返回相关string发给你就是了

有人用过索爱手机里带的TrackID软件吗??这个有异曲同工之妙,
http://www.sonyericsson.com/cws/support/phones/detailed/whatistrackid/p1c?lc=zh&cc=cn

不过我用过的经验就是效果还是很差,kokia的歌比较好认

还有所谓 信息正确性 这个问题对于一个公开任何人可编辑的信息平台是不存在的,如果存在这就是一个politics问题

不要小看痴情男的经济实力,手上这两个已经价值过千!!!
快速回复

限150 字节
上一个 下一个