东之伊甸与花季护航|『动漫主题讨论区』 - 『漫游』酷论坛 - 移动设备版

『漫游』酷论坛>『动漫主题讨论区』>东之伊甸与花季护航

东之伊甸与花季护航

wea@2009-06-12 11:19

最近那个软件应该所有人都知道了吧

关于图像识别技术
http://www.cnbeta.com/articles/86236.htm
=============
感谢匿名人士的投递
最近由于中国强制安装的一款软件带有色情图像检出功能，这方面的讨论在国内又热了起来。事实上，色情图像检测的研究已经有多年的历史，各大搜索引擎都带有或好或坏的色情图像检出功能（关于Google可参见：Large Scale Image-Based Adult-Content Filtering）。在进入CV领域之初，我也曾研究过一段时间的色情图像过滤技术，但是觉得单独而言没有太大的学术/商业前景而放弃了，要是知道会有4000万这样的单子，就研究下去了。

在90年代人们开始研究这一问题的时候，自然而然地会想到通过检测图像上人的相对位置和动作来获取图像的语义信息。但是，考虑到写Google那篇文章的H.A.Rowley在98年才做出一个实用的人脸检测器，行人的检测到2004年后才有一些可以见人的结果，在当时要作出和Natal一样的动作检测器真是太难了。

因此，90年代更有效的方法就是用颜色直方图来训练分类器，得到一些在实际生活中比乱猜好不了多少的结果。

用多了繁琐的颜色直方图和分类器之后，越来越多人意识到如果用颜色的话，色情图像的检测根本就不用分类器这么麻烦，或者说用个简单的分段函数就好了。这就是后来大家常用的肤色统计方法。正巧，这时候很多人也对肤色检测感兴趣了，于是又有了好多的通过肤色统计的色情图像检测法。

通过肤色检测只不过是直方图的一个简化，固有的问题还是没有解决，比如很多风景图片也有大块的类肤色区域，况且还有肤色高光部分导致的漏判，还有大块人脸等。通过一个人脸检测器来过滤大块的人脸区域于是成了标配。引入更多的图像特征，比如纹理等，也可以过滤掉一些误判的风景图像。根据提供给官方的谈判响应书说明，这家企业的色情图像过滤无非也是用了这样一些在2000年后成为标配的方法，可能还有一些形态学上进行处理的方法，加一起做出来的罢了。

大家都知道，现在我的兴趣也转向了局部特征描述子，当然了，现在也有一些用局部特征描述子的方法来解决这一问题。事实上，通过局部特征描述字应该是最接近通过语义解决这问题的方法了。当然，检测时间上仍然显得不划算。

另，很多人说国内的那款软件没有OpenCV的版权声明。其实，OpenCV的协议已经很宽松了，只需要含有版权声明就可，实在是很让人费解。

本文部分图片和内容从以下来源获得：
http://gandolf.homelinux.org/~smhanov/blog/?id=63
http://groups.google.com/group/pongba/browse_thread/thread/78095c0bd8a90fe6?hl=zh-CN
http://i.gizmodo.com/5282974/yes-but-which-48-points-does-project-natal-track
=============

上段时间还有一个识别动画人物发色的网站
还有最近e3 360的一段宣传片
http://www.tudou.com/programs/view/sukH7P_rJ18/
图像搜索技术现在是进步的，东之伊甸的用手机作客户端的c/s结构人肉搜索引擎绝不是天方夜谭，而类似的注释功能，google map已经大量应用，相信如果谁有人能将东之伊甸的概念实体话，谁就是下一个马云，NONONONO,是谢尔盖·布林

cccp127@2009-06-12 11:48

话说伊甸那手机。。。岂非就是所谓的“云计算”。。。

lx007@2009-06-12 11:53

以现在的技术力是达不到

不过在可以预见的未来不是不可能

是这个意思吧？

0 Haku 0@2009-06-12 12:26

目前为止绿坝娘还只能是个脑残，据说加菲猫的图片都会被当成是裸体照片............

9616777@2009-06-12 12:30

绿坝娘很好的，你们不要黑她

对了，其实目前距离东之伊甸那样的程度还差多远？

0 Haku 0@2009-06-12 12:33

科技是在进步的，不过当前看来，确实还很有距离。

相关的逻辑计算的瓶颈其实还不如普及化超级带宽无线网络大，如果东之伊甸是把信息发送到主机计算再返回的话。理论当然很难，但这世道最难搞的往往是如何应用。

lx007@2009-06-12 12:35

引用
最初由 9616777 发布
绿坝娘很好的，你们不要黑她

对了，其实目前距离东之伊甸那样的程度还差多远？

纯转

放到现实里，或许可以叫做“人的wiki”，在天朝大概会叫做“人肉搜索台”。

做出这个东西大概需要啥技术呢。

最一般的wiki架构。一套图形识别系统。足够了。wiki上，伊甸所存放的数据量大概和wikipedia相近，甚至可能会更少一些。现有技术完全ok。图形识别系统，这个比较麻烦，能够准确的辨认出不只是人脸的各种物体的特征，现在或许有这个技术的基础，不过还需要继续发展，但总之，还是可行的。

实际上伊甸系统最关键的部件是人。如何能带动一批用户主动地提供他人的信息。另一个就是隐私侵犯的避免和信息正确性的监管。嗯，这些技术外的东西是更困难的。认真考虑的话，一群neet搞出来的系统，不太可能会带动一批人去填信息。

不过有意思的是，如果现实真存在这么个系统，会有多少人用它，多少人抵制它。

9616777@2009-06-12 12:40

引用
最初由 lx007 发布

纯转

放到现实里，或许可以叫做“人的wiki”，在天朝大概会叫做“人肉搜索台”。

做出这个东西大概需要啥技术呢。

最一般的wiki架构。一套图形识别系统。足够了。wiki上，伊甸所存放的数据量大概和wikipedia相近，甚至可能会更少一些。现有技术完全ok。图形识别系统，这个比较麻烦，能够准确的辨认出不只是人脸的各种物体的特征，现在或许有这个技术的基础，不过还需要继续发展，但总之，还是可行的。

实际上伊甸系统最关键的部件是人。如何能带动一批用户主动地提供他人的信息。另一个就是隐私侵犯的避免和信息正确性的监管。嗯，这些技术外的东西是更困难的。认真考虑的话，一群neet搞出来的系统，不太可能会带动一批人去填信息。

不过有意思的是，如果现实真存在这么个系统，会有多少人用它，多少人抵制它。

WIKI和这个不一样吧
图片会涉及到私隐问题的几率非常之高啊。。。。。。

wea@2009-06-12 13:15

引用
最初由 0 Haku 0 发布
科技是在进步的，不过当前看来，确实还很有距离。

相关的逻辑计算的瓶颈其实还不如普及化超级带宽无线网络大，如果东之伊甸是把信息发送到主机计算再返回的话。理论当然很难，但这世道最难搞的往往是如何应用。

信息发送到主机计算再返回结果这种多层数据库应用程序，这个已经狠狠很普及了，你的手机冲费，财务软件，大到可乐的调度系统都是这种结构，现在的网络带宽绝不是图片传送瓶颈，你发个彩信才有多久时间，而且在东之伊甸的概念，只需要在数据库返回相关string发给你就是了

有人用过索爱手机里带的TrackID软件吗？？这个有异曲同工之妙，
http://www.sonyericsson.com/cws/support/phones/detailed/whatistrackid/p1c?lc=zh&cc=cn

不过我用过的经验就是效果还是很差，kokia的歌比较好认

还有所谓信息正确性这个问题对于一个公开任何人可编辑的信息平台是不存在的，如果存在这就是一个politics问题

Schatten@2009-06-12 14:52

这4170万如果真的一点都没猫腻，楼主后悔没继续从事图像检测还有点意思
去看看外包任务的地盘，搞个图像检测，开价能开到两三万已经了不起死了
4000多万，呵呵呵呵呵

wea@2009-06-12 15:38

http://mobile.dbw.cn/system/2008/03/06/051165881.shtml
针对上述“软肋”，Vodafone公司大胆提出了一种全新的搜索方式，即：用图片代替文字录入。据Vodafone展台的工作人员介绍，手机用户可以在搜索引擎界面调用摄像头功能，然后对自己感兴趣的人或物按一下快门键，照片就会自动传送到手机搜索引擎，搜索引擎会自动识别照片以及照片中出现的文字内容，然后按照相关程度筛选出所有包括该照片所含内容的图片新闻或其他信息，只需要眨眼的功夫，你就可以在自己的手机上阅读到了，而且一目了然。

0 Haku 0@2009-06-12 16:29

那东西是完全感觉不到延迟的，可不是几秒捕捉一桢，或者用摄像头拍下来手动上传那种..........
现在3G视频通话不也就是那种清晰度和桢率吗，不足以作为提取信息用。

当然，实际中，哪怕1分钟用一次也已经可以商用了。毕竟采样多也要耗费计算单元的资源。

神贺银夜@2009-06-12 18:31

等出了人工智能那样的东西再来过滤吧，现在弄出来也只是闹笑话

NT-001@2009-06-12 22:16

绿坝那个应该叫东之地狱 - -

h2so4@2009-06-12 22:39

天呢！

居然有人认为开发这个伟大的无以伦比的败家的东西实践了科技的进步！

一monitor

«12 »共2页

| TOP