搜索 社区服务 统计排行 帮助
  • 3156阅读
  • 18回复

[新闻]利用GPU進行 HD影像編碼 9600GT不需50分鐘 3GHz四核要5小時

楼层直达
级别: 圣骑士
注册时间:
2002-06-13
在线时间:
0小时
发帖:
1639
利用GPU進行 HD影像編碼
9600GT不需50分鐘 3GHz四核要5小時

http://www.hkepc.com/?id=1212&fs=c1hp


http://news.mydrivers.com/1/107/107237.htm

據 Elemental Technologies 執行長 Sam Blackman 指出, 以 2 小時的影像為例,儘管用家採用高階的 3GHz Quad - Core CPU , HD 編碼仍需要 5 小時,甚至最長時間,若用家擁有支援 CUDA 平台的繪圖卡,以 GeForce 9600GT 為例,編碼可減少至只需 50 分鐘,甚至更少。


不知道某風宅曾經跟我說可以同時decode 100個1080p HD的PS3 能不能打敗他 [/TX] 風宅快醒醒吧~~~:D Cell這麼行的話就不需要還找NV設計RSX囉.
RSX(約7600GS)+Cell 的性能(綜合約7800GTX)拼不過一張9600GT的:D


不過我是比較期待CUDA 的 M$ SQL/MySQL加速Driver能免費放出 :D 這類涉及商用的加速Driver目前授權費都很貴 :D
還有廠商吹牛很久的CUDA非對稱架構不知道能不能兌現[/KH]
( 例如你買了GT200 , 你淘汰的8800GTS可以專門CUDA用 )


當然 , 要享受新一代怪物GT200-30代價是 $600+ .... 單位是美金 ....[/ku]
CUDA的話9800GTX是可以考慮( GT200-20出來後會值崩 ) , 不過至今沒有HDMI1.3 (雖然spec中有支援,但廠商都省錢只做1.2)是致命傷 .

事業心得-

和低層次的人談論高層次的事情,是天下最蠢的事情之一。
级别: 精灵王
注册时间:
2005-12-24
在线时间:
45小时
发帖:
2298
只看该作者 18楼 发表于: 2008-06-01
那个实验跑的是断层扫描,应该还属于视频多媒体的方面吧。
那还是GPU的专长

在长长地换硬件的道路上,纠结前进中
级别: 圣骑士
注册时间:
2002-06-13
在线时间:
0小时
发帖:
1639
只看该作者 17楼 发表于: 2008-06-01
引用
最初由 roozhou 发布


DS是不会去做这个的,别的人在做,不过做完还是不是x264还开不开源就不知道的。


沒辦法 , CUDA我來寫一定也是為商業非開源項目來寫 :D 投資報酬率的問題阿. 最近忙著搞LINQ , 不知道有沒有辦法query M$ SQL 2005時候自己用CUDA來算 .( 省的錢當然就 .... [/TX] )

事業心得-

和低層次的人談論高層次的事情,是天下最蠢的事情之一。
级别: 圣骑士
注册时间:
2002-06-13
在线时间:
0小时
发帖:
1639
只看该作者 16楼 发表于: 2008-06-01
引用
最初由 hellsingd 发布
现在放出的资料很可疑...炒作的可能很高..就上LS们说的wht codec...wht cores...而PS3是CELL+RSX+XDR 单CELL本就是个和GPU一样两极分化的产物 编程及优化极其困难 但在多媒体计算领域是王者 RSX也只是做个辅助作用而已 "RSX(約7600GS)+Cell 的性能(綜合約7800GTX)"??? 回答是NO...实际做出程序进行并行比较来的效果谁都不知道...另外CELL处理器的功率是多少 您知道吗...20W...现在流行的NV系显卡呢???


更新一下 , CUDA 2.0實現了之前的承諾 .
也已經有RD完成了.
http://www.cnbeta.com/articles/56943.htm
四張9800GX2來跑CUDA:D

1.CUDA不是炒作 , 是真的有龐大的經濟效益在 , 我老弟有用CUDA1.0開發過熱分析 . 可以省下大量購買昂貴CPU+MB的錢就能達到同樣的性能. 當然正如你說的 , 這是需要軟體開發成本 , 你得自己動手寫 , 要不就乖乖買昂貴的寫好的Driver .

2.你的Cell功率數據不對吧 , 新版本的PS3雖然已經省電不少但是看BD也整機耗電要150W , 你覺得Cell貢獻了多少 ? 我有一台服務器 AMD 4400+780G+4 HD 拿儀器測才50W , Full Load也過不80W.(故意讓他跑3D,跑1080p影片)

3.你說實際的效率問題 , 這的確是硬體最深奧的課題 , 實是上這就是Cell致命傷所在 , 很多開發商說Cell是閉門造車的產物 , 抱怨設計者一定沒有大量測試大型實作程序 . 你多注意一下PS3架構 , 事實上RSX才是負責PS3圖形的主軸 . 你知道為何Intel的Core架構如此成功嗎 ? 狠狠甩開 K10 , 因為他們針對大量程式碼的實作測試來調整架構 (事實上K10在平行處理還有虛擬化的性能遠超過Core架構 , 問題是這些東西一般低階用途用不到 , 看看Core的Xeon VS K10的Opteron就能理解 ) , Cell並沒有這麼作 , 礙於遊戲機售價RSX又不可能spec弄得多強 , 成本考量下遊戲機用的Cell也是精簡過的 , 因此你看現在PS3實作出來的遊戲畫面就是那個樣子 , 整台機器水準也不過和XB360半斤八兩 . .........不過其實說真的 Cell 規格一點都不驚人,不信拿Intel Q6600的Spec細節比一下 ... 如果Cell 8SPE叫8核心的話 , 那Q6600裡面全部運算單元加起來不知道該叫做幾核心...

不過PS3拿來玩玩AVC-HD是挺不錯的 , 灰塵積了很久也終於找到他的用途了 ......:D

PS.其實我是覺得$ONY有時候很沒商業頭腦 , 何不乾脆跟日本現行AC機台一樣通通改走x86 PC Base ..... 看看SF4才那樣的PC硬體就能有那樣的畫面 ...

===轉貼功耗參考===
65nm 的 40gb 剛出來時玩家有做過耗電比較如下
歡迎自行測量比較
(國外叫 Kill-a-watt, 跟開版的裝置是一樣的)
source: electrimetric.blogspot.com
===============
新版 PS3 (40GB bought 11/2/07)
關機: 0 watts
開機: 135-136 (max 144)
XMB選單: 139-140
Resistance Fall of Man: Cut scenes: 137-138
Playing first level of RFOM: 144-150 (mostly 147-149, peaked at 155)
RFOM paused: 134
撥放 Bluray (SWAT ch 16) 134
30x 快轉 134
Bluray 暫停 133
Folding @ home* 157
Web page loading sony store page 135-138

新版 Xbox360 (lot 737, 三核心, 65nm 製程)
關機 - 2 watts
Xbox live active download 95
開機 102-109
media center 暫停 100
media center 撥放 100-105
loading halo 3 104-106 (max 111)
halo 3 campaign 126-132 (tsavo highway legendary rally point alpha)
halo 3 暫停 129-131
multiplayer 116-124 (most commonly in range of 116-118)

舊版 Xbox360 (90nm original motherboard)
Off 1-2 watts
全速 measured 162
project gotham racing 開場 145
==================

事業心得-

和低層次的人談論高層次的事情,是天下最蠢的事情之一。
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 15楼 发表于: 2008-05-30
引用
最初由 littlemouse 发布
技术发展是好事。
但没有实物之前,对我们使用者来说都是虚的。
坐等Dark Shikari出支持GPU的加速版x264。
也等GPU加速版avisynth


DS是不会去做这个的,别的人在做,不过做完还是不是x264还开不开源就不知道的。
级别: 新手上路
注册时间:
2007-11-22
在线时间:
0小时
发帖:
117
只看该作者 14楼 发表于: 2008-05-30
技术发展是好事。
但没有实物之前,对我们使用者来说都是虚的。
坐等Dark Shikari出支持GPU的加速版x264。
也等GPU加速版avisynth
级别: 新手上路
注册时间:
2006-06-10
在线时间:
0小时
发帖:
63
只看该作者 13楼 发表于: 2008-05-29
现在放出的资料很可疑...炒作的可能很高..就上LS们说的wht codec...wht cores...而PS3是CELL+RSX+XDR 单CELL本就是个和GPU一样两极分化的产物 编程及优化极其困难 但在多媒体计算领域是王者 RSX也只是做个辅助作用而已 "RSX(約7600GS)+Cell 的性能(綜合約7800GTX)"??? 回答是NO...实际做出程序进行并行比较来的效果谁都不知道...另外CELL处理器的功率是多少 您知道吗...20W...现在流行的NV系显卡呢???
级别: 新手上路
注册时间:
2007-02-26
在线时间:
0小时
发帖:
185
只看该作者 12楼 发表于: 2008-05-29
回答是肯定的~
级别: 圣骑士
注册时间:
2002-07-22
在线时间:
7小时
发帖:
1885
只看该作者 11楼 发表于: 2008-05-29
cuda是个颇封闭的平台,开源的X264会用么?
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 10楼 发表于: 2008-05-29
引用
最初由 Galaxy001 发布
当年也有用创新的声卡做浮点运算的。

DSP是专用的,处理针对性算法当然得心应手……
不过,记得GPU号称比DSP高级,那就算特化的CPU?

现在的GPU算RISC还是CISC?话说这两个概念咋界定?


现在已经没有纯粹意义的CISC了,包括x86,内部都是risc微指令了。GPU的特点是高度并行化,比x86的MMX,SSE指令并行度高多了。你让GPU去执行一些普通的串行处理C程序,效率会非常低,可能大部分流水线都闲着。现在很多算法想用MMX,SSE优化还要研究半天,要用GPU实现高度并行就更困难了。
级别: 工作组
注册时间:
2004-11-01
在线时间:
14小时
发帖:
2615
只看该作者 9楼 发表于: 2008-05-29
当年也有用创新的声卡做浮点运算的。

DSP是专用的,处理针对性算法当然得心应手……
不过,记得GPU号称比DSP高级,那就算特化的CPU?

现在的GPU算RISC还是CISC?话说这两个概念咋界定?

[url=ed2k://|friend|[CHN%5D[eDtoon%5D[PPG_FW%5D[VeryCD%5DGalaxy|D46F9E727D0ED77EDA09D21C55386F57|/]点击这里可以把我加入emule好友名单[/url]

#DEEBEA #F6FAFA
还是挂小图,...[:o]
级别: 工作组
注册时间:
2003-12-14
在线时间:
1小时
发帖:
2188
只看该作者 8楼 发表于: 2008-05-29
HD影像編碼 <- wht codec...
一颗3.0GHz的四核心处理器上 <- wht cores...

首先是将一段720p高清视频转换成iPod格式,转码工具是iTunes和一个价值20美元的MPEG-2编码器。首先在一颗3.0GHz的四核心处理器上,这一转换过程非常缓慢,需要几个小时之久 <- codec made in mars? and c7 quad-core? nice job...

                        
Please call me "小沙"  ^^ | FalconIA's BASE | BLOG (自家用)                    


级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 7楼 发表于: 2008-05-29
看来上当了,估计没和x264比较,什么编码器在3G 4核上720P只有2/8=0.25x=6~8fps的速度?我的双核1.8G 本本都比它快啊。

Dark Shikari的质疑
引用

8 times faster than a quadcore? What encoder are they comparing to, the JM?

On lowest settings, x264 encodes 720p ~3.8 times faster than realtime on a quadcore... and that's on 32-bit.
级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 6楼 发表于: 2008-05-29
CUDA...
现在的CUDA Challenge是做一个GPU加速的lame编码器
级别: 工作组
注册时间:
2005-04-23
在线时间:
0小时
发帖:
4259
只看该作者 5楼 发表于: 2008-05-28
引用
最初由 寄语于风 发布
刚买8800GTS的某人飘过~
原来我这个待机72度游戏86度的东东还有这潜力……

加把油可以煮咖啡\- -

Lux Aeterna

过去一直去,未来一直来...
快速回复

限150 字节
上一个 下一个