搜索 社区服务 统计排行 帮助
  • 5760阅读
  • 32回复

i5 750为啥压制CPU占用只有50% ?

楼层直达
级别: 新手上路
注册时间:
2004-12-22
在线时间:
0小时
发帖:
156
为了压片入了i5 750

用的win 7 64bit,megui压720p的x264

以前我的扣肉6400同样的设置大概5fps这样

这次换i5变成15fps了,三倍提升不知道是不是正常的?

我编码喜欢勾选那个turbo,就是1st pass很快

但这次换i5后turbo不起作用了,编码速度只提高到18fps而已。
以前扣肉用了turbo的1st pass都有起码3倍速度,也就是说i5应该有45fps

而且这次压480p的片,按照扣肉的经验,速度比720p快2倍多的。
但这次同样的片源速度出来跟720p一样只有15fps

整个过程cpu占用率都不超过50%,何解?

压制过程中的两个进程
vfw4x264.exe占用30
x264_64.exe占用20

--------------------
有谁有i5配w7 64bit的使用经验么?

问题有点多,有点杂。。。不好意思

========================时间线========================
我贴一下参数。

源文件是MJPG

x264 1376 Jeeb's patch build v2

AVS代码

a=directshowSource("J:\0ff\ff13open1.avi", audio=true)
b=directshowSource("J:\0ff\ep10.avi", audio=true)
c=directshowSource("J:\0ff\ep10ed.avi", audio=true)
d=a+b+c
e=d.TextSub("J:\0fft\ep10t.ass").SelectEven.ConvertToYV12()
audio=e
Return AudioDub(e, audio)

480p的话就加一个.LanczosResize(720, 480)在e那里

x264设置
program --profile high --level 4.1 --pass 2 --bitrate 2500 --stats ".stats" --thread-input --ipratio 1.1 --pbratio 1.1 --vbv-bufsize 9000 --vbv-maxrate 24000 --ratetol 2.5 --qcomp 0.7 --merange 12 --me umh --direct auto --trellis 2 --psy-rd 0.00:0 --output "output" "input"
级别: 工作组
注册时间:
2003-11-07
在线时间:
1小时
发帖:
7032
只看该作者 32楼 发表于: 2010-03-16
引用
最初由 squall617 发布
64 比 32快 cpu 50%是正常的,瓶颈在avs处理上而不是编码。
我i7 860 50%都没有呢


换用mt版的avs,开setMTmode.注意这个线程要开得有节制点,单线要到50%估计开4线就足够了.我就遇到过因为跑得太满结果cpu自动调节成单线程来降温的杯具

青空が眩しい 君がいる風景は
幸せのオーラ 溢れ出すの とまらないよ
駅前の噴水 虹を作っているよ
君を待つ時間さえも かけがえない プレシャスな時

=========================

FANSUB的历史,又翻过了新的一页
级别: 新手上路
注册时间:
2004-12-22
在线时间:
0小时
发帖:
156
只看该作者 31楼 发表于: 2010-03-06
嗯,720*480的压缩速度跟720p一样都是14fps

我好郁闷
级别: 新手上路
注册时间:
2007-04-16
在线时间:
0小时
发帖:
69
只看该作者 30楼 发表于: 2010-02-25
引用
最初由 ssnake 发布
根据“980X的优势只是核心多,单核效率没有920高”这项猜测,1st pass 980X比920慢的原因,很可能是1st pass时的单线程运算较多。另外,也可能是x264现在的版本尚未对Gulftown做优化。


可以不用猜測喔:)
單核效率是一樣高 差別是在於IMC上
目前980X的IMC確實是輸給920
有實驗證明記憶體效能確實是輸給920
但那也可能是因為軟體
尚不支援到12個線程同時去存取記憶體做測試:rolleyes:
如果說8個線程同時存取記憶體 跟 12個線程同時存取記憶體來比較
應該就同樣可以看出多核心的優勢了

级别: 风云使者
注册时间:
2009-03-17
在线时间:
552小时
发帖:
1255
只看该作者 29楼 发表于: 2010-02-25
额,这楼真够专业向,并行度不提高n核都没有用
级别: 新手上路
注册时间:
2005-06-30
在线时间:
1小时
发帖:
529
只看该作者 28楼 发表于: 2010-02-25
引用
最初由 翡璃月 发布


我從沒說過因為浮點運算變快的緣故而變快...
更何況整數運算再怎說也是核心多的980X比較快...
我只是從硬體方面認為1st時採用浮點運算 既然現在有人能證明不是
那可以解釋何以何以1st於980X反而較慢?
根据“980X的优势只是核心多,单核效率没有920高”这项猜测,1st pass 980X比920慢的原因,很可能是1st pass时的单线程运算较多。另外,也可能是x264现在的版本尚未对Gulftown做优化。

级别: 新手上路
注册时间:
2007-04-16
在线时间:
0小时
发帖:
69
只看该作者 27楼 发表于: 2010-02-25
引用
最初由 roozhou 发布

硬件行业有个Amdahl's Law ,就算浮点运算快了100%,x264的速度也不会快1%,广告这种东西你也跟着信?很明显是整数运算性能提高导致的速度变快,当然也有可能是cache之类的影响。


我從沒說過因為浮點運算變快的緣故而變快...
更何況整數運算再怎說也是核心多的980X比較快...
我只是從硬體方面認為1st時採用浮點運算 既然現在有人能證明不是
那可以解釋何以何以1st於980X反而較慢?

级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 26楼 发表于: 2010-02-25
引用
最初由 翡璃月 发布

我只是從硬體的角度去看
i7-920 浮點運算處理比 i7-980X ES Q3FE 強大一些
因為Uncore效能的關係
920 跑 1st 約是 40fps
980X 跑 1st 約是 35fps

硬件行业有个Amdahl's Law ,就算浮点运算快了100%,x264的速度也不会快1%,广告这种东西你也跟着信?很明显是整数运算性能提高导致的速度变快,当然也有可能是cache之类的影响。
级别: 新手上路
注册时间:
2007-04-16
在线时间:
0小时
发帖:
69
只看该作者 25楼 发表于: 2010-02-25
引用
最初由 風之殤 发布
樓上用A0的CPU不是等爆漿嗎.....


現在都B1了 3月市售版會是B2


A0 完成度其實就很接近 100% 了 [/TX]

级别: 新手上路
注册时间:
2007-04-16
在线时间:
0小时
发帖:
69
只看该作者 24楼 发表于: 2010-02-25
引用
最初由 roozhou 发布

我用Visual Studio自带的Performance tool,用-o NUL -p1 --b-adapt 2 -b8测试了一下,列出占用CPU时间靠前的几个函数。我的CPU是双核K8,但不会和nehalem的结果有太大区别。

x264_pixel_satd_8x8_internal_mmxext 15.874%
x264_pixel_avg2_w8_mmxext 9.898%
x264_rdo_init7.679%
x264_pixel_sad_x4_8x8_mmxext 6.342%
x264_me_search_ref6.004%
x264_me_refine_bidir_satd5.422%
x264_pixel_avg_weight_w8_mmxext4.090%
x264_mc_copy_w8_mmx3.124%
x264_pixel_sad_8x8_mmxext 2.969%
x264_pixel_satd_8x8_mmxext 2.934%
另外解码部分大概占了接近5%

好吧,这里的所有函数里都是找不到一丁点浮点运算的。不知道你的“1st居多是处理浮点运算”的结论是怎么得出来的。


我只是從硬體的角度去看
i7-920 浮點運算處理比 i7-980X ES Q3FE 強大一些
因為Uncore效能的關係
920 跑 1st 約是 40fps
980X 跑 1st 約是 35fps

级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 23楼 发表于: 2010-02-24
引用
最初由 翡璃月 发布
應該說
浮點運算的 b adapt2 + b frames
速度當然慢 且CPU佔用不大 ....
等有朝一日 b adapt2 + b frames 能夠改用GPU運算....
速度就快了 且佔CPU了....

1st 居多是處理浮點運算 也就是快速掃描畫面一次過去

我用Visual Studio自带的Performance tool,用-o NUL -p1 --b-adapt 2 -b8测试了一下,列出占用CPU时间靠前的几个函数。我的CPU是双核K8,但不会和nehalem的结果有太大区别。

x264_pixel_satd_8x8_internal_mmxext 15.874%
x264_pixel_avg2_w8_mmxext 9.898%
x264_rdo_init7.679%
x264_pixel_sad_x4_8x8_mmxext 6.342%
x264_me_search_ref6.004%
x264_me_refine_bidir_satd5.422%
x264_pixel_avg_weight_w8_mmxext4.090%
x264_mc_copy_w8_mmx3.124%
x264_pixel_sad_8x8_mmxext 2.969%
x264_pixel_satd_8x8_mmxext 2.934%
另外解码部分大概占了接近5%

好吧,这里的所有函数里都是找不到一丁点浮点运算的。不知道你的“1st居多是处理浮点运算”的结论是怎么得出来的。
级别: 新手上路
注册时间:
2004-12-22
在线时间:
0小时
发帖:
156
只看该作者 22楼 发表于: 2010-02-24
我贴一下参数。

源文件是MJPG

x264 1376 Jeeb's patch build v2

AVS代码

a=directshowSource("J:\0ff\ff13open1.avi", audio=true)
b=directshowSource("J:\0ff\ep10.avi", audio=true)
c=directshowSource("J:\0ff\ep10ed.avi", audio=true)
d=a+b+c
e=d.TextSub("J:\0fft\ep10t.ass").SelectEven.ConvertToYV12()
audio=e
Return AudioDub(e, audio)

480p的话就加一个.LanczosResize(720, 480)在e那里

x264设置
program --profile high --level 4.1 --pass 2 --bitrate 2500 --stats ".stats" --thread-input --ipratio 1.1 --pbratio 1.1 --vbv-bufsize 9000 --vbv-maxrate 24000 --ratetol 2.5 --qcomp 0.7 --merange 12 --me umh --direct auto --trellis 2 --psy-rd 0.00:0 --output "output" "input"
级别: 超级版主
注册时间:
2002-08-18
在线时间:
181小时
发帖:
14839
只看该作者 21楼 发表于: 2010-02-24
樓上用A0的CPU不是等爆漿嗎.....


現在都B1了 3月市售版會是B2

FREEWIND台湾,日本商品团购MSN群: group130599@xiaoi.com 欢迎入群讨论!!
贩售台湾正版CD,DVD,漫畫,輕小說,及台灣各種商品,采Door to Door服务有保障!!请大家告诉大家!!
※FREEWIND工作室官方掏宝店铺,请点我!!!※

※漫游FREEWIND工作室招募人才 請點我!※
※漫游FREEWIND工作室作品汇总 請點我!※
※漫游FREEWIND工作室招募分流FTP&P2P分流员 請點我!※

级别: 新手上路
注册时间:
2007-04-16
在线时间:
0小时
发帖:
69
只看该作者 20楼 发表于: 2010-02-24
應該說
浮點運算的 b adapt2 + b frames
速度當然慢 且CPU佔用不大 ....
等有朝一日 b adapt2 + b frames 能夠改用GPU運算....
速度就快了 且佔CPU了....

1st 居多是處理浮點運算 也就是快速掃描畫面一次過去

级别: 精灵王
注册时间:
2008-04-08
在线时间:
44小时
发帖:
2855
只看该作者 19楼 发表于: 2010-02-24
ffmpeg本来就没法判断cfr还是vfr,不过这些东西都可以编码完了再改的
快速回复

限150 字节
上一个 下一个