『漫游』酷论坛>『影音数码技术学习交流』>x264在AMD上的那个bug

roozhou@2009-01-16 20:05

引用
最初由 vempx 发布
x264 [info]: using cpu capabilities: MMX2 SSE2Slow

就算我用的是X2 4000+,但是这指令集怎么这么少,明明有SSE3的啊


写上了又怎么样,x264不用SSE3的,SSE3主要是浮点指令。
其实SSE3有几条指令还是能用在整数处理上的,不过大部分CPU上比SSE2还慢。

实际上用得最多的还是MMX和SSE2,其他素浮云
引用

vempx@2009-01-16 21:01

[/ku] SSE2后面还跟了个slow……
引用

roozhou@2009-01-17 01:14

引用
最初由 vempx 发布
[/ku] SSE2后面还跟了个slow……


Phenom以前的AMD上SSE2的确很慢啊,有些时候用MMX反而快一些。

感觉x264开发者是I饭(或者Intel给了好处?),给Intel写了大量针对性的优化,对AMD基本上就是很笼统的优化。
引用

vempx@2009-01-17 01:15

痛苦死我了,我现在的4000+OC到了2.6G,单核压704x480的DVDRip速度只有2.5帧左右……OTL
引用

roozhou@2009-01-17 01:29

引用
最初由 vempx 发布
痛苦死我了,我现在的4000+OC到了2.6G,单核压704x480的DVDRip速度只有2.5帧左右……OTL


你什么参数,我的sempron 2500+ OC 2.0G 也一般在5fps以上啊。
引用

vempx@2009-01-17 01:31

--crf 18 --level 4.1 --keyint 240 --min-keyint 24 --ref 8 --mixed-refs --no-fast-pskip --bframes 6 --b-adapt 2 --b-pyramid --weightb --subme 9 --trellis 2 --psy-rd 0.0:0 --partitions p8x8,b8x8,i4x4,i8x8 --8x8dct --me umh --merange 32 --threads 1 --thread-input --aq-mode 1

有点EP的参数……
引用

roozhou@2009-01-17 01:40

那这个慢是你自找的
像merange 32和trellis 2性价比很差啊
还有thread-input在单核上没必要吧
引用

vempx@2009-01-17 01:49

是啊,所以说这个参数很EP嘛……囧

thread-input是做什么用的?对这个参数说实话我完全不了解~

另外那个merange很神奇,对画面影响非常大,我以前试过16 20 24 32这几个参数压chobits,发现并不是越大越好,说不准哪个好……囧
引用

roozhou@2009-01-17 01:58

引用
最初由 vempx 发布
是啊,所以说这个参数很EP嘛……囧

thread-input是做什么用的?对这个参数说实话我完全不了解~

另外那个merange很神奇,对画面影响非常大,我以前试过16 20 24 32这几个参数压chobits,发现并不是越大越好,说不准哪个好……囧


thread-input是开启输入缓冲,多核上可以提高CPU利用率,单核上除了多占内存没任何作用。

merange最小可以设到4
引用

vempx@2009-01-17 01:59

弄到4之后回事什么样子

原来那个东西在单核上没用。
[/KH] 反正我内存4G,开了就开了…………
引用

蓝の回忆@2009-01-17 13:13

速度乃是浮云..
对这方面已经麻痹了.
引用

uc0083@2009-01-17 13:37

以前amd那些cpu就不适合压片,现在叫人家换平台也没动力啊,优化当然少
引用

roozhou@2009-01-17 17:00

引用
最初由 vempx 发布
弄到4之后回事什么样子

原来那个东西在单核上没用。
[/KH] 反正我内存4G,开了就开了…………


对速度有影响的,虽然不大。线程同步要多消耗资源,使用buffer会导致cache miss增加同样会降低速度。
引用

vempx@2009-01-17 21:33

引用
最初由 roozhou 发布


对速度有影响的,虽然不大。线程同步要多消耗资源,使用buffer会导致cache miss增加同样会降低速度。

感谢解答,以后threads 1的时候就关掉它
引用

«12»共2页

| TOP