티스토리 뷰

지금 Dell PowerEdge R620 모델을 사용중이다.

그런데 한달에 한두번씩 가끔은 더 많이 CPU 이상할 정도로 속도가 저하되는 증상을 겪어 왔다.

CPU 는 Xeon E5 2620 2.0Ghz 모델인데, 오작동할 때에는 0.18Ghz 0.2GHz 로 클럭수가 낮게 나왔다.

물론 프로그램들도 기어 다니고...

그런데, 이런 증상을 겪을 때면 늘 소프트리셋을 하면 정상으로 돌아왔다. 엥?


하드웨어 문제는 아닌가 싶었다, 소프트리셋으로 정상화 된다까?

혹여 CPU 발열 문제로 인한 스로틀링인가 싶었지만 정상이었고, 아무도 쓰지 않을 아침과 점심때 주로 발생하여 과부하 문제도 아니라 생각했다. 대체 무슨 문제인가? 찾아보니, 

http://en.community.dell.com/support-forums/servers/f/956/t/19616718

PowerEdge T320 CPU Throttling - SERIOUS BUG

... 2 Feb 2015 ...
...
    This is a known bug with Dell PowerEdge T320 Servers with a Intel Xeon E5-1410 v2.  On the Server 2012 R2 server, it was happening randomly only once or twice a month.  On the Server 2008 R2 server it only happened a couple of times at random.  The CPU would go down to below 0.20 Ghz and the 2012 server would crawl and service availability was seriously degraded.   This also happened to another client T320 Server with Server 2008 R2 with an Intel Xeon E5-1410.  Multiplier would not increase from 12 and the server was running at ~1.2ghz.

...

헛 나와 똑같은 증상을 겪고 있는 것이 아닌가? 더욱이

   If your CPU has been tested and is not overheating, this is the workaround:

...

   Resolution:  In the PowerEdge Bios, change the System Profile to Performance Optimized.  This will disable C-States and C1E.   Instructions:  www.ponjavic.com/.../disable-dell-poweredge-m620-cpu-throttling

그러나, 이 방법은 틀렸나? 바이오스를 보니 이미 시스템 프로파일이 Performance 로 설정되어 있었다!

혹시나 하는 마음에 바이오스 업데이트를 찾아보니, 유사 문구가 있는 것이 아닌가? 2.52 버전에!

http://www.dell.com/support/home/us/en/04/Drivers/DriversDetails?driverId=CNN4X

    Updated Intel Management Engine (ME) binary to Rev 2.1.5. 0x8B, to address issues that resulted in unexpected temporary or permanent Processor frequency degradation.

그런데 내가 본 장비의 바이오스 버전이 똑같았다. 2.52 였다! 이게 뭔일?

http://www.ponjavic.com/wordpress/wp-content/uploads/2014/09/image90.png
참고하려고 그림을 찾아서 올려 둡니다.

그럼 뭐가 문제지? 바이오스 릴리즈 목록을 보니 2.52 버전이 2개나 있는 것이 아닌가? -_-;

http://www.dell.com/support/home/us/en/04/product-support/product/poweredge-r620/drivers?os=w12r2

그래서 그냥 최신 버전 받고 칩셋 드라이버도 함께 올려주었다.

일단 해결!?

아니다. 한달은 두고 봐야 겠다.

유사 이슈로 고민하던 사람이 올린 글이다.

http://serverfault.com/questions/641212/unexplicable-extreme-slowness-on-dell-poweredge-r320-fixed-only-by-cold-reboot

이 방법이 맞는듯하다.

델!

요로코롬 팔아도 장사할 수 있었다니... 아니다. 델의 문제가 아니라 인텔의 문제지.

인텔!!!

x86 서버 CPU 는 인텔이 독점하고 있으니, 울며 겨자먹기로 써야 한다?!
외계인을 갈아 넣는다고 해도 버그는 나오는구만. 쩝.

결론은 문제되면 일단 바이오스 업데이트 하자!!!


누군가에게 도움이 되길!

댓글