확장형 샌디브리지의 등장 - 인텔 코어 i7 익스트림 3960X, 3930K
지난달 AMD FX 시리즈에 이어 이달에는 인텔에서 새 CPU를 내놓았다. ‘샌디브리지E’라는 개발 코드명으로 알려진 코어 i7 3900 시리즈다. 익스트림 에디션이라는 최상위 제품군으로 분류되는 샌디브리지E가 어떤 CPU인지 알아보자.
*똑딱(Tick-Tock) 전략이란?
과거 인텔의 제품 개발 전략을 ‘오래 움츠렸다 멀리 뛰는 개구리 뜀’이라고 한다면, 틱톡은 두꺼비처럼 왼발 오른발 번갈아 가면서 기어가는 방식이다. 왼발이 틱인지, 오른발이 톡인지 따지는 건 아무런 의미가 없다. 생각해 봐야 할 점은 ‘그로 인해 제조사와 소비자가 어떤 이득을 얻을 수 있는가’다. 제조사 입장에서 이런 개발 전략은 신제품을 꾸준히 내놓을 수 있고, 프레스콧 같은 실패한 CPU로 인해 발생하는 이미지 실추를 빠르게 회복할 수 있다는 게 장점이다. 반면 소비자는 업그레이드 피로감을 느끼기 쉽고, 메인보드와 메모리 등 주변기기 구입과 교체에 많은 비용을 치러야 한다. 신제품이 나와도 큰 성능 향상을 느끼지 못한다는 것도 문제다. 즉, 인텔의 이러한 개발 전략은 소비자의 구매력을 소진시켜 자사의 이익을 극대화하고 위험부담을 최소화하겠다는 의도가 숨어있다고 해석할 수도 있다.
샌디브리지E는 블룸필드, 걸프타운과 마찬가지로 서버용으로 개발된 CPU를 이름만 바꿔 데스크톱용 최고급 제품으로 둔갑시킨 것이어서 주력 제품과는 구조, 소켓 규격, 시스템 구성 여건 등에 상당한 차이가 있다.
확장판 샌디브리지?
인텔은 2006년 65나노미터(nm) 공정으로 코어 아키텍처를 도입한 이래 매년 새 CPU를 발표해 왔다. 인텔의 행보를 거슬러 올라가면 2년을 간격으로 한 해는 제조공정을 미세화하고, 이듬해는 구조를 바꾸는 것을 알 수 있다. 이렇게 ‘공정개선’과 ‘설계변경’을 교차 반복하는 신제품 개발 전략을 인텔은 ‘똑딱(tick-tock)’이라고 표현한다. 한꺼번에 많은 것을 바꾸지 않고, 그때그때 개발된 기술을 바로 제품에 적용하고, 이를 제품으로 출시한다는 의미다.
지난 1월 출시한 샌디브리지는 32nm 제조공정보다는 2년 만에 선보인 새로운 설계 방식을 적용한 프로세서라는 점에서 주목을 받았다. 하지만 바로 전에 출시된 웨스트미어가 걸프타운과 클락데일 같은 일부 프로세서에만 쓰인 탓에 소비자는 샌디브리지를 개선된 공정과 새로운 설계가 모두 적용된 제품인양 반가워했다.
설계변경(편의상 공정개선을 ‘똑’, 설계변경을 ‘딱’이라고 하자. 왼쪽 그림 참조) 단계에서는 ‘몇 나노미터’라고 말하는 제조공정은 그대로 두고, 기능만 추가하기 때문에 다이 면적이 넓어지는 게 보통이다. 소비전력 역시 증가하는 것이 일반적이다. 반면 공정개선(똑) 단계는 이미 도입한 설계 방식의 단점을 보완해 한 번 더 숙성시키는 과정이라고 볼 수 있다.
샌디브리지는 설계변경(딱) 단계에서 등장했지만, 바로 이전에 공정개선(똑) 단계인 웨스트미어(클락데일, 걸프타운)가 주력 제품이 아니었기에 소비자들은 그보다 오래된 ‘딱’ 단계의 네할렘(린필드)을 샌디브리지의 비교 대상으로 삼아, 설계의 우수성보다는 전력 효율과 클록 향상에 더 많은 관심을 보인 셈이다. 사실 클락데일은 보급형 제품의 성격이 짙고, 걸프타운은 한정된 소비자를 대상으로 하는 최상급 CPU인 탓에 주력 제품으로 등장한 샌디브리지와 직접 비교가 적절하지 않았다.
샌디브리지E는 6코어 또는 4코어가 출시된다. 서버용으로 개발된 CPU답게 4채널 메모리 컨트롤러를 지니고 있으며, 설계 전력이 130W나 된다. 같은 샌디브리지인 코어 i7 2600K보다는 걸프타운(코어 i7 990X)과 성격이 비슷하다. 걸프타운 역시 서버용으로 개발된 프로세서다. 소켓 규격은 모두 제각각이어서 같은 메인보드를 쓰지는 못한다.
서버 CPU를 데스크톱 최상위 모델로 투입
이번에 발표한 샌디브리지E는 어떤 위치에 있을까? 공정은 종전 샌디브리지와 같은 32나노미터고, 설계변경도 없으니 ‘똑’이나 ‘딱’이 아닌 중간 과정에 속하는 제품인 셈이다.
샌디브리지E의 다이 구조는 샌디브리지 2개를 붙여놓은 것(오른쪽 그림 참조)처럼 생겼다. 하지만 샌디브리지 2개를 붙인다고, 코어 i7 3960X/3930K가 되는 것은 아니다. 애초 샌디브리지E는 서버용 8코어 CPU로 개발 중이었고 이 가운데 일부를 데스크톱용으로 내놓을 예정이었지만, 소비전력과 발열 증가, 수율 저하 등의 문제로 코어 2개와 캐시 일부를 죽여서 시장에 투입한 것이 코어 i7 3960X/3930K인 것이다. 온전한 샌디브리지E는 코어 8개와 20MB의 L3 캐시를 갖추고 있지만 코어 i7 3960X는 코어 6와 15MB의 캐시로 구성된다. 3930K은 이보다 캐시 용량이 적어서 3차 캐시가 12MB에 불과하다. 온전한 샌디브리지E에 견줘 코어는 3/4, 캐시 용량은 3/5에 불과한 셈이다.
과거 최상급 CPU였던 블룸필드나 걸프타운은 주력 제품이었던 CPU와 거의 비슷한 시기에 등장하거나 오히려 먼저 시장에 등장했다. 예상보다 초라한 제원으로 등장한 샌디브리지E는 샌디브리지 설계를 활용한 서버 CPU 생산이 인텔의 의도대로 진행되지 않고 있음을 의미하기도 한다. 이는 PC와 서버 판매량 하락으로 인한 속도 조절일 수도 있고, 6코어 이상의 프로세서를 제작하면서 발생한 문제 해결을 위한 숨 고르기일 수도 있다. 하지만 샌디브리지E 기반의 CPU는 극히 일부 마니아를 위한 것으로 전체적인 CPU 수급에는 별다른 영향을 미치지는 않을 것이다.
고성능 CPU를 위한 1회용 소켓 규격 LGA2011
샌디브리지E는 데스크톱과는 다른 환경을 고려해 설계한 서버용 CPU다. 때문에 이에 기반을 둔 코어 i7 9000 시리즈는 지난 1월에 등장한 LGA 1155 소켓과 형태가 전혀 다른 LGA 2011 소켓을 쓴다. 외형적인 규격이 다를 뿐 아니라 설계 전력이 130W나 되는 탓에 새로운 형태의 냉각장치가 필요하다.
메인보드도 완전히 다르다. 우선 X79 익스프레스라는 칩셋을 쓰는데, 이를 얹은 메인보드는 샌디브리지E의 4채널 메모리 컨트롤러를 위해 최대 8개의 메모리 슬롯을 거느린다. 지원하는 메모리의 최고 속도도 DDR3-1600으로 빨라져서, 각 채널당 12.8GB/초를 전송하며 시스템 전체적으로는 51.2GB/초란 엄청난 속도로 데이터를 주고받는다. 이는 걸프타운용 칩셋인 X58의 25.5GB/초보다 2배나 된다. 덕분에 샌디브리지E 시스템은 짧은 시간에 엄청난 양의 데이터를 처리할 수 있게 되었지만 데스크톱 PC라는 점을 생각하면 과도하게 앞선 제원이라는 지적도 있다. X79 메인보드의 가격은 30만 원에서 60만 원 사이에 형성되어 있다.
ECS X79R-AX 디럭스
사진에서 알 수 있듯이 X79 메인보드는 소켓 양쪽에 메모리 슬롯이 있다. ECS X79R-AX 디럭스처럼 각 채널당 1개씩 모두 4개가 있는 것도 있고, 2개씩 8개가 달린 것도 있다. 또 다양한 멀티 그래픽카드 환경을 지원하기 때문에 PCI 익스프레스 x16 슬롯이 여럿인 것도 특징이다. 슬롯의 수와 작동 속도는 제조사가 자유롭게 정할 수 있다.
전통적인 개념에서는 X79를 사우스브리지라고 해야 한다. 그래픽카드와 메모리 제어처럼 성능에 직결되는 부분은 모두 CPU가 통제하고, X79는 저장장치와 주변기기, 시스템 설정에 관련된 부분만 제어한다.
샌디브리지E는 서버용으로 개발된 프로세서로, 코어 8개와 3차 캐시 20MB로 구성된다. 서버용인 만큼 내장 그래픽 유닛은 포함되지 않는다. 코어 i7 3900/3800 시리즈는 샌디브리지E의 기본형에서 코어 2개와 캐시의 일부분을 작동하지 않게 막아놓은 성능 제한 제품이다.
X79 칩셋의 구조도
PCI 익스프레스 데이터 통로가 넉넉해서 AMD 크로스파이어X와 엔비디아 SLI를 자유롭게 구성할 수 있다. 아쉽게도 USB 3.0 규격을 지원하지 않아, 따로 컨트롤 칩을 달아야 빠른 속도로 외장 하드디스크를 연결할 수 있다.
테스트 시스템 구성
CPU
- 인텔 코어 i7 3960X 익스트림 3.3GHz
(샌디브리지E/6코어/12스레드)
- 인텔 코어 i7 3930K 3.2GHz
(샌디브리지E6코어/12스레드)
- 인텔 코어 i7 990X 익스트림 3.47GHz
(걸프타운/6코어/12스레드)
- 인텔 코어 i7 2600K 3.4GHz
(샌디브리지/4코어/8스레드)
- 인텔 코어 i7 2500K 3.3GHz
(샌디브리지/4코어/4스레드)
- AMD FX-8150 3.6GHz
(잠베지/8코어/8스레드)
- AMD 페넘 II X6 1100T 3.3GHz
(투반/6코어/6스레드)
- AMD 페넘 II X4 980 3.70GHz
(데네브/4코어/4스레드)
메인보드
- 인텔 DX79SI
- 아수스 P6T7-WS 슈퍼컴퓨터
- 아수스 막시무스 IV 익스트림
- 아수스 크로스헤어 V 포뮬러
램
- 삼성 DDR3-10600
(시스템에 따라 2~4개)
그래픽카드
- AMD 라데온 HD 6990 D5 4GB(2개)
- 저장장치
- 인텔 510 시리즈 120GB
운영체제
- 윈도우 7 엔터프라이즈 64비트
(서비스팩 1)
인텔 코어 i7 3960X 익스트림
코어 6개(논리 CPU 12개)
작동 클록 3.3GHz(max 3.9GHz)
L2 캐시 코어당 256KB
L3 캐시 15MB
소켓 LGA 2011
설계 전력 130W
CPU 기초 연산 능력 1 정수 연산
먼저 CPU 연산 성능 중 정수 연산 부분을 먼저 보자. 시소프트 산드라 2001에서 테스트한 결과, 순수한 정수 연산(Dhrystone)에서 인텔 CPU는 신구를 막론하고 AMD 제품을 압도하고 있다. AMD끼리만 비교하자면 정수 유닛을 8개 올린 AMD FX-8150이 종전의 페넘을 크게 앞서는 성능을 보여 준다. 전체적으로 샌디브리지가 걸프타운을 크게 앞서고 있다.
멀티미디어 정수 성능(Multimedia integer)은 앞에서 본 것과는 사뭇 다른 양상을 보여주고 있다. AMD FX의 성능이 비약적으로 향상되어 인텔 6코어 CPU와 어깨를 나란히 하는 것이 눈에 띈다. 또 이 테스트에서는 코어 i7 990X가 샌디브리지E 시리즈를 바짝 쫓고 있으며, 코어 i7 2600K와 큰 차이를 보였다. FX-8150을 제외한 AMD CPU의 성능은 코어 i7 2500K의 1/3에서 절반 수준에 머물고 있다.
CPU 기초 연산 능력 2 부동소수 연산
두 번째 역시 산드라 2011을 통해 CPU의 부동소수점 연산 성능을 알아보자. 앞선 테스트와 비슷하지만 부분적으로 눈에 띄는 항목도 있다. 우선 코어 i7 990X가 6개의 코어에도 불구하고 4코어 샌디브리지인 코어 i7 2600K 앞에서조차 맥을 못 추고 있다. 기본 정수(Whetstone) 벤치마크는 물리적인 코어가 많은 CPU가 유리했지만, 멀티미디어 부동소수점(Multimedia floating point) 벤치마크에서는 990X가 코어가 많음에도 불구하고 힘을 쓰지 못하고 있다. 지금까지의 결과만을 보면, 샌디브리지E 2종이 비교 대상을 모두를 압도하는 성능을 보여주고 있다.
CPU 렌더링 Cinebench 11.5
CPU 렌더링에서는 맥슨의 시네벤치와 특정 파일의 렌더링 작업을 실행하는 속도를 비교하는 브렌더라는 프로그램으로 성능을 비교했다. 먼저 ‘시네벤치 11.5’ 결과를 보자. 멀티스레드 성능은 샌디브리지E 2개 제품이 무난하게 1, 2위를 차지했다. 반면 싱글스레드 성능은 이번에도 의외의 결과를 보였는데, 3960X과 3930K가 2600K과 2500K에 모두 밀리고 있다. 쿼드채널 메모리 구성으로 대역폭을 크게 확장한 샌디브리지E가 싱글스레드에서 종전 샌디브리지에 뒤진다는 건, 시스템 부하가 엄청 큰 특수 상황을 제외한 일상적인 작업에서는 굳이 비싼 LGA 2011 소켓 시스템을 구입할 필요가 전혀 없다는 뜻이다. 이는 렌더링 프로그램인 ‘브렌더’를 이용한 또 다른 테스트에서도 마찬가지였다. 3960X와 3930K의 싱글스레드 성능은 990X보다는 높지만 2600K와 2500K보다는 낮았다.
3D 성능 비교 게임 & 3D 마크
<에일리언 vs 프레데터>에서는 샌디브리지E가 근소한 차이로나마 1,2위를 지키고 있다. <배틀필드: 배드컴퍼니 2>는 200프레임 제한이 걸려 있는데 3960X는 이미 194~196프레임을 달성해 더 오를 곳이 없는 상태다. 페넘 II X4 980과 X6 1100T의 결과로 미뤄 보았을 때 이 게임은 멀티스레드를 잘 지원하고 있다는 걸 알 수 있다. 흥미로운 점은 990X가 미세하게나마 3930K를 앞서고 있다는 점이다.
990X가 3930K를 앞서는 모습은 <크라이시스: 워헤드>에서 가장 확실하게 나타난다. 그런데 990X는 또 다시 2600K과 2500K에는 뒤지고 있다. <크라이시스 2>에서도 3930K는 990X보다 떨어지는 모습을 보이고 있다. 여기서 990X는 전체적으로 제법 높은 성능을 냈다.
<H.A.W.X 2>에서도 990X가 3930K를 앞서는 성능을 보여주고 있다. 또 3960X와 3930K의 성능 차이를 보면 두 CPU의 클록과 캐시 용량은 성능 변화를 느낄 만한 차이를 만들지 못하고 있다는 것을 알 수 있다.
<매트로 2033>은 그래픽 의존도가 매우 높은 게임이다. 그럼에도 불구하고 테스트 결과를 보면 CPU별로 분명한 성능 차이를 보이는 것을 알 수 있다. <레지던트 이블 5>에서는 3930K가 990X와 거의 같은 프레임을 기록했으며, 3960X와는 꽤 크게 차이가 났다. 이는 앞선 <H.A.W.X 2>와 상반되는 결과이기도 하다.
다음 팟인코더 동영상 변환 테스트
다음 팟인코더를 이용해 MPEG2 동영상을 H264로 변환하는 걸리는 시간을 알아봤다. 인코딩 시간은 코어 수가 좌우할 것이란 통념을 뒤집고, 2600K가 990X보다 나은 성능을 보였다. 역시 3960X과 3930K가 가장 빨랐다.
샌디브리지E의 오버클록
극심한 발열과 전력소모로 수율 매우 낮아
CPU의 오버클록은 개별 제품의 특성과 메인보드 조합에 따라 수율이 얼마든 달라질 수 있다. 하지만 코어 i7 3960X와 3930K는 배수가 고정되어 있지 않았음에도 오버클록이 잘 안 되는 CPU다. 2600K와 2500K에 견주면 클록 향상의 폭도 매우 좁다. 게다가 발열이 심해 특수한 냉각장치의 도움 없이는 오버클록에 도전하기가 쉽지 않을 듯하다.
성능은 으뜸이지만 새로운 건 없다
샌디브리지E 기반의 새로운 코어 i7 9000 시리즈는 독보적인 데스크톱 CPU임에는 틀림없다. 하지만 성공한 CPU로 남기 위해서는 성능 이외에도 충족해야만 하는 몇 가지 요건들이 있다. 샌디브리지E의 반도체 면적당 성능이 걸프타운 계열보다 높아야 한다. 반도체의 면적은 곧 생산비용을 의미하기 때문이다. 2세대 코어 i7 9000 시리즈가 이전 세대인 990X를 앞서고 있기는 하지만 늘어난 면적과 반도체 집적도를 따지면 비효율적이라고 할 수 있다. 즉, 새로운 기술을 적용하기 위해 100원을 썼는데, 성능은 한 30원 정도치만 올라간 셈이다. 샌디브리지E에 ‘혁신’이나 ‘개선’이라는 딱지를 붙이고 싶지 않은 이유가 여기에 있다.
개선의 여지가 없는 건 아니다. 지금의 샌디브리지E는 코어 2개가 죽어 있는 상태다. 클록을 조금 낮춰 소비전력을 줄이고, 싱글스레드 성능을 약간 희생시키는 대신 코어 8개를 모두 쓸 수 있게 하는 것도 하나의 방법이다. 이렇게 할 경우, 게임이나 인코딩 같은 작업에서는 성능이 떨어질 수도 있겠지만, 뒤가 근질근질할 정도로 바짝 뒤쫓아 오는 경쟁자가 있는 것도 아니니 인텔은 여유를 갖고 해결책을 찾길 바란다.