QPI 연결 기술은 칩셋과 CPU 사이에 다리를 놓을 뿐 아니라 서버용 멀티 CPU 플랫폼에서는 CPU와 CPU를 연결하는 데도 쓰인다.
코어 i7과 호흡을 맞추는 인텔 X58 칩셋을 얹은 아수스 P6T 메인보드.
현재 코어 i7은 가장 빠른 데스크톱 프로세서다.
지난해 말 인텔은 새로운 마이크로 프로세서 설계 방식을 적용한 CPU를 발표했다. 종전까지 인텔이 내놓은 마이크로 프로세서와는 사뭇 다른 구조를 하고 있을 뿐 아니라 당시 주력 쿼드코어 제품이었던 코어 2 쿼드보다 높은 성능을 자랑했다. 블룸필드란 코드명으로 불린 이 CPU는 인텔이 오랫동안 준비한 네할렘 아키텍처의 코어 i7이다.
블룸필드란 코드명으로 불렸던 코어 i7은 그동안 CPU 외부에 있던 메모리 컨트롤러를 CPU 내부로 옮겨왔다. 메모리 컨트롤러가 CPU 내부로 들어가면서 CPU가 메모리에서 필요한 데이터를 가져올 때 거치는 단계가 크게 줄었고, 데이터 통로의 속도 불균형으로 인해 메모리가 제 성능을 내지 못하는 일이 줄었다. CPU 내장형 메모리 컨트롤러는 AMD가 애슬론 XP에서 애슬론 64로 넘어갈 때 적용한 기술이고, 그 우수성이 오래전부터 입증된 만큼 이로 인한 효과는 확실하다.
코어 i7은 메모리 컨트롤러가 자리를 옮겼을 뿐 아니라 구성 방식도 변화하였다. 코어 2 시리즈는 메모리와 신호를 주고받는 통로가 2개인 듀얼채널 구성이지만 코어 i7은 3개의 통로에 메모리가 연결되는 트리플채널이다.
코어 i7의 또 다른 특징은 퀵패스인터커넥트(QPI)라는 새로운 데이터 통로다. 메모리 컨트롤러가 CPU 내부로 들어가면서 전통적인 개념의 시스템버스 FSB(프론트 사이드 버스)를 대체할 기술이 필요해졌다. QPI는 하이퍼트랜스포트와 작동 방식이 비슷한 직렬 데이터 버스로서 작동 속도가 빨라 같은 시간에 더 많은 데이터를 주고받는다. QPI는 CPU와 칩셋을 연결할 뿐 아니라 2개 이상의 CPU를 쓰는 서버 플랫폼에서는 CPU와 CPU를 직접 연결하는 데이터 통로가 된다.
이밖에 싱글 또는 듀얼코어만 쓰는 프로그램을 돌릴 때 해당 코어의 클록을 끌어올리는 터보 부스트 기능과 더욱 발전된 전원 관린 기술 C-state, 멀티미디어 연산 속도를 높이는 SSE4.2 명령 조합 등을 더해 단지 빠르기만 한 CPU가 아니라 효율적으로 일 잘하는 CPU라는 평을 듣고 있다.
블룸필드 코어 i7은 인텔 X58 칩셋과 호흡을 맞춘다. CPU 내부로 자리를 옮긴 트리플채널 메모리 컨트롤러가 특징이다. 코어 i7 이전의 인텔 CPU는 칩셋(노스브리지)의 도움을 받아 메모리를 제어했다.
린필드 코어 i7/i5는 듀얼채널 메모리 컨트롤러를 지니고 있다. 또 그래픽카드를 위한 PCI 익스프레스 버스 컨트롤러도 CPU 내부로 자리를 옮겼다. 블룸필드에서 칩셋과 CPU를 연결하던 QPI가 사라지고 노스브리지와 사우스브리지 연결에 쓰이던 DMI 기술로 린필드와 P55 칩셋을 연결한다.
2010년 출시되는 클럭데일은 린필드와 기본 구조가 같다. 차이점은 CPU 내부에 자리 잡은 그래픽코어다. 인텔 H5x 칩셋과 호흡을 맞춘다.
※블룸필드와 X58 칩셋은 QPI로 연결된다. QPI는 최대 초당 25.6GB의 데이터를 전송할 수 있다. 반면 린필드와 P55, 클럭필드와 H5x는 초당 2GB의 데이터 전송 속도를 가지는 DMI로 연결되어 있다. 데이터 전송량이 큰 그래픽카드와 메모리가 CPU와 직접 데이터를 주고받게 된 덕에 칩셋과 CPU 사이에 굳이 건설이 힘들 고속도로를 놓을 필요가 없어진 것이다. 린필드 시스템 칩셋에 연결된 하드디스크, USB, 확장 슬롯이 한꺼번에 데이터를 전송한다 하더라도 병목현상을 걱정할 필요는 없다.
그래픽카드 버스까지 집어삼켜 영향력 강화
2009년 9월, 코어 i7을 발표한 뒤 열 달이 지나서야 인텔은 코어 i7의 후속 모델을 내놓았다. 코드명 린필드 프로세서가 그 주인공이다. 린필드 프로세서는 코어 i7과 마찬가지로 네할렘 아키텍처를 따르고 있다. 아키텍처가 같다는 것은 데이터 연산에 작용하는 프로세서의 주요 구조와 작동 방식이 동일하다는 뜻이다. 하지만 린필드는 다른 아키텍처라고 해도 이상하지 않을 정도로 네할렘 아키텍처의 첫 번째 프로세서 블룸필드 시리즈와 다른 점이 많다.
눈에 보이는 것으로는 소켓 규격을 들 수 있다. 블룸필드는 1366핀 소켓을 쓰지만 린필드는 1156핀 소켓을 쓴다. 메모리 구성 조건도 트리플채널에서 듀얼채널로 바뀌었다. 소비전력과 밀접한 설계 전력(TDP)는 130W에서 95W로 줄었다. 물론 이런 부분은 공정 개선 단계에서도 흔하게 볼 수 있는 변화다. 중요한 점은 플랫폼 구조의 변화다.
린필드 CPU는 그래픽카드를 위한 데이터 통로인 PCI 익스프레스 버스 컨트롤러를 지니고 있다. CPU와 그래픽카드가 거간꾼 없이 직접 데이터를 주고받는다는 이야기다. 지금까지는 둘 사이에 중계자 구실을 하는 칩셋, 정확하게 노스브리지라는 칩이 있었다. 블룸필드 코어의 코어 i7은 물론이고, 코어 2 시리즈, 페넘과 애슬론, 멀게는 모든 펜티엄이 노스브리지의 도움을 받아 그래픽카드와 데이터를 주고받았고, 지금도 마찬가지다. 린필드 프로세서는 내부에 PCI 익스프레스 버스 컨트롤러를 갖춰 그래픽카드와 직접 연결된다. 기존 메인보드 형태에 존재하던 노스브리지의 역할은 CPU가 흡수해 버렸다. CPU는 기능이 많아지고 그만큼 구조가 복잡해졌지만 반대로 칩셋과 메인보드는 하는 일이 크게 줄었다. 린필드와 짝을 이루는 인텔 칩셋 P55는 노스브리지가 없이 사우스브리지만 있는 단일 칩 형태의 칩셋이다. 칩이 하나뿐이니 ‘칩셋’(chipset)은 틀린 말이다.
이 반쪽짜리 칩셋은 하드디스크, 사운드, USB, 네트워크 컨트롤러 등이 보낸 신호를 CPU로 전달하고, CPU가 내린 명령을 다른 장치에 전달한다. CPU하고는 다이렉트 미디어 인터페이스(DMI)라는 데이터 통로를 거쳐 연결된다. 블룸필드에서 CPU와 칩셋의 연결통로를 담당하던 QPI는 린필드에서는 더 이상 찾아 볼 수 없다.
린필드도 코어 i7, 이거 헷갈리네
이런 큰 차이가 있지만 CPU의 근간에 해당하는 연산 유닛에는 변화가 없다. 네할렘 아키텍처로 분류되는 이유가 여기에 있다. 같은 것은 아키텍처만이 아니다. 이름도 코어 i7로 같다.
이번에 인텔이 발표한 린필드 프로세서는 하이퍼스레딩 기술 지원 여부에 따라 코어 i7과 코어 i5로 구분한다. 클록인 2.93GHz인 린필드 870과 2.8GHz인 860은 코어 i7로, 2.66GHz에 하이퍼스레딩 재주가 빠진 750은 코어 i5로 나뉜다. CPU 구조나 플랫폼에 따라 CPU 등급을 구별하지 않고, 성능이나 값을 중심으로 선을 긋는 것을 좋아하는 인텔다운 정책이라고 할 수 있다.
린필드는 인텔 P55라는 새로운 칩셋과 호흡을 맞춘다. 메모리 제어, 그래픽카드 버스 컨트롤 등 메인보드의 주요 기능을 모두 CPU에 건내준 만큼 칩셋 자체의 특징적인 부분은 전무하다. 다만 칩이 하나뿐이어서 메인보드를 구조와 설계가 매우 단순해지고, 제조비용도 크게 줄어들 것으로 보인다. 현재 P55 칩셋 메인보드는 7~8종이 등장했다. 아직 시장형성이 되지 않아서 값은 전부 20만 원 이상에 포진해 있다. 린필드 프로세서가 본격적으로 팔리기 시작하면 10만 원대 메인보드도 많이 등장할 것으로 보인다.
이번에 새로 나온 네할렘 아키텍처의 린필드는 클록과 추가 기능에 따라 코어 i7과 코어 i5로 나뉜다. 린필드 코어 i7은 종전의 블룸필드 코어 i7과 전혀 호환이 되지 않고, 코어 i5와 뚜렷한 기술적 차이점이 없어 소비자의 혼란이 예상된다.
왼쪽부터 코어 i7 920(블룸필드), 코어 i5 750(린필드), 코어 2 쿼드 Q9550이다. 린필드는 생김새는 블룸필드와 비슷하지만 그보다 크기가 작다. 세 CPU는 내부 구조가 다르고 서로 다른 소켓을 쓰는 탓에 메인보드를 함께 쓰지는 못한다.
소켓 1366
소켓 1156
소켓775
왼쪽부터 블룸필드의 소켓 1366, 린필드의 소켓 1156, 코어 2 시리즈의 소켓 775다. 린필드는 블룸필드보다 CPU 크기가 줄어든 만큼 소켓도 작아졌다. 소켓 775와 거의 비슷하지만 쿨러 걸쇠 간격이 달라서 쿨러를 함께 쓸 수는 없다.
코어 i3, 클럭데일로 이어지는 인텔 라인업
린필드의 뒤를 이어 내년에는 32나노미터 공정의 클럭데일이 등장한다. 이 CPU는 메모리 컨트롤러뿐 아니라 그래픽 코어까지 집어삼킨다. 모델명은 코어 i5와 i3이 될 전망이다. 이로써 코어 2에서 코어 i 시리즈로 전환이 마무리된다.
클럭데일은 린필드와 마찬가지로 LGA 1156 소켓을 쓰고, 칩셋과 DMI를 이용해 데이터를 주고받는다. 듀얼채널 메모리 컨트롤러와 터보 부스트 역시 린필드와 동일하다.
린필드의 경쟁 상대는 블룸필드
코어 i5 750, 코어 i7 920 끌어내리고 인텔 고성능 주력 CPU로 자리매김할 것으로 보인다. 동일 클록에서 성능은 비슷하지만 단일 스레드 작업에서는 터보 부스트가 개선된 린필드가 강세다. 시스템 구성비용과 소비전력에서도 린필드가 유리하다.
기본 성능 테스트 시네벤치 R10
멀티코어 CPU에서 각 코어가 CPU 1개의 몫만큼 일을 한다면 가장 이상적이겠지만 여러 가지 제한 때문에 실제로는 그렇지 못하다. 시네벤치 R10은 멀티코어가 얼마나 효율적으로 설계되었는지 알아볼 수 있는 테스트 툴이다. 린필드와 블룸필드의 기본 아키텍처는 같지만 메모리 컨트롤러 구성이 달라진 만큼 성능에도 차이가 날 수밖에 없다.
테스트 결과 코어 i5 750은 코어 i7 920보다 약 10% 안팎의 성능 차이를 보였다. 둘의 클록은 2.66GHz로 동일하다. 다만 코어 1개마다 2개의 스레드를 처리하는 하이퍼스레딩에 차이가 있다. 이 기술의 도움을 받은 코어 i7 920은 작업을 8개의 스레드로 나누어 처리했고, 하이퍼스레딩 기술이 빠진 코어 i5 750은 4개의 스레드로 나누어 처리했다.
한편 2.83GHz의 코어 2 쿼드 Q9550은 높은 클록의 힘을 받지 못하고, 구조가 개선된 두 네할렘 프로세서에 뒤지는 모습을 보였다. 이는 3.2GHz의 클록을 자랑하는 AMD 페넘 II X4 955 역시 다르지 않았다. 이는 네할렘 아키텍처가 코어 마이크로 아키텍처나 페넘 시리즈의 K10 아키텍처보다 우수하다는 뜻이다.
코어 i7 920은 하이퍼스레딩 기술을 지녀 시네벤치 R10의 테스트를 8개 스레드로 나누어 처리한다.
하이퍼스레딩 기술이 없는 코어 i5 750은 시네벤치 R10의 테스트를 4개 스레드로 나누어 처리한다.
■ 시네벤치 R10
■ PC마크 밴티지
■ 3D마크 06/밴티지
■ 3D 게임
■ 동영상 인코딩
※각 메인보드의 바이오스 설정은 기본 값으로 맞췄다.
시스템 종합 성능 테스트 PC마크 밴티지
트리플채널 메모리 컨트롤러의 도움을 받은 블룸필드가 린필드를 앞섰지만 동일한 듀얼채널 구성에서는 어떤 차이를 보여주는지 확인해보자. 테스트 툴은 ‘PC마크 밴티지’를 썼다. 블룸필드는 메모리 구성을 바꿔 2번 테스트했다.
테스트 결과, 블룸필드는 트리플채널 구성에서 린필드를 앞섰지만 듀얼채널 구성에는 린필드만 못한 점수를 얻었다. PC마크 밴티지 기본 테스트 모음에서 코어 i7 920은 램을 3개 꽂아 트리플채널로 구성했을 때 6,207점, 램을 2개 꽂아 듀얼채널로 구성했을 때 5,973점을 받았다. 한편 코어 i5 750은 6,327점을 기록했다. 오차 범위에 지나지 않지만 트리플채널의 도움을 받은 코어 i7을 앞서는 결과다.
PC마크 밴티지에서는 코어 i7/i5 시리즈와 페넘 II X4 955의 성능 차이가 그렇게 크지 않았다는 점도 주목할 만하다.
3D 기본 성능 테스트 3D마크 06/밴티지
3D 연산 능력에서는 코어 i7이 코어 i5를 확실하게 앞서는 모습이다. 차이가 이상할 정도로 큰데, CPU 내부로 자리를 옮긴 PCI 익스프레스 컨트롤러가 드라이버의 불안으로 제 성능을 내지 못한 것이 아닐까 생각된다. 린필드 코어 i7과 i5는 9월 초에 공식 발표된다. 테스트를 진행할 때는 공식 드라이버가 발표되기 전이다. 이 부분은 린필드가 공식 발표된 뒤 다시 테스트를 진행해 확인하기로 했다.
3D 게임 성능 테스트 스트리트파이터 4/레지던트 이블 5/HAWX
이번 테스트는 3D 마크와 정반대되는 결과가 나왔다. <스트리터파이터 4> 테스트에서 코어 i7 920이 코어 i5보다 크게 뒤쳐졌다. 하지만 <HAWX>와 <레지던트 이블 5>에서는 큰 차이를 보이지 않았다. 터보 부스트의 영향으로 생각되는데, 린필드와 블룸필드는 모두 터보 부스트 기술을 지원하지만 최대 배수에 차이가 있다. 터보 부스트가 작동할 때 코어 i7 920은 2.9GHz로 작동하지만 코어 i5 750은 3.2GHz로 작동한다.
터보 부스트는 1개 또는 2개 코어에만 부하가 걸릴 때 최대 배수로 작동한다. <스트리터 파이터 4> 테스트를 돌리면서 확인한 결과 2개의 코어만 바쁘게 돌아갔고, CPU 전체 점유율은 40% 이하였다. 때문에 터보 부스트가 최대 배수로 작동하면서 2개 코어의 클록을 끌어올려 높은 점수를 받은 것이다. 한편 <레지던트 이블 5>와 <HAWX>는 4개 코어 모두 연산에 참여했고, CPU 점유율은 80%를 넘어섰다. 두 게임에서 코어 i5 750은 2.8GHz로 작동했다.
이 결과에서 알 수 있듯이 터보 부스트는 4개의 코어를 모두 활용하지 못하는 프로그램에서만 최대 효과를 보인다. 또 블룸필드에서 큰 효용성을 보여주지 못하던 터보 부스트가 린필드에서는 크게 개선되었다는 것을 확인할 수 있다. 게임에서는 클록이 높은 듀얼코어가 쿼드코어보다 낫다는 말은 린필드 앞에서는 더 이상 통하지 않는다.
<스트리터파이터 4>는 테스트 중에도 CPU 점유율이 40%를 넘는 일이 없고, 2개 코어에만 부담이 걸려 터보 부스트가 최대 속도로 작동할 수 있었다.
동영상 인코딩 다음 팟인코더
보통 동영상 인코딩 테스트에는 외국에서 표준으로 쓰이는 프로그램이 많이 쓰이지만 국내 실정과는 거리가 있다. 이번 테스트는 많은 이용자를 거느린 다음 팟인코더를 써서 성능을 비교했다. 테스트를 위해 mpeg2와 divx 포맷의 동영상 파일을 준비했고, 이를 각각 mkv(h.264)와 wmv(wmv2) 형태로 변환하는 시간을 쟀다.
첫 번째 동영상 인코딩에서 코어 i7 920과 i5 750의 성능 차이는 크지 않았다. 코어 2 쿼드 Q9550과 페넘 II X4 955와는 차이가 크게 벌어졌지만 같은 네할렘 아키텍처의 두 CPU는 91초와 93초를 기록하며 순서대로 결승선을 밟았다.
두 번째 동영상에서는 13초 차이를 기록했으며, 코어 2 쿼드와 페넘 II X4의 차이가 크게 줄었다. mpeg2를 h.264로 변환하는 작업은 높은 CPU 성능을 필요로 하지만 divx를 wmv로 바꾸는 일은 CPU에 큰 부담을 주지 않는다.
상황별 소비전력 에너지 효율 비교
아무리 성능이 좋고 값이 비싼 하이엔드 CPU라도 전기를 많이 쓰면 녹색성장시대를 여는 정부정책을 정면으로 거스르는 반동 CPU일 수밖에 없다. 이점에서 코어 i7(블룸필드) 시리즈는 고개를 숙일 수밖에 없다. 130W에 이르는 높은 설계전력으로 듀얼코어 CPU 2개 이상의 전기를 먹어치우기 때문이다. 린필드로 바뀐 코어 i7과 코어 i5는 어떨까? 우선 기본 TDP(설계전력)가 95W로 상당히 낮아졌다. 이는 다른 쿼드코어와 동일한 수준이다.
아무 작업도 하지 않아 CPU 점유율이 1~2%일 때와 동영상 재생과 인코딩 작업 중, 과부하 테스트로 CPU 점유율이 100%일 때의 소비전력을 비교했다. 단 여기서 측정한 것은 CPU의 소비전력이 아니라 시스템 전체의 값이다. 플랫폼이 다른 만큼 어느 정도 오차를 감안해서 살펴야 한다.
코어 i5 950은 전반적으로 코어 i7 920보다 소비전력이 상당히 줄었음을 알 수 있다. 또 코어 2 쿼드보다도 전기를 적게 쓴다. CPU 점유율 100%일 때 코어 i7 920은 266와트, 코어 i5 750는 207와트, 코어 2 쿼드 Q9550은 230와트를 기록했다. 참고로 페넘 II X4 955는 243와트를 기록했다.
멀티미디어 기기에 동영상을 담아 즐기는 이라는 적어도 한번쯤은 써봤을 다음 팟 인코더로 동영상 변환 속도를 비교했다.
사치스런 블룸필드를 대신할 주력 쿼드코어로 낙점
블룸필드란 코드명이 더 익숙한 인텔 코어 i7 900 시리즈는 성능만큼이나 모시기가 까다롭고 사치스런 CPU다. 본인의 몸값은 둘째치더라도, 40만 원대 메인보드가 아니면 솜씨를 보여주지도 않는 도도함은 거부감이 들 정도다. 린필드로 다시 태어난 코어 i7과 i5는 이런 건방진 모습과는 거리를 두고 있다. 가장 인기가 좋을 것으로 예상되는 코어 i5 750은 30만 원 이하에 구할 수 있고, 메인보드는 20만 원에서 찾아볼 수 있다. 소비전력이 크게 줄고, 멀티코어와 궁합이 맞지 않는 프로그램에서 높은 성능을 낼 수 있게 거드는 터보 부스트 기술도 한층 다듬어진 모습이다.
다만 종전 코어 i7과 헷갈리는 이름으로 나온 점은 무척 아쉽다. 아무리 성능을 기준으로 CPU 등급을 나누는 것이 원칙이라고 해도 소비자들은 린필드는 코어 i5, 블룸필드는 코어 i7처럼 단순 명료한 구분을 원한다. 앞으로 린필드와 블룸필드의 차이를 물어볼 수많은 독자에게 매번 어떻게 답을 해야 할지 캄캄하다.
■ 소비전력
저작권자 © 디지털포스트(PC사랑) 무단전재 및 재배포 금지