코어1천개 CPU 나올 날 머지 않았다-인텔과 AMD 멀티코어 해법을 열어봤다
인텔이 코어 2 듀오를 내놓고 숨 돌릴 시간도 없이 쿼드코어 ‘켄츠필드’를 내놓을 수 있었던 것은 기술보다 시장 주도에 가치를 두고 있었기에 가능한 일이었다. 켄츠필드는 하나의 CPU에 코어 2 듀오를 두 개 얹은 방법으로 만들었다. 펜티엄 D에서도 썼던 이 방법은 코어 수를 손쉽게 2배로 늘릴 수 있지만 이러한 코어 늘리기를 비난하는 이가 적지 않다. 코어가 늘어난 만큼 성능이 나아지지 않았다는 게 가장 큰 이유다. 펜티엄 D에서 문제가 되던 코어 사이의 데이터 공유와 시스템버스의 한계로 인한 성능 저하가 되풀이 되고 있다. 각 코어의 성능을 1이라고 할 때 코어 2 듀오가 약 0.8×2라면 코어 2 쿼드는 0.6×4의 성능밖에 내지 못하는 셈이다. |
인텔은 지난 IDF 2006에서 “적절한 시기에 제품을 출시하려면 큰 변화를 기다리는 것보다 작은 변화를 여러 차례 거쳐 가는 것이 낫다”고 주장한 바 있다. 펜티엄 D나 코어 2 쿼드, 쿼드코어 제온 시리즈 등처럼 이전 단계 CPU 칩 2개를 하나의 CPU 기판에 얹는 방식을 ‘멀티 칩’ 패키징이라고 한다. 멀티 칩이라고 해봤자 2개 이상의 칩을 하나의 CPU 기판에 얹기는 현실적으로 불가능함으로 투 칩 패키징이라고 해도 크게 틀리지는 않다. 이 간단한 코어 늘리기 기술은 인텔의 중요한 멀티 코어 정책 중 하나다. 지난해 인텔의 로버트 크룩 부사장은 IDF 2006 서울에서 “멀티칩은 정책을 앞으로 계속 유지한다”고 말해 앞으로 옥타(8개) 코어도 멀티 칩 방식으로 등장할 가능성을 배제하지 않았다. |
인텔의 두 번째 쿼드코어, 즉 4개의 코어가 단일 칩 안에 조화롭게 들어간 쿼드코어 CPU는 올해 말이나 내년에 등장할 것으로 보인다. 현재의 분위기라면 그 뒤 얼마 지나지 않아 쿼드코어 칩 두 개를 얹은 옥타 코어 CPU가 등장할 가능성이 매우 높다. 퓨전은 범용 연산 프로세서인 CPU와 그래픽 가속 프로세서 GPU를 결합한 것이다. 퓨전은 쓰임새에 따라 CPU와 GPU의 수를 달리해 등장할 전망이다. 퓨전의 스트림 프로세서(GPU)는 3D 가속뿐 아니라 미디어 인코딩 등 멀티미디어 성능을 높이는 쪽으로도 적지 않은 활약을 할 수 있다. 각 코어의 성격이나 구조 자체가 다른 만큼 지금처럼 쿼드니 옥타니 하는 단순한 코어 숫자 구분의 큰 의미가 없어진다. 코어 수는 두 배로 늘고 있지만 늘어난 코어를 제대로 활용하는 프로그램이 많지 않다는 지금의 지적도 퓨전이 등장하면 잠잠해질 수밖에 없다. 또한 이미 CPU를 뛰어넘어버린 GPU의 소비전력으로 인한 문제도 함께 해결될 것으로 기대를 모으고 있다. |
차세대 멀티코어는 CPU와 GPU를 결합 펜티엄 D를 반쪽짜리 듀얼코어라고 깎아내렸고, 인텔 쿼드코어를 빗대어 바르셀로나를 ‘네이티브 쿼드코어’라고 부르고 있는 만큼 AMD가 쿼드코어 칩 2개를 써서 옥타코어를 내놓을 가능성은 거의 없다. AMD의 입장은 아직까지는 유보적이다. 코어 2 듀오 이후 3개월 만에 쿼드코어를 내놓고 “기술은 중요치 않다. 새로운 제품을 언제 소비자에게 공급할 수 있는가가 문제다”라고 주장한 인텔과 달리 AMD는 듀얼코어에서 쿼드코어로 넘어가는 데 무려 2년이 넘는 기간이 걸렸다. 하지만 쿼드코어에서 옥타코어로 넘어가는 기간은 그리 길지 않을 전망이다. AMD는 앞으로의 진로를 두 방향으로 잡았다. 첫째는 지금처럼 동일한 코어를 계속 2배로 늘려가는 전략이다. 2008년 쯤 AMD의 첫 옥타코어가 등장할 것으로 보인다. 단 이는 서버에 국한된다. 하나의 작업을 여러 개로 나누어 처리할 때 얻는 이득이 데스크탑에서는 그다지 크지 않다. 인텔의 코어 2 쿼드가 고전하는 이유도 이와 크게 다르지 않다. PC에서는 하나의 작업을 2~4개로 이상으로 분화해 처리할 필요가 없기 때문에 단순히 코어 수를 늘리는 것보다 특별한 연산 능력을 지닌 코어로 대체해 나가는 것이 바람직하다는 게 AMD의 생각이다. 지난해 AMD가 ATi를 인수한 이유가 바로 여기에 있다. 데스크탑에서 쿼드코어의 뒤는 복합 프로세서인 ‘퓨전’이 이어간다. |
병렬처리 최적화가 시급 |
제조공정에서 AMD보다 1년 이상 앞서는 인텔은 이점에서 상당히 유리한 고지에 있다. 아직 시장에는 등장하지 않았지만 현재 인텔은 45나노미터 제조공정으로 CPU를 만들고 있다. 65나노미터에서 쿼드코어를 만들어낸 만큼 곧 옥타코어를 내놓을 만한 기술력을 확보한 셈이다. 다만 아직까지 4개의 코어를 하나의 칩으로 묶어내는 기술을 확보하지 못했다는 문제가 있다. 면적으로 계산했을 때 하나의 CPU에 칩 4개를 얹을 수도 있지만 이 방법은 너무 비효율적이다. 코어 2 듀오와 코어 2 쿼드의 출시 간격으로 미루어 봤을 때 인텔은 네이티브 쿼드코어와 이 칩 2개를 얹은 옥타코어를 거의 동시에 발표할 가능성이 짙다. |
비록 멀티코어 CPU 연구를 위한 샘플이지만 이미 인텔은 80개 코어를 지닌 CPU를 시연한 바 있다. 단순히 코어의 숫자만 늘린다면 당장이라도 8 또는 16개 정도의 코어를 지닌 CPU를 내놓을 수 있겠지만 그에 앞서 효율을 높여야 한다. 효율을 높이기 위한 방법으로 코어 2 듀오의 공유 캐시가 가장 좋은 예다. 하지만 코어가 8개에서 16개, 그리고 그 이상으로 늘어나면 단순히 캐시를 함께 쓰는 것만으로는 부족하다. |
인텔은 80개 코어를 지닌 CPU를 연구하면서 ‘3D 스택 메모리’라는 개념을 도입했다. 지금까지 CPU는 코어와 캐시가 2차원으로 배열되었던 데 반해 이 기술은 3차원 구조를 띤다. 또한 각각의 코어는 인접한 다른 코어와 직접 데이터를 주고받는다.어떤 코어가 일을 하는지 따져 가장 빨리 데이터를 처리할 수 있는 방향으로 넘기는 동시에 각 애플리케이션에 맞춰 작업을 분할해 각 코어에 할당한다. 전체 코어에서 서너 개는 바이러스 스캔을 하고, 서너 개는 수식을 계산하는 방법이다. 각각의 코어는 위치에 관계없이 동시에 명령을 받고 연산을 하고 결과를 출력한다. 이 같은 병렬 연산의 최적화 구조든 AMD의 복합 프로세서든 모두 멀티코어의 효율을 높이기 위한 고민의 하나다. 인텔이 발표한 1테라플롭스 연산 능력을 갖춘 80코어 CPU는 연구개발을 위한 샘플 단계에 지나지 않는다. 하지만 이를 대대적으로 발표함으로써 CPU 단계 뿐 아니라 이를 활용할 소프트웨어 업계와 관련 하드웨어 업계의 분위기를 환기시켜 4개 또는 8개 이상의 멀티코어에 대한 대비를 갖추도록 유도하고 있다. |
신소재의 더 작은 트랜지스터 등장 멀티코어에서 개별 코어의 성능 하락을 막는 것만큼 중요한 것이 바로 소비전력이다. 코어가 늘어나면 소비전력 또한 그에 비례해서 증가할 수밖에 없다. CPU 제조사는 급한 불을 끄기 위해 클럭을 낮추는 방편을 쓰고 있다. 클럭을 10% 내리면 소비전력은 50%로 떨어진다는 점을 활용한 것이다. 하지만 이는 분명 한계가 있다. 클럭은 무작정 올릴 수도 없지만 그렇다고 계속 내릴 수도 없기 때문이다. 이를 위해 인텔은 새로운 소재의 트랜지스터를 개발했다. 새어나가는 전력이 적고, 더 낮은 전압에서 더 빠르게 작동하는 하이 K + 메탈 게이트가 그것으로 45나노미터 제조공정부터 적용할 예정이다. 이 기술을 발표하면서 인텔은 “새로운 하이 K 메탈게이트 트랜지스터를 45나노 공정 기술에 적용함으로써 향후 10년 동안에도 무어의 법칙을 계속 적용하는 데 도움이 될 것”이라고 자신했다. 또한 코어가 1천 개에 이르기까지 무어의 법칙을 이어나갈 수 있다고 전망했다. |