설계 바꾸니 성능↑전력↓, 지포스 GTX 460 ①
■스트리밍 멀티프로세서 구조 개선한 GF104
페르미 기술은 스트리밍 멀티프로세서(SM)라는 블록을 기본 단위로 한다. 지포스 GTX 480/470/465의 GPU인 GF100은 16개의 SM으로 구성된다. 최상위 모델인 GTX 480은 SM 1개가 비활성화 되어 있다. GTX 470은 14개, GTX 465는 11개의 SM만 이용한다.
한 개의 SM에는 3D 물체의 뼈대와 형태를 구성하는 셰이더 프로세서가 32개, 표면에 그림을 입히는 텍스처 유닛이 4개씩 들어간다. 따라서 SM 15개가 작동하는 GTX 480의 셰이더 프로세서는 480개가 되고, 텍스처 유닛은 60개가 된다.
16개의 SM으로 구성된다. 하나의 SM에는 셰이더 프로세서가 32개, 텍스처 유닛이 4개씩 들어간다.
8개의 SM으로 구성된다. 하나의 SM에는 셰이더 프로세서가 48개, 텍스처 유닛이 8개씩 들어간다.
지포스 GTX 460에는 SM 8개로 구성되는 GF104라는 GPU가 올라간다. 1개의 SM에는 셰이더 프로세서가 48개, 텍스처 유닛은 8개가 들어간다. 셰이더 프로세서나 텍스처 유닛의 정확히 무슨 역할을 하는지는 알 필요가 없다.
자동차 엔진의 배기량, 4기통 또는 6기통 등을 따질 때 기통을 뜻하는 실린더 수, 변속기의 단수처럼 각 구성품을 어떻게 조합하느냐에 따라 연료는 많이 먹고 연비는 나쁜 차가 되기도 하고, 연료는 적게 쓰면서 힘과 연비까지 좋은 차가 되기도 하듯이 그래픽카드의 GPU도 각 부품의 역할을 고려해 효율적으로 조합해야 성능과 소비전력, 효율이 좋아진다는 것만 이해하면 된다.
■ 페르미 기술 그래픽카드 제원
GTX 460 | GTX 460 | GTX 465 | GTX 470 | GTX 480 | |
스트리밍 | 7 | 7 | 11 | 14 | 15 |
셰이더 | 336(48×7) | 336(48×7) | 352(32×11) | 448(32×14) | 480(32×15) |
텍스처 유닛 | 56(8×7) | 56(8×7) | 44(4×11) | 56(4×14) | 60(4×15) |
최종 처리 장치 | 24(8×3) | 32(8×4) | 32(8×4) | 40(8×5) | 48(8×6) |
코어 클록 | 675MHz | 675MHz | 607MHz | 607MHz | 700MHz |
셰이더 클록 | 1,350MHz | 1,350MHz | 1,215MHz | 1,215MHz | 1,401MHz |
메모리 클록 효율 | 3,600MHz | 3,600MHz | 3,200MHz | 3348MHz | 3,696MHz |
비디오 메모리 | 768MB | 1,024MB | 1,024MB | 1,280MB | 1,536MB |
비트 폭 | 192비트 | 256비트 | 256비트 | 320비트 | 384비트 |
메모리 대역폭 | 86.4GB/초 | 115.2GB/초 | 102.6GB/초 | 133.9GB/초 | 177.4GB/초 |
제조 공정 | 40nm | 40nm | 40nm | 40nm | 40nm |
TDP | 150와트 | 160와트 | 200와트 | 215와트 | 250와트 |
■메모리 제원과 성능 다른 2개 제품으로 구분
지포스 GTX 460은 메모리가 768MB인 제품과 1GB인 제품 두 종류가 있다. 메모리 용량뿐 아니라 비트폭, 그래픽을 메모리로 전달하는 최종 처리 장치(Rop)의 숫자도 다르다. 성능에 상당한 영향을 미치는 부분인 만큼 셰이더 프로세서나 텍스처 유닛 수가 같더라도 두 제품의 성능은 다를 수밖에 없다.
CPU의 크기는 동일하다. 제원에 차이가 나는 이유는 GTX 460 768MB이 GF104의 일부 회로를 쓰지 않기 때문이다. GF104에는 메모리 컨트롤러와 Rop 블록이 각각 4개씩인데, 768MB 모델은 이 중 3개만을 이용한다.
엔비디아 표준 제원을 따르면 기판 길이는 21cm고, 소비전력은 150W, 보조전원 케이블은 6핀 2개를 연결해야 한다. 기준 가격은 GTX 460 768MB 제품이 199달러, 1024MB 제품이 229달러다.
6핀 보조전원 2개를 연결해야 작동하는 것은 지포스 GTX 465과 같지만 GF104는 GF100보다 소비전력이 상당히 낮아졌기 때문에 전원공급장치는 450W짜리를 권장하고 있다.
■상위 제품의 존재를 무시하는 성능
지포스 GTX 460의 성능을 알아보기 위해 상위 제품인 지포스 GTX 465와 경쟁 제품인 라데온 HD 5850, HD 5830을 준비했다. 지포스 GTX 460은 3개 모델을 준비했는데, 표준 제원을 따른 지포스 GTX 460 768MB 제품, 클록을 20MHz 정도 올린 768MB 제품, 그리고 클록을 100MHz 이상 높인 GTX 460 1024MB 제품 3가지다.
다이렉트X 10 기반 테스트는 3D 마크 밴티지를 이용했다. 다이렉트X 11 기반의 테스트는 스토커: 콜오브프리피야트, 헤븐 벤치 2.1 등을 이용했다.
<3D 마크 밴티지>
구분1 | 종합 점수 | 종합 점수 | GPU 점수 | GPU 점수 |
구분2 | 퍼포먼스 | 익스트림 | 퍼포먼스 | 익스트림 |
라데온 HD 5850 | 13460 | 7125 | 14499 | 6995 |
GTX 460 1GB(800MHz) | 13391 | 7547 | 14408 | 7423 |
라데온 HD 5830 | 12497 | 6019 | 13026 | 5878 |
GTX 460 768MB(700MHz) | 11664 | 6108 | 11865 | 5969 |
GTX 465 | 11542 | 5998 | 11681 | 5858 |
GTX 460 768MB(675MHz) | 11406 | 5944 | 11533 | 5801 |
3D 마크 밴티지의 결과부터 살펴보자. 테스트 세팅은 기본 값인 퍼포먼스에 두었고, PPU 옵션만 비활성화하고 진행했다. 테스트 결과를 보면 알 수 있듯이 지포스 GTX 460 768MB는 기본 클록에서 지포스 GTX 465와 차이가 없는 성능을 냈다. 오버클록을 한 GTX 460 1024MB 모델은 값이 한참 더 비싼 라데온 HD 5850과 어깨를 나란히 한다.
<스토커: 콜오브프리피야트 벤치마크 툴> 구분 day night rain sun shafts 평균 라데온 HD 5850 77.3 71.6 78.2 36.4 65.88fps GTX 460 1GB(800MHz) 75.5 68.4 73.6 44.5 65.50fps GTX 460 768MB(700MHz) 66.3 59.7 64.6 37.8 57.10fps GTX 465 64.9 58.7 62.8 38.9 56.33fps 라데온 HD 5830 65 61.7 67.3 31.2 56.30fps GTX 460 768MB(675MHz) 63.9 58.6 62.5 36.8 55.45fps
<헤븐 벤치 2.1>
구분 | 초당 프레임 | 점수 |
GTX 460 1GB(800MHz) | 37.4fps | 941 |
GTX 465 | 31.8fps | 800 |
GTX 460 768MB(700MHz) | 31fps | 781 |
GTX 460 768MB(675MHz) | 30.3fps | 763 |
라데온 HD 5850 | 28.3fps | 712 |
라데온 HD 5830 | 24.7fps | 622 |
다이렉트X 11 환경이라고 결과는 다르지 않다. 스토커: 콜오브프리피야트 벤치마크 툴에서 GTX 460은 GTX 465는 물론 경쟁 제품과 견줘도 전혀 부족함 없는 모습을 보여주고 있다. 다이렉트X 11의 테셀레이션 성능을 중점적으로 살피는 헤븐 벤치 2.1의 결과는 더욱 놀랍다.
이 테스트에서 엔비디아 지포스 GTX 400 시리즈가 라데온 HD 5000 시리즈보다 유리하다는 것은 익히 예상한 바지만 GTX 460과 GTX 465의 차이가 거의 없다는 것은 쉽게 이해가 되지 않는다. GTX 465가 GTX 460보다 셰이더 프로세서는 물론 테셀레이션 처리 엔진의 수가 더 많기 때문이다.
GTX 460이 잘 만든 그래픽카드라는 해석도 가능하지만 반대로 GTX 465는 물론 GTX 470/480에 쓰이는 GF100이 매우 비효율적으로 설계된 그래픽 프로세서라는 뜻도 된다.
지포스 GTX 400 시리즈는 뛰어난 성능만큼이나 소비전력이 높아서 지탄을 받았다. GTX 460은 구조를 크게 변경한 만큼 어느 정도 효율이 개선되었으리라는 기대를 모았다. 예상대로 지포스 GTX 465보다 소비전력이 낮았으며, 경쟁제품인 라데온 HD 5830보다도 전력 효율이 좋았다. 클록을 무려 100MHz 이상 높인 GTX 460 1024MB 오버클록 제품은 GTX 465와 큰 차이가 없었지만 성능에서 한발 앞서는 만큼 납득할 수 있는 부분이다.
<소비전력> 구분 최소 최대 GTX 460 768MB(675MHz) 95.6W 220.2W GTX 460 768MB(700MHz) 90.6W 232.4W GTX 460 1GB(800MHz) 96.3W 266W GTX 465 112.3W 265.5W 라데온 HD 5830 106.6W 245.7W 라데온 HD 5850 104.9W 234.4W
※테스트 PC 제원 : 페넘 II X4 955 블랙에디션(3.6GHz), DDR3-1333 2GB 2개, 아수스 M4A88TD-V EVO/USB3(AMD 880G), 윈도우 7 얼티밋 32비트
7월 현재 지포스 GTX 460은 20만 원대 후반에서 30만 원대 중반에 팔린다. 성능뿐 아니라 값도 GTX 465와 겹치는 셈이어서 곧 GTX 465는 자연스럽게 시장에서 퇴출될 것으로 예상된다.
게다가 GTX 470도 위치가 상당해 애매한 처지에 놓이게 되었다. 오버클록된 지포스 GTX 460 1024MB 제품이 라데온 HD 5850보다 높은 성능을 기록했으니 HD 5850보다 조금 떨어지거나 비슷한 성능을 지닌 것으로 평가되는 GTX 470도 제 값을 못하는 제품이 되어버리고 말았다.
엔비디아는 지포스 GTX 460으로 다이렉트X 11 시장을 세차게 두드릴 태세다. 발표와 동시에 거의 모든 제조사가 제품을 출시했으며, 오랜만에 소비자를 대상으로 출시 행사도 가졌다. 다만 아직은 값이 상당히 부담스러운 편이어서 주력 제품으로 자리 잡으려면 조금 더 시간이 필요하다.