설계 바꾸니 성능↑전력↓, 지포스 GTX 460 ①

2011-09-06     편집부
엔비디아가 4번째 다이렉트X 11 그래픽카드를 내놓았다. 이름은 종전 제품과 큰 차이가 없는 ‘지포스 GTX 460’이지만 그래픽 프로세서의 구조는 크게 달라졌다. 지포스 GTX 460은 메모리 용량에 따라 두 가지 모델로 나뉜다. GDDR5 768MB를 얹은 제품과 GDDR5 1GB를 얹은 모델이다. 메모리 용량뿐 아니라 메모리 비트 폭, 최종 그래픽 처리 장치(Rop)의 숫자도 다르다. 메모리 비트 폭과 Rop은 성능에 상당한 영향을 주는 부분이어서 이에 따른 성능 차이도 적지 않을 것으로 예상된다.

■스트리밍 멀티프로세서 구조 개선한 GF104

페르미 기술은 스트리밍 멀티프로세서(SM)라는 블록을 기본 단위로 한다. 지포스 GTX 480/470/465의 GPU인 GF100은 16개의 SM으로 구성된다. 최상위 모델인 GTX 480은 SM 1개가 비활성화 되어 있다. GTX 470은 14개, GTX 465는 11개의 SM만 이용한다.

한 개의 SM에는 3D 물체의 뼈대와 형태를 구성하는 셰이더 프로세서가 32개, 표면에 그림을 입히는 텍스처 유닛이 4개씩 들어간다. 따라서 SM 15개가 작동하는 GTX 480의 셰이더 프로세서는 480개가 되고, 텍스처 유닛은 60개가 된다.
 
지포스 GTX 480/470/465의 GPU인 GF100의 구조도.
16개의 SM으로 구성된다. 하나의 SM에는 셰이더 프로세서가 32개, 텍스처 유닛이 4개씩 들어간다.
















지포스 GTX 460의 GPU인 GF104의 구조도.
8개의 SM으로 구성된다. 하나의 SM에는 셰이더 프로세서가 48개, 텍스처 유닛이 8개씩 들어간다.














지포스 GTX 460에는 SM 8개로 구성되는 GF104라는 GPU가 올라간다. 1개의 SM에는 셰이더 프로세서가 48개, 텍스처 유닛은 8개가 들어간다. 셰이더 프로세서나 텍스처 유닛의 정확히 무슨 역할을 하는지는 알 필요가 없다.

동차 엔진의 배기량, 4기통 또는 6기통 등을 따질 때 기통을 뜻하는 실린더 수, 변속기의 단수처럼 각 구성품을 어떻게 조합하느냐에 따라 연료는 많이 먹고 연비는 나쁜 차가 되기도 하고, 연료는 적게 쓰면서 힘과 연비까지 좋은 차가 되기도 하듯이 그래픽카드의 GPU도 각 부품의 역할을 고려해 효율적으로 조합해야 성능과 소비전력, 효율이 좋아진다는 것만 이해하면 된다.

■ 페르미 기술 그래픽카드 제원

GTX 460
768MB

GTX 460
1024MB

GTX 465

GTX 470

GTX 480

스트리밍
멀티프로세서

7

7

11

14

15

셰이더
프로세서

336(48×7)

336(48×7)

352(32×11)

448(32×14)

480(32×15)

텍스처 유닛

56(8×7)

56(8×7)

44(4×11)

56(4×14)

60(4×15)

최종 처리 장치

24(8×3)

32(8×4)

32(8×4)

40(8×5)

48(8×6)

코어 클록

675MHz

675MHz

607MHz

607MHz

700MHz

셰이더 클록

1,350MHz

1,350MHz

1,215MHz

1,215MHz

1,401MHz

메모리 클록 효율

3,600MHz

3,600MHz

3,200MHz

3348MHz

3,696MHz

비디오 메모리

768MB
GDDR5

1,024MB
GDDR5

1,024MB
GDDR5

1,280MB
GDDR5

1,536MB
GDDR5

비트 폭

192비트

256비트

256비트

320비트

384비트

메모리 대역폭

86.4GB/초

115.2GB/초

102.6GB/초

133.9GB/초

177.4GB/초

제조 공정

40nm

40nm

40nm

40nm

40nm

TDP

150와트

160와트

200와트

215와트

250와트


■메모리 제원과 성능 다른 2개 제품으로 구분

지포스 GTX 460은 메모리가 768MB인 제품과 1GB인 제품 두 종류가 있다. 메모리 용량뿐 아니라 비트폭, 그래픽을 메모리로 전달하는 최종 처리 장치(Rop)의 숫자도 다르다. 성능에 상당한 영향을 미치는 부분인 만큼 셰이더 프로세서나 텍스처 유닛 수가 같더라도 두 제품의 성능은 다를 수밖에 없다.

C
PU의 크기는 동일하다. 제원에 차이가 나는 이유는 GTX 460 768MB이 GF104의 일부 회로를 쓰지 않기 때문이다. GF104에는 메모리 컨트롤러와 Rop 블록이 각각 4개씩인데, 768MB 모델은 이 중 3개만을 이용한다.

엔비디아 표준 제원을 따르면 기판 길이는 21cm고, 소비전력은 150W, 보조전원 케이블은 6핀 2개를 연결해야 한다. 기준 가격은 GTX 460 768MB 제품이 199달러, 1024MB 제품이 229달러다.

6핀 보조전원 2개를 연결해야 작동하는 것은 지포스 GTX 465과 같지만 GF104는 GF100보다 소비전력이 상당히 낮아졌기 때문에 전원공급장치는 450W짜리를 권장하고 있다.

■상위 제품의 존재를 무시하는 성능

지포스 GTX 460의 성능을 알아보기 위해 상위 제품인 지포스 GTX 465와 경쟁 제품인 라데온 HD 5850, HD 5830을 준비했다. 지포스 GTX 460은 3개 모델을 준비했는데, 표준 제원을 따른 지포스 GTX 460 768MB 제품, 클록을 20MHz 정도 올린 768MB 제품, 그리고 클록을 100MHz 이상 높인 GTX 460 1024MB 제품 3가지다.

이렉트X 10 기반 테스트는 3D 마크 밴티지를 이용했다. 다이렉트X 11 기반의 테스트는 스토커: 콜오브프리피야트, 헤븐 벤치 2.1 등을 이용했다.

<3D 마크 밴티지>

구분1

종합 점수

종합 점수

GPU 점수

GPU 점수

구분2

퍼포먼스

익스트림

퍼포먼스

익스트림

라데온 HD 5850

13460

7125

14499

6995

GTX 460 1GB(800MHz)

13391

7547

14408

7423

라데온 HD 5830

12497

6019

13026

5878

GTX 460 768MB(700MHz)

11664

6108

11865

5969

GTX 465

11542

5998

11681

5858

GTX 460 768MB(675MHz)

11406

5944

11533

5801


3D 마크 밴티지의 결과부터 살펴보자. 테스트 세팅은 기본 값인 퍼포먼스에 두었고, PPU 옵션만 비활성화하고 진행했다. 테스트 결과를 보면 알 수 있듯이 지포스 GTX 460 768MB는 기본 클록에서 지포스 GTX 465와 차이가 없는 성능을 냈다. 오버클록을 한 GTX 460 1024MB 모델은 값이 한참 더 비싼 라데온 HD 5850과 어깨를 나란히 한다.

<스토커: 콜오브프리피야트 벤치마크 툴>

구분

day

night

rain

sun shafts

평균

라데온 HD 5850

77.3

71.6

78.2

36.4

65.88fps

GTX 460 1GB(800MHz)

75.5

68.4

73.6

44.5

65.50fps

GTX 460 768MB(700MHz)

66.3

59.7

64.6

37.8

57.10fps

GTX 465

64.9

58.7

62.8

38.9

56.33fps

라데온 HD 5830

65

61.7

67.3

31.2

56.30fps

GTX 460 768MB(675MHz)

63.9

58.6

62.5

36.8

55.45fps


<헤븐 벤치 2.1>

구분

초당 프레임

점수

GTX 460 1GB(800MHz)

37.4fps

941

GTX 465

31.8fps

800

GTX 460 768MB(700MHz)

31fps

781

GTX 460 768MB(675MHz)

30.3fps

763

라데온 HD 5850

28.3fps

712

라데온 HD 5830

24.7fps

622


다이렉트X 11 환경이라고 결과는 다르지 않다. 스토커: 콜오브프리피야트 벤치마크 툴에서 GTX 460은 GTX 465는 물론 경쟁 제품과 견줘도 전혀 부족함 없는 모습을 보여주고 있다. 다이렉트X 11의 테셀레이션 성능을 중점적으로 살피는 헤븐 벤치 2.1의 결과는 더욱 놀랍다.

이 테스트에서 엔비디아 지포스 GTX 400 시리즈가 라데온 HD 5000 시리즈보다 유리하다는 것은 익히 예상한 바지만 GTX 460과 GTX 465의 차이가 거의 없다는 것은 쉽게 이해가 되지 않는다. GTX 465가 GTX 460보다 셰이더 프로세서는 물론 테셀레이션 처리 엔진의 수가 더 많기 때문이다.

GTX 460이 잘 만든 그래픽카드라는 해석도 가능하지만 반대로 GTX 465는 물론 GTX 470/480에 쓰이는 GF100이 매우 비효율적으로 설계된 그래픽 프로세서라는 뜻도 된다.

■혼란스러운 엔비디아 다이렉트X 11 VGA 라인업

지포스 GTX 400 시리즈는 뛰어난 성능만큼이나 소비전력이 높아서 지탄을 받았다. GTX 460은 구조를 크게 변경한 만큼 어느 정도 효율이 개선되었으리라는 기대를 모았다. 예상대로 지포스 GTX 465보다 소비전력이 낮았으며, 경쟁제품인 라데온 HD 5830보다도 전력 효율이 좋았다. 클록을 무려 100MHz 이상 높인 GTX 460 1024MB 오버클록 제품은 GTX 465와 큰 차이가 없었지만 성능에서 한발 앞서는 만큼 납득할 수 있는 부분이다.

<소비전력>

구분

최소

최대

GTX 460 768MB(675MHz)

95.6W

220.2W

GTX 460 768MB(700MHz)

90.6W

232.4W

GTX 460 1GB(800MHz)

96.3W

266W

GTX 465

112.3W

265.5W

라데온 HD 5830

106.6W

245.7W

라데온 HD 5850

104.9W

234.4W

※테스트 PC 제원 : 페넘 II X4 955 블랙에디션(3.6GHz), DDR3-1333 2GB 2개, 아수스 M4A88TD-V EVO/USB3(AMD 880G), 윈도우 7 얼티밋 32비트

7월 현재 지포스 GTX 460은 20만 원대 후반에서 30만 원대 중반에 팔린다. 성능뿐 아니라 값도 GTX 465와 겹치는 셈이어서 곧 GTX 465는 자연스럽게 시장에서 퇴출될 것으로 예상된다.

게다가 GTX 470도 위치가 상당해 애매한 처지에 놓이게 되었다. 오버클록된 지포스 GTX 460 1024MB 제품이 라데온 HD 5850보다 높은 성능을 기록했으니 HD 5850보다 조금 떨어지거나 비슷한 성능을 지닌 것으로 평가되는 GTX 470도 제 값을 못하는 제품이 되어버리고 말았다.

엔비디아는 지포스 GTX 460으로 다이렉트X 11 시장을 세차게 두드릴 태세다. 발표와 동시에 거의 모든 제조사가 제품을 출시했으며, 오랜만에 소비자를 대상으로 출시 행사도 가졌다. 다만 아직은 값이 상당히 부담스러운 편이어서 주력 제품으로 자리 잡으려면 조금 더 시간이 필요하다.