4K UHD & 8K UHD 시대를 위한 차세대 GPU, 엔비디아 지포스 RTX 4090 파운더스 에디션

2022-10-31     임병선 기자

[smartPC사랑=임병선 기자] 엔비디아의 새로운 GPU인 지포스 RTX 40 시리즈는 에이다 러브레이스(Ada Lovelace) 아키텍처를 기반으로 성능과 효율성이 크게 향상됐으며, AI를 사용해 픽셀을 생성하는 실시간 레이 트레이싱 및 뉴럴 렌더링 성능이 크게 향상되었다.

지포스 RTX 40 시리즈 중 가장 먼저 출시된 것은 지포스 RTX 4090으로, 가장 높은 성능을 지닌 라인업이다. 엔비디아에서 작업자를 위한 고성능 GPU 라인업인 타이탄 대신 지포스 RTX 30 시리즈부터는 90 라인업을 선보이고 있다. 이번 엔비디아의 새로운 GPU인 지포스 RTX 40 시리즈에도 이러한 90 라인업을 그대로 적용되었다.

최근 환율이 크게 오른 탓에 가격이 비싸다는 단점을 제외하면 성능이 대폭 올라가고 전성비가 뛰어난 등 장점이 더 많은 제품이다. 이어 지포스 RTX 4080 16GB도 출시될 예정이며, 후속 라인업도 제대로 된 성능 업을 보여주면 지포스 RTX 30 시리즈 자리를 금방 밀어낼 것으로 보인다.

smartPC사랑과 함께 지포스 RTX 4090 파운더스 에디션(FE)으로 지포스 RTX 40 시리즈는 지포스 RTX 30 시리즈와 비교해 무엇이 변화하고 강화되었는지 알아보자.

   

제원

GPU - 엔비디아 지포스 RTX 4090
버스 스탠더드 - PCI Express 4.0 x16
OpenGL - OpenGL 4.6
쿠다 코어 - 16,384
클럭 - 기본 클럭 2230MHz, 오버 클럭 : 2520MHz

비디오 메모리 - GDDR6X 24GB
메모리 인터페이스 - 384bit
최대 해상도 - 7680x4320@60Hz
출력 인터페이스 - HDMI 2.1a x1, 디스플레이 포트 1.4a x3
HDCP Support - 2.3
최대 디스플레이 지원 - 4
그래픽카드 전력 - 450W

최소 시스템 전력 - 850W
보조 전력 커넥터 - 8x3 또는 450W 이상 PCIe 5세대 케이블
크기 - 304x137x61mm

슬롯 크기 – 3슬롯

 
 
 
 
 
 
 
<br>
   

궁극의 GPU, 지포스 RTX 4090

지포스 RTX 4090은 놀라운 성능, 음향 및 온도 특성을 갖춘 현재 기준으로 세계에서 가장 빠른 게임용 GPU이다. 풀 레이 트레이싱 게임에서 DLSS 3 기능이 포함된 지포스 RTX 4090DLSS 2를 탑재한 이전 세대의 지포스 RTX 3090 Ti에 비해 최대 4배 더 빠르다.

또한, 동일한 450W 전력 소비를 유지하면서 오늘날의 게임에서 최대 2배 더 빠른 성능을 지녔다. 760억개의 트랜지스터, 16,384개의 쿠다 코어 및 24GB의 고속 마이크론(Micron) GDDR6X 메모리가 특징이며, 4K UHD의 고해상도 게임에서 지속적으로 초당 100프레임 이상을 제공한다.

이어서 11월에 출시될 지포스 RTX 40809,728개의 쿠다 코어와 16GB의 고속 마이크론 GDDR6X 메모리를 갖췄다. 또한 DLSS 3 기능을 활성화하면 지포스 RTX 3080 Ti보다 2배 빠르며, 더 낮은 전력에서 지포스 RTX 3090 Ti보다 강력한 성능으로 사용할 수 있다. 지포스 RTX 4080 12GB도 발표되었지만, 애매한 성능으로 인해 출시가 취소되었다.

   

더 강화된 슈퍼 샘플링 기능, DLSS 3

게임 및 크리에이티브 앱을 위한 회사의 딥 러닝 슈퍼 샘플링(Deep Learning Super Sampling) 신경 그래픽 기술의 차세대 버전인 엔비디아 DLSS 3도 발표됐다. AI 기반 기술은 훨씬 더 빠른 게임 플레이를 위해 전체 프레임을 생성할 수 있다. GPU가 전체 프레임을 독립적으로 생성할 수 있도록 해 게임의 CPU 성능 한계를 극복할 수 있다.

이 기술은 유니티(Unity) 및 언리얼 엔진(Unreal Engine)과 같은 세계에서 가장 인기 있는 게임 엔진에 적용되고 있다. 35개 이상의 게임과 앱이 곧 출시될 예정으로 세계 최고의 게임 개발자들로부터 지원을 받고 있다.

아울러 자포스 RTX 40 시리즈 GPU는 다음을 포함한 다양한 새로운 기술 혁신을 특징으로 한다. ▲이전 세대의 2배 이상인 최대 83테라플롭의 셰이더 성능을 갖춘 스트리밍 멀티프로세서 ▲이전 세대보다 2.8배 증가, 최대 191개의 유효 레이 트레이싱 테라플롭을 포함하는 3세대 RT 코어 ▲FP8 가속을 사용하는 이전 세대보다 5배 증가, 최대 1.32 텐서 페타플롭의 4세대 텐서 코어 등이다.

지포스 RTX 40 시리즈는 셰이딩 워크로드를 즉시 재조정해 GPU 리소스를 더 잘 활용함으로써 실행 효율성을 향상시키는 셰이더 엑시큐션 리오더링(Shader Execution Reordering). CPU에 대한 비순차적 실행만큼 중요한 혁신인 SER은 레이 트레이싱 성능을 최대 3, 게임 내 프레임 속도를 최대 25% 향상시킨다.

또한, 2배 더 빠른 성능을 제공하는 에이다 옵티컬 엑셀러레이터(Ada Optical Flow Accelerator)를 통해 DLSS 3는 장면의 움직임을 예측해 신경망이 이미지 품질을 유지하면서 프레임률을 높일 수 있도록 한다. 이와 함께 맞춤형 TSMC 4N 프로세스 기술과 긴밀하게 결합된 아키텍처 개선으로 전력 효율성이 최대 2배 향상된다.

듀얼 엔비디아 인코더(NVENC)는 엑스포트 시간을 최대 절반으로 단축하고, AV1 지원을 제공한다. NVENC AV1 인코딩은 OBS, 블랙매직 디자인 다빈치 리졸브(Blackmagic Design DaVinci Resolve), Discord(디스코드) 등에서 채택되고 있다.

 
 
   

몰입감 높인 새로운 레이 트레이싱

수십 년 동안 물리적인 정확한 조명으로 레이 트레이싱 된 장면을 실시간으로 렌더링하는 것은 그래픽의 성배로 여겨져 왔다. 동시에 3D 게임과 그래픽이 현실 세계를 가장 정확하게 표현하기 위해 노력함에 따라 환경과 물체의 기하학적 복잡성이 계속해서 증가하고 있다.

물리적으로 정확한 그래픽을 얻기 위해서는 엄청난 계산 능력이 요구된다. ‘사이버펑크 2077’과 같은 최신 레이 트레이싱 게임은 조명을 결정하기 위해 각 픽셀에 대해 600개 이상의 레이 트레이싱 계산을 실행한다. 이는 4년 전 처음 도입된 레이 트레이싱 게임보다 16배 증가한 수치이다. 따라서 새로운 3세대 RT 코어는 2배 더 빠른 레이-트라이앵글(triangle) 교차 테스트를 제공하고 두 개의 중요한 새로운 하드웨어 장치를 포함하도록 향상됐다.

오파시티 마이크로맵 엔진(Opacity Micromap Engine)은 알파 테스트 지오메트리의 레이 트레이싱 속도를 2배까지 높이고, 마이크로 메시 엔진(Micro-Mesh Engine)은 추가 지오메트리를 생성하기 위해 즉석에서 마이크로 메시를 생성한다. 마이크로 메시 엔진은 복잡한 형상의 기존 성능 및 저장 비용 없이 기하학적 복잡성이 증가하는 이점을 제공한다.

 
   

듀얼 8세대 AV1 인코더 지원

지포스 RTX 40 시리즈 GPUDLSS 3은 엔비디아 스튜디오(Studio) 크리에이터에게 향상된 기능을 제공한다. 3D 아티스트는 정확한 물리학과 사실적인 재료로 완전히 레이 트레이싱 된 환경을 렌더링하고 프록시 없이 실시간으로 변경 사항을 볼 수 있다.

향상된 GPU 성능과 새로운 듀얼 8세대 AV1 인코더 포함으로 영상 편집 및 라이브 스트리밍도 향상된다. 엔비디아 브로드캐스트(Broadcast) 소프트웨어 개발 키트에는 얼굴 표정 추정, 아이 콘텍트 및 가상 배경 품질 개선을 포함해 파트너가 사용할 수 있는 세 가지 업데이트가 있다.

엔비디아 스튜디오 소프트웨어 제품군에 포함된 엔비디아 옴니버스(Omniverse)은 곧 클래식 게임의 놀라운 RTX 리마스터를 제작하기 위한 모딩 플랫폼인 엔비디아 RTX 리믹스를 추가한다. RTX 리믹스를 사용하면 모더가 게임 자산을 쉽게 캡처하고, 강력한 AI 도구로 자료를 자동으로 개선하고, 레이 트레이싱 및 DLSSRTX를 빠르게 활성화할 수 있다.

   

성능 확인하기

지포스 RTX 4090의 성능을 확인해보자. 테스트 시스템 사양은 인텔 코어 i9-13900K, ASUS PRIME Z790-A, 커세어 DDR5-6200 CL36 VENGEANCE RGB BLACK 패키지(16GB x2), SK하이닉스 플래티넘 P41 PCIe 4.0 NVMe M.2 SSD 1TB, 마이크로닉스 Classic II 850W 80PLUS GOLD 230V EU 풀모듈러 화이트, 커세어 iCUE H170i 엘리트 LCD 수랭 쿨러, 윈도우 11이다. 성능 비교를 위해 지포스 RTX 3090도 함께 테스트했다.

 
 
 
 
   

DLSS 테스트

DLSS 테스트는 해상도 별로 퀄리티 모드와 퍼포먼스 모드로 나눠서 진행했다. 해상도는 기본으로 지정된 QHD(2560x1440), 4K UHD(3840x2160), 8K UHD(7680x4320)이다. , 8K UHD의 경우는 울트라 퍼포먼스 모드도 테스트했으며, FHD 해상도는 DLSS3에 없어 생략했다.

 
 
 
     

게임 테스트

테스트를 진행한 게임은 어쌔신 크리드 발할라’, ‘파 크라이 6’ 2가지다. ‘어쌔신 크리드 발할라가장 높음옵션에서 FHD 해상도와 4K UHD 해상도로 벤치마크를 구동했으며, 최저 FPS1% 기준이다. ‘파 크라이 6’울트라옵션에서 4K UHD 해상도로 레이 트레이싱과 DLSS 기능을 온/오프한 것 모두 비교했다. DLSS 옵션은 울트라 퀄리티 모드다.

 

어쌔신 크리드 발할라

 
   

파 크라이 6

 
   

마치며

지포스 RTX 4090은 현존 최강의 성능을 자랑하는 그래픽카드이다. 전력 대비 뛰어난 성능을 지녔으며, 다양한 게임이나 작업 용도로 최적의 환경을 조성할 수 있다. 다만 가격이 상당히 비싸 부담되고 크기가 크기 때문에 일부 PC 케이스에서는 장착조차 할 수 없는 것이 단점이다. 4K UHD 고해상도 게이밍 환경도 완벽 정복이 가능한 성능인 만큼 그 어떤 옵션과도 타협하지 않고 싶은 하드코어 게이머에게 추천한다.