엔비디아, 차세대 GPU 아키텍처 ‘페르미(Fermi)’ 발표

2010-10-05 편집부

엔비디아는 5일 차세대 쿠다(CUDA) GPU 아키텍처인 ‘페르미(Fermi)’를 발표했다.
페르미 아키텍처는 연산형(Computational) GPU로, 그래픽과 GPU 컴퓨팅 분야 모두를 진보시킬 것으로 기대를 모으고 있다. 엔비디아 젠슨황(Jen-Hsun Huang) 공동설립자 겸 CEO는 “GPU는 더 이상 단순한 그래픽 칩에 머무르지 않고, 이제 명백히 일반적인 목적의 병렬 컴퓨팅 프로세서로 사용되고 있다”며, “페르미 아키텍처와 통합 도구, 라이브러리, 엔진 등은 전세계 수천 명에 달하는 쿠다 개발자들의 탁견을 직접 반영한 것으로 우리는 곧 페르미가 새로운 GPU 시대의 지평을 열었다는 것을 볼 수 있게 될 것”이라고 말했다.

엔비디아 지포스, 쿼드로, 테슬라에 이어 차세대 GPU 탄생을 예고하는 페르미는 연산을 위해 필수적인 다음과 같은 신기술을 포함한다.

▲ C++ 언어 지원: C언어의 확장인 C++을 지원해 C언어 이외에 C++, 포트란(Fortran), 자바(Java), 파이썬(Python) 등의 다양한 언어 환경에서 병렬 컴퓨팅이 가능. 또한, 오픈CL(OpenCL), 다이렉트 컴퓨트(Direct Compute) 지원
▲ 에러정정코드(ECC)지원: 데이터의 완결성이 필요한 과학 계산에 사용될 GPU를 이용한 수퍼 컴퓨팅 센터와 데이터 센터 구축에 필수적인 에러정정코드(ECC) 지원
▲ 쿠다코어(CUDA Core) : 최신 실수연산 표준 규약인 IEEE 754-2008을 지원하는 512개의 쿠다 코어를 하나의 GPU에 내장
▲ FP64 성능 향상: 선형대수학(linear algebra), 수치 시뮬레이션(numerical simulation), 양자화학(quantum chemistry)과 같은 고성능 컴퓨팅(HPC) 어플리케이션에 중요한 2배 정밀도 실수연산 (double precision arithmetic) 성능에서 엔비디아 종전 세대 GPU(GT200) 대비 최대 8배의 이론 성능 향상
▲ 병렬 데이터 캐시(NVIDIA Parallel DataCache) : 세계 최초의 진정한 GPU 캐쉬 계층구조(cache hierarchy)로 데이터 주소를 사전에 알 수 없는 피직스 솔버(physics solvers), 레이 트레이싱(ray tracing), 희소 행렬곱셈(sparse matrix multiplication) 등의 알고리즘을 가속시키는 엔비디아 병렬 데이터 캐시(NVIDIA Parallel DataCache) 제공
▲ 기가쓰레드(GigaThread) 엔진: 동일 어플리케이션 컨텍스트(context)에서 서로 다른 커널이 동시에 GPU에서 이행되도록 하는 엔비디아 기가쓰레드 엔진
▲ 넥서스 디버거 : 작동중인 GPU 하드웨어의 실시간 디버깅을 가능하게 하고, 마이크로소프트 비주얼 스튜디오(Microsoft Visual Studio)에 통합해 사용 가능한 세계 최초의 이기종 컴퓨팅(heterogeneous computing) 애플리케이션 개발 환경인 넥서스 제공