[smartPC사랑=이철호 기자] AMD가 x86 서버 GPU 최초로 10 테라플롭스(FP64) 이상의 성능을 지원하는 세계에서 가장 빠른 고성능 컴퓨팅(HPC) GPU AMD 인스팅트 MI100(AMD Instinct MI100)를 발표했다.
AMD 인스팅트 MI1000은 델(Dell), 휴렛팩커드 엔터프라이즈(HPE), 기가바이트(Gigabyte), 슈퍼마이크로(Supermicro) 등 파트너사의 가속 컴퓨팅 플랫폼과 AMD 에픽(AMD EPYC) 프로세서, 그리고 ROCm 4.0 오픈 소프트웨어 플랫폼과 호환되는 동시에 도래하는 엑사스케일 시대에 다양한 연구 활동을 지원하기 위해 설계됐다.
AMD 인스팅트 MI100 액셀러레이터는 엑사스케일 시대를 위한 MI100 액셀러레이터에 탑재된 AMD GPU에 적용된 AMD CDNA 아키텍처를 통해 탁월한 성능과 전력 효율성을 지원한다.
11.5 테라플롭스의 최대 FP64 성능과 23.1테라플롭스의 최대 FP32 성능을 지원하는 MI100은 전 세계 과학자와 연구자들이 생활 과학, 에너지, 금융, 학계, 공공기관, 국방 사업 전반에 걸쳐 유의미한 결과를 낼 수 있도록 돕는다. 또한, FP32, FP16, bFloat16, Int8, Int4 등 모든 범위의 단일 및 혼합 정밀 매트릭스 연산을 위해 개발된 매트릭스 코어 기술로, HPC와 AI의 융합을 촉진한다.
MI100은 최대 2배 높은 PCIe 4.0 이상의 P2P(peer-to-peer) 최대 I/O 대역폭과 GPU당 초당 최대 340GB의 통합 대역폭을 지원하는 2세대 AMD 인피니티 패브릭 링크(Links)를 제공한다. 서버 내에서 MI100 GPU는 최대 두 개의 연결된 쿼드 GPU 하이브(hive)를 구성할 수 있으며, 초당 552GB의 P2P I/O 대역폭으로 빠른 데이터 공유를 지원한다.
또한, 32GB의 고대역폭 HBM2 메모리를 통해 1.2GHz의 클럭 속도와 초당 1.23GB의 초고대역 메모리 대역폭으로 대용량의 데이터를 지원하고 메모리에 데이터를 저장하고 추출하는 과정에서 발생하는 병목현상을 해결하는 데 도움을 준다. 여기에 최신 PCIe 4.0 기술이 적용되어 CPU와 GPU 간 초당 최대 64GB의 최고 이론 데이터 전송 대역폭을 지원한다.
AMD 인스팅트 MI100 액셀러레이터는 2020년 말부터 주요 OEM 및 ODM 파트너사들을 통해 출시될 예정이다:
AMD 데이터센터 GPU 및 가속 프로세싱 사업 부문 부사장 브래드 맥크레디(Brad McCredie)는 "AMD는 세계에서 가장 빠른 HPC GPU인 AMD 인스팅트 MI100 출시로 엑사스케일 컴퓨팅 분야에서 또 하나의 중요한 걸음을 내딛게 됐다"며 "과학 컴퓨팅 워크로드 지원을 위해 설계된 MI100은 AMD ROCm 오픈 소프트웨어 플랫폼과 결합해 과학자와 연구자들에게 HPC 워크로드를 위한 우수한 기반을 제공한다"고 밝혔다.
저작권자 © 디지털포스트(PC사랑) 무단전재 및 재배포 금지