2024 | 09 | 21
23.3℃
코스피 2,593.37 12.57(0.49%)
코스닥 748.33 8.82(1.19%)
USD$ 1,331.8 0.8
EUR€ 1,486.2 6.6
JPY¥ 932.9 -1.5
CNH¥ 188.1 0.9
BTC 84,183,000 517,000(-0.61%)
ETH 3,404,000 110,000(3.34%)
XRP 780.6 8.1(-1.03%)
BCH 448,300 7,650(-1.68%)
EOS 687.8 5.8(0.85%)
  • 공유

  • 인쇄

  • 텍스트 축소
  • 확대
  • url
    복사

엔비디아, 생성형 AI 청사진 공개

  • 송고 2023.05.31 16:26 | 수정 2023.05.31 16:30
  • EBN 김채린 기자 (zmf007@ebn.co.kr)

텐서 코어 엔비디아 RTX GPU로 생성형 AI 개발·배포

효율성 개선하는 Max-Q 저전력 AI 추론 출시 임박

1억 대 윈도우 RTX PC·워크스테이션, 생성형 AI·성능 제공

ⓒ엔비디아

ⓒ엔비디아

엔비디아(CEO 젠슨 황)가 31일 생성형 AI 관련 청사진을 공개했다. 엔비디아(NVIDIA)는 RTX GPU로 생성형 AI 모델 개발과 배포 가속화를 위해 힘쓰고, 맥스-Q(Max-Q) 저전력 추론 기능을 추가해 효율성을 높일 계획이다.


생산성과 콘텐츠 제작, 게이밍 등에서 생성형 AI가 컴퓨팅의 새 시대를 앞당기고 있다. 엔비디아 네모(Nemo), DLSS 3 프레임 제너레이션(Frame Generation), 메타 라마(Meta LLAMA), 챗GPT(ChatGPT), 어도비 파이어플라이(Adobe Firefly), 스테이블 디퓨전(Stable Diffusion) 등의 생성형 AI 모델 및 애플리케이션은 신경망을 통해 기존 데이터 내에서 식별한 패턴과 구조를 기반으로 새롭고 독창적인 콘텐츠를 생성한다.


AI 추론에 최대 1400 텐서 테라플롭스(Tensor TFLOPS)를 제공하는 엔비디아 RTX GPU와 지포스 RTX(GeForce RTX)에 최적화된 생성형 AI 모델은 실행 속도가 경쟁 디바이스 대비 5배까지 빨라진다. 이는 AI 연산을 가속하고자 구축된 RTX GPU 전용 하드웨어인 텐서 코어(Tensor Core)와 정기적인 소프트웨어 개선 덕이다. 5월 중순 마이크로소프트 빌드(Microsoft Build) 컨퍼런스에서 소개된 개선 기능들은 새로운 다이렉트ML(DirectML) 최적화를 활용하는 스테이블 디퓨전 등의 생성형 AI 모델 성능을 2배로 높였다.


로컬 디바이스에서의 추론이 더욱 빈번해짐에 따라 PC에는 복잡한 작업의 지원을 위한 강력하면서도 효율적인 하드웨어가 필요해질 전망이다. 이를 충족하기 위해 RTX GPU는 AI 워크로드를 위한 맥스-Q 저전력 추론 기능을 추가한다. RTX는 가벼운 추론 작업에는 적은 양의 전력만을 사용하는 반면, 복잡한 생성형 AI 워크로드에는 독보적인 수준의 성능 확장을 지원한다.


개발자는 새로운 AI 애플리케이션을 생성할 때 윈도우 11에서 실행되는 RTX 가속 AI 개발 스택 일체에 액세스할 수 있어 고급 AI 모델의 개발, 훈련, 배포가 한층 쉬워진다. 이를 위해 먼저 리눅스용 윈도우 서브시스템(Windows Subsystem for Linux)의 경로로 사용이 가능하게 최적화된 딥 러닝 프레임워크로 모델을 개발해 미세 조정한다.


또 개발자는 클라우드로 이동해 동일한 엔비디아 AI 스택에서 훈련을 진행한다. 이 스택은 주요 클라우드 서비스 공급자 전체에서 지원된다. 모델의 훈련을 마친 뒤에는 마이크로소프트 올리브(Microsoft Olive) 등의 툴을 사용해 최적화하고 추론을 가속한다. 마지막으로 AI에 최적화된 1억 대 이상의 RTX PC와 워크스테이션의 설치 기반에 AI 지원 애플리케이션과 기능을 배포한다.


파반 다불루리(Pavan Davuluri) 마이크로소프트 윈도우 실리콘 및 시스템 통합 부문 부사장은 “AI는 향후 윈도우 사용 고객들을 위한 혁신을 견인하는 가장 큰 동력이 될 것이다”며 “우리는 엔비디아와 협력해 하드웨어와 소프트웨어를 최적화함으로써 혁신적이며 우수한 성능을 지닌 배포하기 용이한 고객 경험을 제공하고 있다”고 말했다.


현재까지 400개가 넘는 RTX AI 가속 앱과 게임이 공개됐으며, 더 많은 제품들이 출시를 앞두고 있다.


엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)이 대만 타이베이에서 열린 컴퓨텍스(COMPUTEX) 2023 기술 컨퍼런스 기조연설에서 엔비디아 게임용 아바타 클라우드 엔진(NVIDIA Avatar Cloud Engine for Games, 게임용 ACE)을 발표했다고 밝혔다. 게임용 ACE는 게임 개발을 지원하는 생성형 AI다.


맞춤형 AI 모델 파운드리 서비스인 게임용 ACE는 AI 기반 자연어 상호작용으로 NPC(non-playable character)들에게 인텔리전스를 부여해 게임을 혁신한다. 미들웨어, 툴, 게임의 개발자들은 게임용 ACE를 사용해 소프트웨어와 게임에서 맞춤형 음성, 대화, 애니메이션 AI 모델을 구축 및 배포할 수 있다.


▲어디서든 휴대 가능한 RTX 기반 생성형 AI

서버와 클라우드에서 디바이스에 이르기까지, RTX GPU 기반 생성형 AI는 빠지는 곳이 없다. 엔비디아의 가속 AI 컴퓨팅은 로우 레이턴시 풀스택 작업이다. 엔비디아는 RTX GPU 전용 AI 하드웨어인 4세대 텐서 코어 등 하드웨어와 소프트웨어 아키텍처의 모든 부분을 오랜 기간에 걸쳐 최적화해 왔다.


여기에 정기적인 드라이버 최적화도 최고의 성능을 보장한다. 올리브 최적화 모델과 다이렉트ML 업데이트를 결합한 최신 엔비디아 드라이버는 윈도우 11을 사용하는 개발자에게 유의미한 속도 향상을 제공한다. 가령 스테이블 디퓨전의 경우, 다이렉트ML 최적화 경로를 사용해 개발자가 경험하는 간섭 시간을 전보다 2배 개선했다.


엔비디아 에이다 러브레이스(Ada Lovelace) 아키텍처를 기반으로 구축된 최신 세대의 RTX 노트북과 모바일 워크스테이션이 있으면 어디서나 생성형 AI를 휴대할 수 있다. 엔비디아의 차세대 모바일 플랫폼은 14인치 규격에 1350그램밖에 나가지 않는 소형 폼팩터로 차원이 다른 성능과 휴대성을 제공한다. 델(Dell), 휴렛팩커드(HP), 레노버(Lenovo), 에이수스(ASUS) 등의 제조사들은 RTX GPU와 텐서 코어를 기반으로 생성형 AI의 시대를 앞당기고 있다.


RTX GPU를 탑재한 노트북과 모바일 워크스테이션이 곧 두 가지의 장점들을 고루 누리게 될 전망이다. AI 추론 전용 워크로드는 GPU의 전력 소비를 최대한 낮게 유지하면서 텐서 코어 성능에 맞춰 최적화된다. 배터리 수명 또한 연장되며 발열 없고 조용한 시스템을 유지할 것이다. GPU는 워크로드가 필요로 하는 경우 동적으로 확장돼 AI 성능을 극대화한다.


이외에도 개발자들은 ‘가속 애플리케이션 개발자를 위한 엔비디아 AI 사이트’에서 자신의 애플리케이션을 엔드 투 엔드로 최적화하고 GPU 가속화의 이점을 극대화하는 방법을 배울 수 있다.


©(주) EBN 무단전재 및 재배포 금지

전체 댓글 0

로그인 후 댓글을 작성하실 수 있습니다.

시황

코스피

코스닥

환율

KOSPI 2,593.37 12.57(0.49)

코인시세

비트코인

이더리움

리플

비트코인캐시

이오스

시세제공

업비트

09.21 04:14

84,183,000

▼ 517,000 (0.61%)

빗썸

09.21 04:14

84,192,000

▼ 588,000 (0.69%)

코빗

09.21 04:14

84,199,000

▼ 553,000 (0.65%)

등락률 : 24시간 기준 (단위: 원)

서울미디어홀딩스

패밀리미디어 실시간 뉴스

EBN 미래를 보는 경제신문