엔비디아(www.nvidia.co.kr, CEO 젠슨 황)는 구글 클라우드(Google Cloud)와 파트너십을 확대한다고 30일 발표했다. 이번 협력은 생성형 AI를 위한 대규모 모델을 구축하고 배포해 데이터 사이언스 워크로드를 가속화한다.

구글 클라우드 넥스트(Google Cloud Next)에서 엔비디아(NVIDIA) 창립자 겸 CEO인 젠슨 황(Jensen Huang)과 구글 클라우드 CEO인 토마스 쿠리안(Thomas Kurian)의 노변 대담이 이뤄졌다. 이번 대담에서는 파트너십을 통해 세계 대규모 AI 고객들에게 엔드투엔드 머신 러닝 서비스를 제공하는 방법과 엔비디아 기술을 기반으로 구축된 구글 클라우드 제품으로 AI 슈퍼컴퓨터를 쉽게 실행할 수 있는 방법에 대해 논의했다.

새로운 하드웨어와 소프트웨어 통합은 지난 2년간 구글 딥마인드(DeepMind)와 구글 리서치 팀에서 사용한 것과 동일한 엔비디아 기술을 활용한다.

방대한 대규모 언어 모델(LLM)을 구축하기 위한 구글의 프레임워크인 PaxML은 엔비디아 가속 컴퓨팅에 최적화됐다.

기존 PaxML은 여러 구글 TPU 가속기 조각에 걸쳐 구축됐다. 하지만 이제 개발자는 PaxML을 통해 엔비디아® H100와 A100 텐서 코어 GPU로 완벽하게 구성 가능한 고급 실험과 확장을 수행할 수 있다. GPU에 최적화된 PaxML 컨테이너는 엔비디아 NGC™ 소프트웨어 카탈로그에서 즉시 사용할 수 있다. 또 PaxML은 OpenXLA 컴파일러를 통해 GPU에 최적화된 JAX에서 실행된다.

PaxML에 최적화된 엔비디아 컨테이너는 엔비디아 NGC 컨테이너 레지스트리(container registry)에서 즉시 사용할 수 있다. 이 컨테이너는 차세대 AI 기반 애플리케이션을 구축하는 전 세계 연구자, 스타트업, 기업을 대상으로 한다.

아울러 양사는 구글의 데이터프록(Dataproc) 서비스를 통해 구글의 서버리스 스파크(Spark)와 엔비디아 GPU를 통합한다고 발표했다. 이를 통해 데이터 사이언티스트는 아파치 스파크(Apache Spark) 워크로드를 가속화해 AI 개발을 위한 데이터를 준비할 수 있다.

 

저작권자 © 파이브에코(FIVE ECOs) 무단전재 및 재배포 금지

키워드

Tags #엔비디아 #구글