최종편집 : 2020-08-10 14:19 (월)
[엔비디아 GTC 톺아보기]②헬스케어, 음성 비서... 안들어가는 곳 없는 AI
상태바
[엔비디아 GTC 톺아보기]②헬스케어, 음성 비서... 안들어가는 곳 없는 AI
  • 김주연 기자
  • 승인 2020.05.18 17:08
  • 댓글 0
이 기사를 공유합니다

[편집자 주] 엔비디아의 'GPU 테크놀로지 컨퍼런스(GTC)'는 GPU를 넘어 인공지능(AI)의 발전 양상을 볼 수 있는 장이라고 해도 과언이 아니다. 학습 중인 AI 알고리즘의 99%가 엔비디아의 GPU를 활용하고 있기 때문이다.

올해 행사에서 엔비디아는 엣지와 데이터센터용 GPU 신규 플랫폼을 선보이는 한편 자율주행과 헬스케어, 데이터 사이언스 등에서 자사의 GPU를 어떻게 활용할 수 있는지 제시했다.

 

AI 컴퓨팅으로 코로나19 해결한다

DGX A100
엔비디아 DGX A100./엔비디아

AI는 대용량 데이터를 빠르게 분석해 특정한 패턴을 찾아낸다. 신종 코로나 바이러스 감염증(코로나19)으로 AI에 대한 관심이 커진 것도 AI가 이같은 특성을 기반으로 질병 해결에 도움을 줄 것이라는 기대감 때문이다.

엔비디아가 이번 GTC2020에서 공개한 3세대 엔비디아 DGX 플랫폼도 이에 대응해 개발됐다. 5페타플롭(PF)의 AI 성능을 제공하는 DGX A100은 전체 데이터센터의 성능과 기능을 처음으로 단일 플랫폼으로 통합한 솔루션이다. 이미 DGX 100를 도입해 활용하고 있는 미 에너지국(DOE)의 아르곤국립연구소(Argonne National Laboratory)는 DGX 100의 AI 및 컴퓨팅 역량을 이용해 코로나19를 이해 및 분석하고 있다.

DGX A100 시스템은 새로운 엔비디아 A100 텐서 코어(Tensor Core) GPU 8개를 통합해 최대 규모의 AI 데이터세트를 훈련시킬 수 있는 320GB 메모리와 200Gb의 속도를 구현하는 멜라녹스(Mellanox)의 최신 HDR 상호연결 솔루션을 제공한다.

또 A100 멀티 인스턴스 GPU 기능을 사용해 DGX A100을 시스템 당 최대 56개의 인스턴스로 분할하여 여러 개의 작은 워크로드를 가속화할 수 있다. 이를 통해 기업들은 온디맨드 형식으로 통합된 소프트웨어 정의 플랫폼에서 데이터 분석, 훈련, 추론을 포함한 다양한 워크로드를 가속화하기 위해 필요에 따라 컴퓨팅 성능과 리소스를 최적화할 수 있다.

엔비디아는 또 700페타플롭(PF)의 AI 컴퓨팅 파워를 구현하는 140개 DGX A100 시스템의 클러스터인 차세대 DGX 슈퍼POD(DGX SuperPOD)를 공개했다. 엔비디아는 140개의 DGX A100 시스템과 엔비디아 멜라녹스 200Gb HDR 인피니밴드(InfiniBand) 인터커넥트를 결합해 대화형 AI, 게놈, 자율주행 등의 연구를 강화하기 위해 차세대 DGX 슈퍼POD AI 슈퍼컴퓨터를 구축했다.

해당 클러스터는 세계에서 가장 빠른 AI 슈퍼컴퓨터 중 하나로, 기존에는 수천 대의 서버가 필요했던 수준의 성능을 제공한다. 이러한 슈퍼컴퓨팅 성능을 구현하기 위해서는 필요한 특정 구성요소를 몇 개월 또는 몇 년에 걸쳐 계획하고 조달해야 했지만 DGX A100의 엔터프라이즈-레디 아키텍처와 성능을 기반으로 엔비디아는 이 시스템을 단 한달만에 구축할 수 있었다.

 

헬스케어 '클라라'도 대대적 업데이트

엔비디아 클라라./엔비디아
엔비디아 클라라./엔비디아

엔비디아는 이와 함께 헬스케어 업계가 코로나19를 보다 효과적으로 추적, 검사 및 치료하도록 지원하기 위해 자사의 헬스케어 플랫폼인 엔비디아 클라라(Clara)를 대폭 확장했다.

엔비디아 A100 GPU를 기반으로 하는 엔비디아 클라라 파라브릭스는 전체 게놈 DNA 염기서열 분석 시간을 20분 미만으로 단축하며 새로운 기록을 달성했다. 또 2시간 이내에 결과를 반환하는 GPU 가속 RNA 시퀀싱 파이프라인을 통해 연구원들에게 질병의 감염성, 그리고 진행 및 치료에 대한 반응과 관련된 중요한 통찰력을 제공한다.

게놈 분석 가속화를 통해 게놈 분야에서 더 대규모의 고품질 데이터 세트를 생성해낼 수 있다. 아부다비(Abu Dhabi) 보건부가 새롭게 발표한 인구 게놈 프로그램은 엔비디아 DGX 시스템과 엔비디아 클라라 파라브릭스를 기반으로 하는 그룹 42 아르테미스(Group 42 Artemis) 슈퍼컴퓨터를 사용하여 아랍에미리트(UAE) 시민 고유의 참조(reference) 게놈을 구축하고, 게놈 분석을 종합 프로그램에 통합해 임상 치료를 향상시키고 있다.

엔비디아는 사용자가 클라우드에서 엔비디아 클라라 파라브릭스가 제공하는 가속화 이점을 활용할 수 있도록 DNA넥서스(DNAnexus)와 협력해 결과를 원활하게 공급, 실행 및 반환하고 있다.

엔비디아는 연구원들이 코로나19에 효과적으로 대응할 수 있는 추가적인 툴을 제공하기 위해 흉부 CT 스캔 데이터를 통해 감염 환자를 감지하고 연구할 수 있는 일련의 AI 모델을 출시했다. 이 모델은 NGC 소프트웨어 허브의 최신 클라라 이미징(Clara Imaging) 릴리즈에서 즉시 사용 가능하다.

엔비디아의 응용 연구팀과 미 국립보건원 임상의 및 데이터 과학자들이 공동 개발한 새로운 AI 모델은 중국, 이탈리아, 일본, 미국 등 코로나19 감염률이 높은 지역의 데이터를 사용했다. 이 AI 모델은 의료 영상촬영을 위한 엔비디아 클라라 애플리케이션 프레임워크를 활용해 구축됐다. 엔비디아 클라라에는 도메인 별 AI 훈련 및 구축 워크플로우 툴이 포함돼 있는데, 이를 통해 엔비디아와 미 국립보건원은 해당 AI 모델을 3주 안에 개발할 수 있었다.

새로운 엔비디아 클라라 가디언 애플리케이션 프레임워크는 일상의 센서를 스마트 센서로 변환하여 병원 공공 안전 및 환자 모니터링을 위해 필수적인 AI 솔루션을 구현한다. 주요 활용사례로는 자동 체온 검사, 보호 마스크 감지, 안전한 사회적 거리두기, 원격 환자 모니터링 등이 있다.

엔비디아 생태계 파트너들은 사전 훈련된 모델과 전송 학습을 사용해 비전, 음성, 자연 언어 처리를 융합한 AI 애플리케이션을 개발 및 구축하고 있다. 엔비디아 EGX AI 엣지(NVIDIA EGX AI Edge)를 사용하면 솔루션 제공업체들은 병원 환경 전반에 걸쳐 디바이스를 안전하게 배치 및 관리할 수 있다.

 

언어 기반 AI 서비스, 보다 수월하게 개발한다

엔비디아 자비스./엔비디아
엔비디아 자비스./엔비디아

엔비디아는 이와 함께 GPU 가속 애플리케이션 프레임워크인 엔비디아 자비스(NVIDIA Jarvis)를 발표했다. 자비스는 기업들이 영상 및 음성 데이터를 활용해 자사 제품과 고객, 그리고 산업에 최적화된 최첨단 대화형 인공지능(AI) 서비스를 구축하도록 돕는다.

재택근무, 원격진료, 원격수업이 늘어나면서 고객지원부터 실시간 기록, 화상통화에 이르는 맞춤형 언어 기반 AI 서비스에 대한 수요가 급증하고 있으며, 이를 통해 사람들의 생산성과 연결성이 유지되고 있다.

자비스를 기반으로 구축된 애플리케이션은 AI 컴퓨팅을 위한 새로운 엔비디아 A100 텐서 코어(Tensor Core) GPU의 혁신 기술뿐 아니라, 추론을 위한 엔비디아 텐서RT(TensorRT)의 최신 최적화 기능을 활용할 수 있다. 이를 통해 실시간 상호작용에 필요한 수준인 300밀리초 임계값 보다 더 빠르고 강력한 비전 및 음성 모델을 사용해 전체 멀티모달(multimodal) 애플리케이션을 실행할 수 있다.

자비스는 개발자가 각 기업 및 고객 고유의 용어를 이해할 수 있는 엔드-투-엔드 실시간 대화형 AI 애플리케이션을 쉽게 생성, 배치 및 실행할 수 있도록 하는 GPU 가속 소프트웨어 스택과 툴을 제공한다.

개인화된 대화형 경험을 제공하기 위해서는 기업들이 자사 제품 및 고객 요구사항에 특정된 데이터에 대해 언어 기반 애플리케이션을 훈련시켜야 한다. 하지만 서비스를 처음부터 구축하려면 AI 관련 전문지식이 풍부해야 할 뿐 아니라, 모델을 훈련시키기 위한 대량의 데이터와 컴퓨팅 리소스는 물론 새로운 데이터로 모델을 정기적으로 업데이트하는 소프트웨어가 필요하다.

자비스는 대화형 AI를 위한 엔드-투-엔드 딥러닝 파이프라인을 제공하여 이같은 과제를 해결한다. 또한, 자연어 이해를 위해 엔비디아의 메가트론 버트(Megatron BERT)와 같은 최첨단 딥러닝 모델을 포함한다. 기업들은 엔비디아 네모(NVIDIA NeMo)를 사용해 데이터에서 이러한 모델을 미세 조정하고, 텐서RT를 통해 추론을 최적화하며, 엔비디아의 GPU 최적화 소프트웨어 카탈로그인 NGC에서 이용할 수 있는 헬름(Helm) 차트를 활용해 클라우드 및 엣지(edge) 환경에 배치할 수 있다.

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 “대화형 AI는 애플리케이션이 뉘앙스와 상황을 이해하고 커뮤니케이션하는 능력을 갖기 때문에 많은 산업에 걸쳐 미래의 중심이 될 것이다"이라며 "엔비디아 자비스는 의료 및 금융 서비스, 교육 및 소매 분야 기업들이 빠른 속도와 정확성으로 고객 지원을 자동화하도록 도울 것”이라고 설명했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사