최종편집 : 2020-03-30 18:32 (월)
제5의 물결에 대처하는 Arm의 자세, "성능의 상향평준화"
상태바
제5의 물결에 대처하는 Arm의 자세, "성능의 상향평준화"
  • 김주연 기자
  • 승인 2019.11.12 16:55
  • 댓글 0
이 기사를 공유합니다

젬 데이비스(Jem Davies) Arm 머신러닝 사업부 부사장이 기자간담회에서 신규 NPU 2종에 대해 설명하고 있다./ArM

PC, 스마트폰에서 넘쳐나는 데이터를 처리하기 위해 등장한 게 클라우드다. 하지만 인공지능(AI) 등 대량의 데이터를 쓰는 기술과 이를 뒷받침하는 통신 세대의 발전으로 클라우드의 힘으로도 부족한 시대가 왔다.

이제는 데이터를 생성하는 기기에서부터 클라우드에 이르기까지 이를 단계적으로 처리하는 데이터 중심 컴퓨팅 시대, '제5의 물결'이다. 

세계 반도체 설계자산(IP) 1위 Arm은 12일 인터컨티넨탈 서울 코엑스에서 'Arm 테크 심포지아 2019'를 개최하고 이에 걸맞는 4개의 IP를 출시한다고 밝혔다.

이번에 출시한 IP는 머신러닝(ML)을 가동하는 신경망처리장치(NPU) '에토스(Ethos)' 2종와 그래픽 프로세서(GPU) 말리(Mali) 1종, 디스플레이 프로세서(DPU) 1종이다.

모두 스마트폰의 성능을 상향표준화하는 데 초점이 맞춰졌다. 증강현실(AR) 및 고성능 게임, AI처럼 대량의 데이터를 실시간으로 처리해야하는 기능을 플래그십 스마트폰 뿐만 아니라 중저가형 스마트폰, 심지어 엣지 디바이스에서도 제공하게 하는 게 Arm의 목표다.

예를 들어 AI는 게이밍 디바이스부터 DTV(digital TV)에 이르는 모든 곳에 활용된다. 실시간 반응형 시스템을 구현하기 위해서는 단말도 높은 컴퓨팅 성능을 갖춰야한다. DTV만 해도 스마트 어시스턴트 음성 명령, 타 지역 언어에 대한 실시간 번역, 자녀보호(parental controls) 기능 강화를 위한 얼굴 인식 등의 기능이 담긴다.

 

보급형 모델에서도 이기종 컴퓨팅을 구현하는 NPU 2종

Arm NPU 제품군의 활용사례/Arm
Arm NPU 제품군의 활용사례./Arm

NPU IP 제품군인 Ethos는 단말에서 센서 데이터를 모아 전처리해주거나 슈퍼레졸루션(SR), 물체 감지(OD), 이미지 분류, 음성 번역 등의 기능을 가속화하는 역할을 한다.

새로 추가된 Ethos IP는 'Ethos-N57'과 'Ethos-N37'다. 최근 발표한 'Ethos-N77'이 성능에 초점을 맞춘 플래그십 디바이스용이라면, 두 제품은 각각 가격과 전력효율성, 성능의 균형을 맞춘 미드레인지 기기 및 저가형 기기용이다.

일단 두 IP는 Int8 및 Int16 데이터 유형 지원에 최적화됐다. 메모리 및 IP 입출력 간 데이터 이동 및 소비 전력을 최소화하는 압축 기술이 적용됐고, 위노그라드(Winograd) 기법 등 하드웨어 최적화 기술을 통해 200% 이상 향상된 성능을 제공한다.

중저가 기기용인 Ethos-N57은 최대 2TOPS(@1㎓)의 ML 성능을 갖췄고 저가 기기에 쓰이는 Ethos-N37은 1㎟ 이하의 크기로 최대 1TOPS(@1㎓)의 성능을 제공한다.

젬 데이비스(Jem Davies) Arm 머신러닝 사업부 부사장은 "기존 신경망 프레임워크와 프로세서 IP 간의 격차를 메우는 추론 엔진 'Arm NN'을 활용하면 한 번만 프로그램을 설계해도 여러 기기에 적용할 수 있다"고 설명했다.

 

중저가 GPU에 '발할 아키텍처' 최초 적용

2세대 스칼라 아키텍처 '발할(Valhall)'의 특장점./Arm
2세대 스칼라 아키텍처 '발할(Valhall)'의 특장점./Arm

이번에 출시된 'Mali-G57'은 Arm의 2세대 스칼라 아키텍처 '발할(Valhall)'이 첫 적용된 중저가 GPU IP다. 

고성능 게임, 모바일에서 즐기는 콘솔 수준의 그래픽, DTV에 제공되는 4·8K 사용자 인터페이스, 복잡한 AR·VR 워크로드 등을 중저가 기기에서도 선보이겠다는 것이다.

발할 아키텍처는 엔진 당 래인(Lane)을 기존 4, 8개에서 16개로 확장했다. 여기에 최대 2개까지의 칩을 넣을 수 있으니 쓸 수 있는 래인 수는 총 32개로 확장된다. Arm에서 발할 아키텍처를 '수퍼 스칼라'라고 설명한 이유다.

이를 통해 Mali-G57은 이전 세대 Mali-G52보다 성능과 전력효율성이 각 1.3배 개선됐다. VR 포비티드 렌더링(foveated rendering) 및 보다 복잡한 xR 워크로드를 위해 ML 성능은 60% 늘려 몰입감 높은 그래픽을 제공한다.

 

보급형 및 소형 디스플레이에 적합한 DPU

Mali-D37은 가장 작은 면적 내에서 다양한 디스플레이 및 성능 기능을 제공하는 DPU다.

최종 사용자 관점에서 보면, 면적을 가장 중요하게 여기는 저가 스마트폰, 태블릿, 최대 2K의 소형 디스플레이 화면 등의 저가 디바이스에 보다 나은 비주얼과 성능을 제공할 수 있다는 것을 의미한다.

풀HD 및 2K 해상도를 위해 16nm에서 1㎟ 미만의 면적에 구성 가능한 DPU로 탁월한 면적 효율성을 제공한다. GPU와 함께 MMU-600을 포함하는 메모리간 인터페이스에서 오프로딩 코어 디스플레이 작업을 통해 최대 30% 시스템 전력을 절감할 수 있다.

어써티브 디스플레이5(Assertive Display 5)와 결합됐을 때 혼합 HDR 및 SDR 구성을 포함한 프리미엄 Mali-D71의 주요 디스플레이 기능을 실현할 수 있다.

폴 윌리엄슨(Paul Williamson) Arm의 클라이언트 사업부 부사장 겸 총괄은 “이번에 출시한 새로운 IP제품군은 토탈 컴퓨트(Total Compute)에 발맞춘 솔루션 접근 방식으로 설계됐다"며 "더 높은 면적 효율성과 전력 절감 효과를 제공하는 동시에 고성능을 만족하는 이와 같은 새로운 IP들은 시스템 IC및 플랫폼 개발자들의 비용 절감 및 출시 기간 단축효과를 가져온다”고 말했다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사