엔비디아가 포토샵을 ‘생성 AI 혁명’으로 이끈다

거대언어모델이 만드는 새로운 비즈니스
누구나 AI 도움 받는 세상 온다, 곧
애플이 모바일 혁명 이끌었다면…
엔비디아 록인(lock-in) 기업 늘어날 듯

[Gettyimage]

“생성 AI는 전 세계 기업인에게 긴박감(sense of urgency)을 불러일으켰습니다.”

젠슨 황 엔비디아(Nvidia) 최고경영자(CEO)는 3월 21일(현지시각) 진행한 ‘엔비디아 GTC 2023’ 행사 키노트에서 “인공지능(AI)의 ‘아이폰 모멘트(iphone moment)’가 시작됐다”며 이같이 말했다.

황 CEO는 생성 AI 바탕 기술인 ‘파운데이션(foundation, 기반) 모델’이 연구실을 벗어나 다양한 방식으로 상용화되는 현상을 ‘2007년 아이폰 등장’에 비유했다. 아이폰 등장 후 다양한 앱이 쏟아지며 ‘모바일 비즈니스 시대’가 열린 것과 지금의 상황이 유사하다는 분석이다.

그의 말대로 AI 관련 산업은 빠르게 성장하고 있다. AI 기업 오픈AI가 대화형 AI ‘챗GPT(ChatGPT)’를 시작으로 거대언어모델(LLM) ‘GPT-4’를 선보였다. 대화 외에도 명령만으로 이미지, 글(text), 영상 등을 만들어 내는 생성 AI가 대거 등장하고 있다.

젠슨 황 엔비디아 최고경영자(CEO)가 3월 21일(현지시각) ‘엔비디아 GTC 2023’ 행사 키노트 발표자로 나섰다. [엔비디아]

실제로 마이크로소프트는 3월 16일 GPT-4 기반 오피스 작업 보조 솔루션 ‘마이크로소프트 365 코파일럿’을 선보여 업계와 대중의 큰 관심을 받았다. 구글 역시 같은 달 21일 자체 언어 모델 람다(LaMDA) 기반 AI 챗봇 서비스 ‘바드(Bard)’를 선보였다. 이미지 생성 쪽에서는 이 분야 파운데이션 모델로 불리는 ‘스테이블 디퓨전’을 활용한 다양한 앱, 서비스가 개발되는 추세다.

이날 황 CEO의 키노트 역시 이 대목에 초점이 맞춰져 있었다. 엔비디아는 ‘GPT-4 같은 LLM을 활용해 어떻게 새로운 비즈니스를 할 수 있을까’라는 물음에 ‘엔비디아 AI 파운데이션(Nvidia AI Foundations)’을 답으로 제시했다. GPU(그래픽처리장치)를 비롯한 엔비디아의 컴퓨팅 자원과 여러 LLM, 파운데이션 모델을 활용할 수 있는 플랫폼을 클라우드 서비스 형태로 제공한다는 계획이다.

이렇게 하면 엔비디아가 제공하는 파운데이션 모델을 미세 조정(fine-tunin)해 독자적인 LLM을 개발하거나 이 기술을 활용한 다양한 애플리케이션을 만들 수 있다. 기업들이 챗GPT 같은 기술을 더욱 쉽게 활용, 수익을 창출할 길이 열린 셈이다.

엔비디아, 어도비·게티이미지와 손잡아

엔비디아 ‘AI 파운데이션 서비스’ 홍보 화면 아래에 클라우드 컴퓨팅 협력사로 구글 클라우드, 마이크로소프트 애저, 오라클 클라우드가 보인다. [엔비디아]

엔비디아의 AI 사이언티스트 짐 판(Jim Fan)은 이에 대해 “각 기업이 보유한 독점 데이터에 맞춰 개발할 수 있는 ‘서비스형 파운데이션 모델’이 출시된다”며 “엔비디아는 단순한 하드웨어 공급업체를 넘어 기업용 AI 공급업체(enterprise-first AI provider)로 거듭나고 있다”고 강조했다.

스테이블 디퓨전 개발사이자 오픈 소스 파운데이션 모델 분야 대표주자인 스태빌리티AI의 에마드 모스타크(Emad Mostaque) CEO 역시 “모두를 위한 파운데이션 모델”이라며 엔비디아를 치켜세웠다.

엔비디아 AI 파운데이션은 자체 LLM, 파운데이션 모델을 개발할 기술력 및 시간이 부족한 기업들에 인프라를 제공한다. 현재 사용 가능한 주요 파운데이션 모델은 엔비디아가 개발한 대화형 AI 모델 ‘네모(NeMo)’, 이미지 생성 모델 ‘피카소(Picasso)’, 바이오 분야에 특화된 ‘바이오네모(BioNeMo)’ 세 가지다.

엔비디아가 제공하는 파운데이션 모델을 활용하면 쉽게 원하는 언어 AI를 구축할 수 있다. 기초가 되는 파운데이션 모델 AI에 필요한 데이터를 넣고, AI가 데이터를 학습하면 필요한 AI 모델을 완성할 수 있다.

피카소는 독점 콘텐츠로 학습된 맞춤형 이미지 생성 AI를 만들 수 있다. 바이오네모는 2조 달러 규모에 달하는 신약 개발 시장에서 연구자들을 지원한다. 엔비디아는 AI의 토대는 물론 학습 데이터도 제공할 계획이다. 이날 엔비디아는 자체 이미지 데이터를 확보하고 있는 이미지 제공 업체들과 협업을 발표했다.

사진·이미지 제공 업체 게티이미지는 현재 엔비디아와 협력해 텍스트로 이미지 및 비디오를 생성하는 모델을 개발하고 있다. 다른 이미지 제공 업체 셔터스톡 역시 엔비디아와 손잡고 텍스트로 3D 이미지를 생성하는 자체 모델을 훈련 중이다.

이미지 제공 업체들이 최근 생성 AI 업체들과 갈등을 빚은 것과는 사뭇 다른 양상이다. 게티이미지는 1월 오픈 소스 이미지 생성 모델 스테이블 디퓨전의 개발사인 스태빌리티 AI를 저작권 위반으로 고소한 바 있다.

창작 도구 소프트웨어 1위 업체 어도비(Adobe) 역시 엔비디아와 협력해 차세대 생성 AI 기능을 구축했다. 창작자를 위한 생성 AI 도구 ‘파이어플라이(Firefly)’가 대표적이다. 파이어플라이를 사용하면 포토샵 같은 어도비의 이미지 편집 도구 안에서 텍스트로 이미지를 쉽게 만들어 내거나 동영상 편집 도구 프리미어 프로에서 간편하게 생성 이미지를 활용한 영상을 만들어 낼 수 있다.

신약 개발 돕는 클라우드 서비스

AI 업계에서는 파라미터(parameter, 매개변수) 개수를 LLM, 파운데이션 모델 크기의 척도로 활용한다. 또 파라미터 개수는 모델의 성능과 밀접한 상관관계를 가진 것으로 알려져 있다. 엔비디아에 따르면 엔비디아 AI 파운데이션에서 활용할 수 있는 파라미터 숫자는 최소 80억 개, 최다 5300억 개다.

오픈AI가 개발한 GPT-3의 파라미터 수가 1750억 개, 구글이 개발한 PaLM(Pathways Language Model)의 파라미터 수가 5400억 개라는 점을 고려하면 사실상 업계 최고 수준의 선택지를 확보할 수 있는 셈이다.

필요한 경우 파라미터 수를 최소화해 AI를 개발할 수도 있다. 최근 스탠퍼드 대학은 70억 개의 파라미터를 가진 메타의 ‘라마(LLaMA)’를 미세조정한 모델 ‘알파카(Alpaca)’를 내놓았다. 알파카는 파라미터가 훨씬 많은 챗GPT(GPT-3.5)와 비슷한 성능을 구현할 수 있다.

엔비디아 바이오네모 클라우드 서비스 이용 원리를 설명한 모식도. [엔비디아]

네모와 피카소는 엔비디아 기업용 AI 구동 시스템(하드웨어)인 ‘DGX’ 기반 클라우드(NVIDIA DGX Cloud)에서 실행된다. 개발자들은 간단한 API(애플리케이션 프로그래밍 인터페이스)를 통해 각 서비스에서 제공되는 기본 AI를 사용할 수 있다.

‘바이오네모 모델 기반 클라우드 서비스(BioNeMo Cloud Service)’도 마찬가지다. 신약 개발을 위한 AI 파이프라인(후보물질) 구축에 도움이 되는 사전 학습된 AI가 포함돼 있다. 딥마인드가 개발한 단백질 구조 예측 모델인 ‘알파폴드2’도 지원한다. 글로벌 바이오 업체 암젠도 현재 바이오네모를 활용해 신약을 개발 중이다.

“엔비디아에 ‘묶일’ 수도 있어”

엔비디아는 생성 AI 시장 장악 전략을 펴면서도 ‘그래픽처리장치(GPU) 개발 업체’라는 본질을 놓지 않았다. 엔비디아가 제공하는 플랫폼, 클라우드 서비스는 결국 엔비디아 하드웨어 기반으로 작동한다.

엔비디아는 챗GPT와 같은 대규모 언어 모델 추론을 위해 ‘H100 NVL’이라는 새로운 GPU를 발표했다. 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 하는 H100 NVL은 뛰어난 속도를 자랑한다. GPT-3 구동을 위한 엔비디아 하드웨어 HGX A100과 비교할 때 최대 10배 더 빠르다는 게 엔비디아 측 설명이다. H100 NVL GPU의 AI 쿼리(query, 요청) 처리 성능은 이전 세대 GPU인 A100에 비해 12배 빠른 것으로 알려졌다.

황 CEO는 “H100 NVL을 사용하면 대규모 언어 모델 구동(processing) 비용을 대폭 줄일 수 있다”고 했다.

8개의 엔비디아 H100 NVL GPU를 연결해 하나의 거대한 GPU처럼 작동하는 DGX H100은 다양한 클라우드 업체들이 이미 채택해 활용 중이다. 오라클 클라우드 인프라(Oracle Cloud Infrastructure)를 시작으로 마이크로소프트 애저는 다음 분기에 DGX 기반 클라우드 호스팅(클라우드 서비스 제공)을 시작한다. 아마존웹서비스(AWS), 구글 클라우드는 물론 오픈AI도 H100 NVL을 사용할 예정이다.

AI 모델을 실제 서비스에 적용하는 ‘추론(inference)’ 플랫폼은 최근 챗GPT나 스테이블 디퓨전처럼 생성 AI 산업의 주류를 이루며 큰 시장을 형성하고 있다. IDC 연구 부사장 라우는 엔비디아 ‘록인(lock-in)’을 유념해야 한다고 경고했다. 록인은 마치 자물쇠로 걸어 잠근 것처럼 하나의 서비스에 고착화된 소비자들이 다른 서비스를 이용하기 힘든 현상을 말한다. 많은 기업이 엔비디아의 하드웨어, 소프트웨어, 서비스를 쓰고 있지만 서비스형(as-a-service) 제품은 또 다른 이야기다. 서비스형 제공자가 노리는 가장 큰 이점이 바로 록인이기 때문이다.

그는 “엔비디아의 서비스형 제품을 사용하면 AI 솔루션을 구축하는 데 있어 한 서비스에서 모든 것을 할 수 있으므로 매우 편리한 건 사실”이라며 “그러나 발을 너무 깊이 담그면, 나중에 만일 더 나은 서비스나 솔루션이 나왔을 때 발을 빼기 위해 큰 비용을 감수해야 할 수도 있다”고 말했다.

의료, 로보틱스, 스마트시티, 음성 서비스 등 다양한 AI 구축에 쓰이는 엔비디아의 GPU DGX H100. [엔비디아]

리소그래피 초고도화 해결사, 쿠리소

반도체 제조 과정의 병목 현상을 해결하는 새로운 소프트웨어 라이브러리 ‘쿠리소(cuLitho)’도 눈길을 끌었다. 쿠리소는 엔비디아가 만든 병렬 컴퓨팅 플랫폼 쿠다(CUDA)의 ‘쿠(cu)’와 반도체 핵심 공정 중 하나인 ‘리소그래피(Lithography)’의 ‘리소(Litho)’를 합쳐 만든 용어다. 리소그래피는 빛으로 반도체 소재인 ‘웨이퍼’ 위에 회로를 새기는 작업이다. 매우 정밀한 수준의 장비가 필요한 작업이다.

리소그래피는 이 중 노광공정에 주로 관여한다. 포토마스크에 그려진 회로를 극자외선(EUV)을 활용해 웨이퍼에 사진 찍듯 옮기는 작업이다. 반도체 선폭이 나노미터(㎚) 단위로 좁아지며 AI를 활용한 고성능 기술이 필요해졌다. 엔비디아에 따르면 쿠리소를 활용하면 리소그래피 작업 시간을 몇 주에서 8시간으로 단축할 수 있다.

예컨대 DGX H100 시스템 500개(엔비디아 호퍼 GPU 4000개 묶음)를 쿠리소로 구동했을 때 CPU(중앙처리장치) 4만 개 기반 서버보다 40배 빠르고, 전력 소모는 9배 줄일 수 있다. 세계 최대 파운드리(반도체 위탁 생산) 업체 TSMC, 글로벌 반도체 장비 1위 업체 ASML이 모두 이 기술을 채택했다.

황 CEO는 “반도체 산업은 거의 모든 산업의 기초”라며 “리소그래피가 물리학의 한계에 도달한 상황에서 엔비디아의 쿠리소 도입은 반도체 업계가 2나노미터(㎚) 이하 초미세공정으로 나아갈 수 있게 할 것”이라고 했다.

TSMC는 80조 원을 들여 대만에 2나노미터 파운드리 신공장을 건설 중이다. 2025년에는 양산이 가능할 것이란 전망이 나온다. 삼성전자 역시 2025년 2나노미터 공정을 도입할 계획이라고 밝힌 바 있다.

엔비디아가 포토샵을 ‘생성 AI 혁명’으로 이끈다

님

내 콘텐츠