2023년 2월호

AI가 블록버스터 만드는 날, 도래 임박

[박원익의 유익한 IT] 예술은 죽지 않는다, 다만 기계가 만들 뿐

  • 박원익 더밀크 뉴욕플래닛장

    wonick@themilk.com

    입력2023-02-09 10:00:01

  • 글자크기 설정 닫기
    • 예술가가 프로그래머보다 먼저 AI로 대체?

    • 그림·소설·영상도 AI가 만드는 시대

    • 우리는 제너레이티브 AI의 변곡점에 있다

    • 사람 노동력보다 빠르고 저렴한 AI

    [Gettyimage]

    [Gettyimage]

    구글의 동영상 제작 AI 페나키가 영상을 만들어내는 과정을 단계별로 분석한 그림. [구글]

    구글의 동영상 제작 AI 페나키가 영상을 만들어내는 과정을 단계별로 분석한 그림. [구글]

    최근 뉴욕 맨해튼 ‘피어 57’에서 진행한 구글 시연 현장에 등장한 AI(인공지능) 모델 ‘페나키(Phenaki)’는 기술업계 관계자들에게 큰 충격을 안겼다. 글(text)만 입력하면 동영상을 만들어주는 놀라운 결과물 때문이었다.

    예컨대 “테디베어가 바다로 뛰어든다. 테디베어가 물에서 나온다. 테디베어가 해변을 걷는다. 카메라가 줌아웃(zoom out)되고 해변에서 모닥불을 쬐는 테디베어가 보인다”라고 글을 입력하면 영상이 생성됐다. 2D 이미지나 애니메이션이 아닌 실사에 가까운 사실적 영상이다.

    ‘살아 움직이는 곰 인형’은 실제로는 존재하지 않는 상상의 산물이다. 이는 페나키가 만든 영상이 어딘가에서 모방한 것이 아닌 창조의 결과물이라는 의미가 된다. 이미지가 고양이인지 개인지조차 제대로 구별하지 못하던 AI가 10년도 안 돼 이미지를 만들어내는 데 그치지 않고 비디오까지 만들 수 있게 됐다.

    이른바 ‘제너레이티브 AI(Generative AI·생성 모델)’ 시대. 틱톡, 쇼츠, 릴스에 올릴 쇼트폼 영상을 AI가 만들어줄 시대가 열리고 있다. 실제로 포토샵, 프리미어 프로 등 창작자를 위한 도구로 유명한 어도비는 제너레이티브 AI 기술을 포토샵에 통합해 AI가 생성한 새로운 개체를 추가하는 방식, 기존 이미지를 기반으로 변형할 수 있는 기능, 텍스트 기반으로 이미지를 추가하는 방식 등을 실험하고 있다. 스콧 벨스키 어도비 최고제품책임자(CPO)는 “제너레이티브 AI 기술은 이미지를 넘어 비디오, 3D 디자인, 텍스처(질감) 생성, 로고 디자인 등 모든 미디어 분야에서 활동하는 창작자들을 도울 수 있을 것”이라고 했다.

    도대체 AI, 딥테크(고기술 기반 산업) 업계에서 무슨 일이 벌어지는 것일까. 제너레이티브 AI는 일반 AI와 무엇이 다른 걸까. 정말 AI가 예술가를 대체하게 될까. 벤처투자업체 a16z, 앤틀러(Antler) 자료를 토대로 제너레이티브 AI의 정의, 10대 영역 지형도를 살펴봤다.



    예술은 인간 고유 영역 아냐

    “예술은 죽지 않았다. 기계가 만들 뿐이다.”

    실리콘밸리 a16z에서 활동하는 귀도 아펜젤러(Guido Appenzeller) 특별 자문위원은 최근 발간한 글에서 “AI(인공지능) 모델은 프로그래머를 대체하기 전 예술가를 대체하게 될 것”이라며 이같이 말했다. 예술은 인간의 독창성을 기반으로 한 고유 영역, 즉 AI가 대신할 수 없는 분야로 여겨졌는데, 그 믿음이 흔들린다는 주장이다.

    글로벌 반도체 업체 인텔, 클라우드 컴퓨팅 업체 VM웨어에서 최고기술책임자(CTO)를 지낸 테크 구루가 이런 말을 한 배경은 무엇일까. 근거는 분명하다. AI, 그중에서도 제너레이티브 AI가 만들어내는 결과물의 수준, 발전 속도가 상상을 뛰어넘는다는 것.

    깃허브 소스코드 저장소의 이용자별 즐겨찾기(스타) 등록 현황. 맨 왼쪽이 스테이블 디퓨전으로 다른 분야에 비해 가파르게 즐겨찾기 등록 수가 늘었다. [깃허브]

    깃허브 소스코드 저장소의 이용자별 즐겨찾기(스타) 등록 현황. 맨 왼쪽이 스테이블 디퓨전으로 다른 분야에 비해 가파르게 즐겨찾기 등록 수가 늘었다. [깃허브]

    최근 실리콘밸리에서는 아펜젤러와 비슷한 관측을 내놓는 전문가가 급격히 증가하는 추세다. 놀라운 데이터 중 하나는 ‘깃허브(GitHub)’ 저장소 스타(Star·일종의 즐겨찾기) 숫자다. 소프트웨어 엔지니어들은 깃허브에서 소스코드 저장소(repository)를 참조해 개발에 활용하는데, 문자 기반으로 이미지를 생성(text-to-image)하는 오픈소스 제너레이티브 AI 모델 ‘스테이블 디퓨전(Stable Diffusion)’의 스타 숫자가 수직 상승하고 있다.

    제러네이티브 AI에 대한 개발자들의 관심이 폭증하고 있다는 의미다. 개발자들의 관심은 새로운 제품, 서비스, 스타트업의 출현으로 이어진다. 실제로 스테이블 디퓨전 기반으로 개발된 AI 초상화(이미지 생성) 앱 ‘렌사(Lensa)’는 2022년 12월 7일 기준으로 세계 곳곳에서 가장 많이 내려받은 앱 1위에 오르며 업계 관계자들을 깜짝 놀라게 했다. 12월 들어 5일 동안 거둬들인 ‘매직 아바타(사용자가 사진을 제출하면 유사한 이미지를 생성)’ 매출은 800만 달러(약 102억 원)를 돌파했다.

    제너레이티브 AI란?

    “우리는 제너레이티브 AI의 변곡점에 있다. 컴퓨터는 어느 때보다 창조를 잘하며 인간과 컴퓨터의 상호작용은 어는 때보다 쉬워졌기 때문이다.”

    래디컬 벤처스(Radical Ventures) 소속 벤처 투자자 몰리 웰치는 제너레이티브 AI의 발전 속도를 가리켜 이렇게 평가했다. 최근 제너레이티브 AI가 특별히 주목받는 이유는 컴퓨팅 성능, 즉 컴퓨터 연산 능력의 개선이 뒷받침된 데 있다는 게 그의 설명이다.

    제너레이티브 AI는 AI 기술의 한 분야로 텍스트, 이미지, 음악 같은 새로운 콘텐츠를 생성하는 데 중점을 둔 AI 모델 혹은 AI 애플리케이션(응용프로그램)을 의미한다. 제너레이티브 AI 모델은 대규모 데이터 세트를 활용해 학습을 거친 후 머신러닝(Machine Learning·기계학습) 알고리듬을 사용해 학습 데이터와 유사한 새로운 콘텐츠를 생성할 수 있게 된다.

    오픈AI가 개발한 제너레이티브 AI 화가 달리. [오픈AI]

    오픈AI가 개발한 제너레이티브 AI 화가 달리. [오픈AI]

    제너레이티브 AI 작업 모델로는 ‘생성적 적대 신경망(Generative Adversarial Network·GAN)’ ‘합성곱 신경망(Convolutional Neural Network·CNN)’ ‘트랜스포머(Transformer)’ ‘베리에이셔널 오토인코더(Variational Autoencoder·VAE)’ ‘자기회귀모델(Autoregressive model)’ 등이 있으며, GAN이 적용된 엔비디아의 이미지 생성 모델 ‘고갱(GauGAN)’, 트랜스포머 기반으로 오픈AI가 공개한 ‘달리(DALL·E)’, 구글 ‘이매진(Imagen)’ 등이 유명하다.

    ‘어떻게 AI가 실제와 유사한 무언가를 창조할 수 있는지’ 궁금하다면 GAN의 작동 방식을 떠올리면 된다. GAN은 생성 모델(생성자·generator)과 판별 모델(감별자·discriminator)이 경쟁하면서 실제와 가까운 이미지, 영상, 텍스트 등을 자동으로 만들어내는 AI 학습 방식의 하나로 위조지폐를 만드는 범인(생성자)과 위폐를 감별하는 경찰(감별자)로 흔히 비유된다.

    위폐범과 경찰이 계속 경쟁하는 가운데, 위폐 제작 수준이 높아져 위폐와 진짜 지폐를 구별할 수 없는 수준에 이르게 되는 것이다. 다만 이런 학습을 위해서는 대량의 데이터, 고도의 컴퓨팅 능력이 필요하다. 반도체 기술 발전과 대규모 자본 투입, AI 모델 정교화로 이 문제가 해소되면서 기하급수적인 발전이 이뤄졌다고 보면 된다.

    엄청난 기회 열린다

    사마이파타 벤처스(Samaipata Ventures) 소속 벤처 투자자 스테파니 챈은 앤틀러와 인터뷰하면서 제너레이티브 AI를 “거의 모든 산업에 피할 수 없는 파문을 일으킬 거대한 물결”이라고 묘사했다. 대부분의 산업에 엄청난 부가가치를 만들어낼 수 있다는 주장이다.

    그는 제너레이티브 AI 모델 기반 플랫폼, 사용자 경험(UX), 접근성 분야에서 큰 기회가 있을 것으로 봤다. 예술 분야에서는 제너레이티브 AI를 효율화, 영감을 위한 도구로 활용할 수 있다는 관측이 나온다. 디자인 작업을 위한 콘셉트 아트 제작에 사용하거나 작가가 소설 초안 생성용으로 제너레이티브 AI를 활용한 후 이를 다듬어 완성하는 식이다.

    a16z에 따르면 초상화 이미지가 필요한 경우 제너레이티브 AI를 활용하면 4배 더 저렴하고 훨씬 빠르게 이미지를 얻을 수 있다. 이는 아티스트를 고용하거나 직접 작업할 경우 사실적인 맞춤형 이미지를 얻는 데 1시간이 걸리고, 10달러 수준의 비용이 든다고 가정한 결과다. 제너레이티브 AI가 시간과 비용을 절약해 준다면 마케팅, 게임 디자인, 웹 디자인, 인테리어 디자인 등 다양한 분야에서 이를 사용하지 않을 이유가 없다는 설명이다.

    AI 개발업체 오픈AI가 최근 출시한 대화형 AI 모델 ‘챗GPT(ChatGPT)’ 역시 최근 업계에 큰 충격을 안겼다. 챗GPT 역시 트랜스포머 기반으로 개발된 제너레이티브 AI 모델이다. ‘인간처럼 말을 만들어낼 수 있는 AI’인 셈이다. 챗GPT에게 제너레이티브 AI의 미래를 물었더니 “많은 산업에 혁명을 일으킬 것”이라고 답했다.

    제러네이티브 AI 스스로도 이 분야에서 이뤄낼 무한한 가능성을 인정하고 있다. 채팅 API(애플리케이션 프로그래밍 인터페이스) 스타트업 센드버드(Sendbird)의 김동신 대표가 챗GPT에 물어본 스타트업 창업 아이디어도 흥미롭다. 챗GPT가 언급한 모든 분야에 사실상 제너레이티브 AI 기술이 적용될 수 있다.

    10大 영역 폭발 성장할 듯

    앤틀러는 제너레이티브 AI 산업의 지형도를 크게 10가지 영역으로 분류했다. 텍스트, 이미지, 오디오, 코드(프로그래밍), 챗봇, 비디오, 머신러닝(ML) 플랫폼, 검색, 게임, 데이터가 그것이다.

    텍스트는 텍스트 콘텐츠를 요약하거나 텍스트 제작을 자동화하는 영역, 이미지는 렌사처럼 이미지를 생성하는 영역, 오디오는 음성 내용을 요약하거나 생성하고, 음성을 텍스트로 변환하는 영역을 의미한다.

    비디오 생성과 코딩 자동화, 고객 서비스를 맡길 수 있는 챗봇도 현재 관련 업체들이 빠르게 생겨나는 추세이며 머신러닝 플랫폼, AI 기반 검색이 가능한 챗GPT 등의 서비스도 등장하고 있다. 게임 분야에서는 제너레이티브 AI 기반 게임 스튜디오가 생겨나고 있으며, 데이터 분야의 경우 데이터 설계·수집·요약을 AI에 맡기는 형태다.

    카피라이팅 AI 재스퍼가 광고 문구를 작성하는 모습. [재스퍼]

    카피라이팅 AI 재스퍼가 광고 문구를 작성하는 모습. [재스퍼]

    텍스트, 이미지, 오디오, 코드, 챗봇, 비디오 관련 업체 수가 많고, 나머지 4개 분야는 상대적으로 더 초기 단계라고 볼 수 있다. 이 분야 유니콘(기업가치 10억 달러 이상 비상장 스타트업)으로는 오픈AI, 자동 문법 교정 서비스 ‘그래머리(Grammarly)’, 고객 서비스 자동화 솔루션 ‘Ada’, 회사 내부 정보 검색 도구 ‘글린(glean)’, AI 카피라이터 ‘재스퍼(Jasper)’, 스테이블 디퓨전 개발업체 스태빌리티 AI(Stability AI), AI 기반 콜센터 솔루션 크레스타(Cresta) 등이 있다.

    제너레이티브 AI의 주요 매출원으로는 첫째 기술 사용료를 받는 라이선싱, 둘째 AI가 만들어낸 결과물, 이를테면 생성 이미지를 판매하는 방법을 생각해 볼 수 있다. 구독 서비스처럼 AI 시스템에 접속 권한을 제공하고 구독료를 받을 수 있으며 제너레이티브 AI를 현재 제품의 효율 개선에 활용해 비용을 줄이거나 매출을 극대화하는 것도 가능하다. 마지막 다섯 번째는 기존에 없었던 완전히 새로운 제품이나 서비스를 창출하는 방식이다.

    다만 제너레이티브 AI에 대한 지나친 낙관은 금물이다. 거대 AI 모델을 만들고 운영하는 데는 막대한 컴퓨팅 자원이 필요하고, 이를 위해서는 대규모 자금이 투입돼야 한다. 렌사의 경우 오픈소스(무료)로 공개된 스테이블 디퓨전을 활용했기에 바로 매출을 올릴 수 있었지만, 해당 기술의 상업화가 본격화할 경우 비즈니스 환경이 크게 바뀔 가능성도 존재한다.

    최근 한계에 도달했다는 관측이 나오는 ‘무어의 법칙(Moore’s Law·마이크로칩에 저장할 수 있는 데이터 분량이 18~24개월마다 두 배씩 증가한다는 법칙)’처럼 칩 기술 발전이 물리적 한계에 부딪힐 가능성도 있다. 퀀텀 컴퓨팅 등 새로운 돌파구가 마련되지 않는다면 AI 산업의 발전 속도가 정체될 수 있다는 관측도 제기된다.



    댓글 0
    닫기

    매거진동아

    • youtube
    • youtube
    • youtube

    에디터 추천기사