<기획> 인공지능 그림, 창작과 침해 사이 (한성대신문, 583호)

    • 입력 2022-11-07 07:40
    • |
    • 수정 2022-11-07 07:52

<편집자주>

최근 인공지능(AI)의 활용 범위가 빠른 속도로 넓어지고 있는 가운데, 특히나 예술 분야에서 인공지능이 괄목할만한 성과를 내고 있다. 그 중 이목이 쏠리는 것은 ‘그림’이다. 실제로 지난 9월 미국에서 열린 ‘콜로라도 주립 박람회 미술대회’에서 디지털아트 부분 1위를 차지한 작품이 인공지능 프로그램으로 생성된 사실이 밝혀지면서 많은 이들이 충격에 휩싸였다. 더욱 놀라운 것은 그림이 오직 ‘텍스트’를 매개로 그려졌다는 점이다. 인공지능이 어떻게 텍스트를 이해하고 그림을 그리는 것일까? 그리고 누구나 쉽게 사용할 수 있다는 기술에 우려되는 사회적 문제는 없을까?

김지윤 기자

[email protected]

스스로 배운다… 인공지능의 놀라운 혁신

인공지능 그림의 개발 자체가 최근에 시작된 것은 아니다. 과거에도 인공지능 그림은 여러 모습으로 우리 곁에 출현했다. 구글이 만든 ‘딥드림(DeepDream)’, 마이크로소프트의 ‘넥스트 렘브란트(The Next Rembrandt)’가 그 예시다. 이들은 빅데이터와 딥러닝 기술의 축적으로 인간보다 훨씬 더 빠른 속도로 그림을 그려낸다. 다만 과거에 사용됐던 이러한 기술이 인간의 산물을 모방 내지는 재현하는 형식이었다면, 최근 ‘생성적 적대 신경망 Generative Adversarial Network(이하 GAN)은 여러 이미지를 학습해 조합하고 합성하는 과정을 거쳐 창의적이고 독창적인 작품을 그린다.

인공지능 그림은 ‘달리(DALL·E)’, ‘미드저니(Midjourney)’, ‘노벨AI(NovelAI)’ 등과 같은 소프트웨어를 활용해 그려진다. 특히, 최근에는 인스타그램과 틱톡을 비롯한 ‘숏폼(Short Form)’에서 누구나 즐길 수 있는 문화로 자리잡아 젊은 층 사이에서 뜨겁게 주목받고 있다. 최종현(연세대학교 인공지능학과) 교수는 “우리가 원하는 문장을 텍스트란에 치면 그 문장과 관련된 그림을 순식간에 만들어준다. 보통 그림을 그리기 위해서는 오랜 시간과 노력이 필요한데, 이 기술은 문장 하나만 넣어줘도 기계가 알아서 만들어주기 때문에 큰 인기를 끄는 것”이라고 설명했다.

인공지능 그림에는 주로 GAN과 ‘Creative Adversarial Network’(이하 CAN)가 사용된다. GAN은 데이터 입력을 받는 ‘생성자’와 진위를 판별하는 ‘판별자’ 간의 경쟁을 통해 생성자가 실제와 더 유사한 작품을 만들게 하는 학습 구조다. 예를 들어 판별자를 경찰, 생성자를 지폐 위조범이라 가정해보자. 만일 경찰이 위조지폐를 구별하는 능력이 향상됐다고 할 때, 경찰을 속여야 하는 지폐 위조범의 기술은 향상된다. 반대로 지폐 위조범의 기술이 더욱더 향상되었을 경우에는 경찰의 위조지폐를 구별하는 능력이 더 뛰어날 필요가 생긴다. 이와 같이 적대적인 경쟁의 과정을 거치면 종래에는 위조지폐의 진위를 구별할 수 없는 상태가 되고, 일반 지폐와 별반 차이가 없는 가짜 지폐가 형성된다는 것이다.

이렇게 GAN이 작품의 질적 완성도를 높이는 데 일조했다면, CAN은 작품의 독창성을 개선하기 위한 기술이다. CAN은 새로운 스타일의 그림을 그리기 위해 기존의 화풍을 학습한 후, 새로운 화풍을 창조해 내는 모델이다. 허정윤(국민대학교 테크노디자인 전문대학원) 교수는 “생성자는 판별자를 계속 속이려고 하고 판별자는 거기에 속지 않으려고 한다. 그러다 생성자와 판별자가 서로를 구별하지 못하는 상황에 이르게 되면 비로소 결과물은 완성됐다고 판단할 수 있다”고 설명했다. 이어 하성재(광운대학교 전파공학과) 교수는 “CAN은 주로 창작 분야에서 다양하게 사용되고 있으며 확대될 예정이다. 해당 기술은 쉽게 말해 찢어진 과거의 흑백 사진을 컬러 사진으로 원상복구 할 수 있는 기술이다. 복원뿐만 아니라 해상도도 상당히 향상시켜 자주 쓰이는 기술로 자리 잡았다”고 설명했다.

그렇다면 텍스트는 어떻게 인공지능에게 전달될까. 이는 주로 자연어 처리 모델을 이용한다. 대표적인 모델인 ‘Generative Pre-trained Transformer’(GPT)는 딥러닝을 이용해 인간이 사용하는 텍스트를 만들어내는 기술이다. 해당 모델을 이용해보면 인간과 흡사한 문장을 형성하는 것을 확인할 수 있다. 이는 인공지능이 언어능력을 획득한 것은 아니고, 무수하게 많은 데이터베이스를 바탕으로 학습한 패턴 중 가장 자연스러운 단어를 가장 자연스러운 문장구조에 따라 출력한 결과다. 강태원(강릉원주대학교 컴퓨터공학과) 교수는 “텍스트를 입력하면 인공지능은 텍스트를 이해하기 위해 딥러닝 기술을 사용한다. 이뿐만 아니라 텍스트에 맞게 사진의 크기를 조절하고 배치하는 등, 그림을 최종적으로 완성하는 것도 딥러닝 기술이 필요하다”고 말했다.

실제로 텍스트 란에 말이 되지 않는 문장을 적어도, 소프트웨어 내부에 관련된 여러 이미지 데이터를 조합하고 합성하는 과정을 거쳐 최대한 적합한 결과가 추출된다. 예를 들어 ‘엉덩이에 뿔이 달린 원숭이’라는 문장을 텍스트 란에 입력하면, 각종 ‘엉덩이’, ‘뿔’, ‘원숭이’ 사진이 서로 합성 작업을 거치고 결과를 나타낸다. 이러한 기술은 인공지능 그림이 주목받기 시작하기 오래전부터 존재한 기술이다. 지준(한성대학교 AI응용학과) 교수는 “2014년 GAN이 등장하면서 우리 세상에서 표현할 수 있는 것을 모두 숫자로 나타낼 수 있게 됐다. 이미지, 텍스트 심지어 음악까지 모두 GAN을 통해 표현 가능하다”고 설명했다.

이렇듯 인공지능 그림에 사용되는 기술은 대부분 딥러닝 기술이다. 일반적으로 딥러닝은 정보를 입력하는 ‘입력층’, 최종 출력값이 존재하는 ‘출력층’ 그리고 입력층과 출력층 사이에 위치한 ‘은닉층’으로 구성돼 있다. 각 층은 모두 인간의 뉴런을 모방한 인공신경망으로 구성돼 있는데 입력층에 들어온 정보가 복잡한 경우 은닉층에서 수많은 신경망을 쌓게 된다. 신경망이 쌓여 은닉층이 두꺼워지면서 출력층까지 향하는 길이 복잡해지게 되는데 이 상황을 ‘깊어졌다(deep)’고 표현한다. 이런 과정을 통해 딥러닝은 스스로 학습할 수 있는 것이다. 이렇듯 딥러닝은 학습 데이터와 학습 결과의 오차를 최소화할 수 있는 방향으로 계속 학습한다. 강 교수는 “뇌를 모방해서 만든 모델이 인공신경망인데 여러 겹으로 구성돼 있다. 신경망이 두꺼워질수록 구조가 복잡해지는데 이를 해결하기 위해 사용하는 것이 딥러닝 기술”이라고 전했다.

세상에 나쁜 인공지능은 없다. AI 뒤로 숨은 범죄자들

인공지능 그림 프로그램이 대량의 데이터를 수집하는 과정에서 초상권 및 개인정보 침해가 일어날 수 있다는 우려가 뜨거운 논쟁거리다. 타인의 신체에 자동으로 얼굴을 합성하는 프로그램인 ‘딥페이크(Deepfake)’에 노출될 가능성이 높기 때문이다. 딥페이크는 단순히 유머의 목적으로 사용되기도 한다. 하지만 지난 2019년에 한국방송통신전파진흥원이 발표한 「딥페이크 기술의 빛과 그림자」 보고서에 따르면 온라인에 유통되는 딥페이크 영상의 96%가 인물인 것으로 드러났다. 전창배(IAAE 국제 인공지능&윤리협회) 이사장은 “인공지능 그림에 사용되는 사진이 일부 악의적인 사용자에 의해 딥페이크 범죄로 악용될 가능성이 충분하다”고 전했다.

무분별하게 이미지를 학습한다는 인공지능의 특성 탓에 저작권 문제가 제기되기도 한다. 아무리 독창적이고 창의적인 그림이 완성됐다고 한들, 해당 이미지를 생성하기 위해 인공지능의 데이터베이스에 있는 타인의 저작물을 사용했기 때문이다. 비슷하게 인공지능이 그린 그림의 출처를 어떻게 표기해야 하는지에 대한 갑론을박도 현재진행형이다. 사용자가 직접적으로 그림을 그리지 않았지만, 이미지 생성을 위한 텍스트 형성 과정은 인간이 개입하기 때문에 창작 과정으로 포함시킬지에 대한 논의가 이어지고 있다. 정상조(서울대학교 법학전문대학원) 교수는 “저작물은 인간의 사상과 감정을 표현하는 것이기에, 사상과 감정이 없는 인공지능은 저작자가 될 수 없다”고 주장했다. 이어 이청호(상명대학교 계당교양교육원) 교수는 “미술작품의 경우 붓을 만든 사람이나 물감을 만든 사람이 저작권을 인정해 달라고 주장하는 사람은 없다. 그림을 그리는 재료는 누구나 사용할 수 있는 도구이기 때문이다. 인공지능 그림 프로그램도 같은 맥락으로 볼 수 있다”고 설명했다.

뿐만 아니라 성별, 인종, 문화, 나이등에 따른 편향성 문제도 인공지능 그림이 해결해야 할 과제다. 예를 들어 ‘힘센 성인이 짐을 들고 있는 모습’이라는 문장을 텍스트 란에 적은 경우를 생각해보자, 상대적으로 체력이 좋은 남성만을 한정해 그림이 그려질 수 있다는 것이다. 정 교수는 “해당 문제는 인공지능의 문제라기보다는, 인공지능이 애초에 학습한 데이터 자체가 편견을 가진 데이터라서 발생하는 문제다. 알고리즘적으로 여과를 거쳐 차별적인 요소를 없앤다는 것은 거의 불가능에 가까운 일”이라고 말했다. 이어 전 이사장은 “데이터는 결국 인간의 편견과 편향의 결과다. 따라서 데이터를 수집해 인공지능에 학습시키기 전 해당 데이터가 편향돼 있지 않은지, 불법이지 않는지, 신뢰할 수 있는지를 철저히 검증하고 필터링해 인공지능에 학습을 시켜야 문제가 최소화 된다”고 설명했다.

인공지능 그림과 실제 사람이 그린 그림을 구분할 수 없는 점도 문제로 지적된다. 이는 인공지능이 그린 그림을 본인이 그렸다고 빙자하는 사기 행태가 벌어질 수도 있다는 점에서 다소 심각하게 여겨진다. 이에 대해 정 교수는 “인공지능 그림이 추출되면 무조건적으로 워터마크가 생성될 수 있게 시스템을 마련해야 한다”고 해결책을 제시했다.

하지만 가장 큰 문제는 상술한 문제가 발생하더라도 처벌할 수 있는 방법이 없다는 것이다. 애초에 데이터 쪼가리에 불과한 인공지능을 처벌하는 것은 어불성설이고, 결국 누구에게 책임이 있는가를 규정해야 하는데 그 책임이 분산돼 있어 다소 모호할 수 있다는 지적이다. 전 이사장은 “인공지능 생성 기술로 인해 명확히 피해자가 특정될 수 있을 경우에는 법적 규제와 처벌이 필요하겠지만, 처벌이 만능은 아니기 때문에 광범위하게 규제를 사전에 하도록 나아가는 것은 인공지능 기술과 산업발전을 저해하게 된다. 이는 결국 인공지능의 혜택을 누릴 수 없게 만들어 바람직하지 않다”고 주장했다.

일각에서는 인공지능 시대에 걸맞은 지식재산권 보호 장치가 필요하다는 목소리도 나온다. 마치 음악을 스트리밍할 때마다 소정의 저작권료가 부과되듯이, 인공지능 그림 생성에 이미지가 사용될 때마다 해당 저작권자에게 약간의 저작권료를 제공하는 것이다. 이 교수는 “저작재산권에 대한 정당한 대가를 지불하고 저작인격권에 대한 출처를 밝혀야 한다. 적어도 인공지능으로 이미지를 제작할 때 참고한 이미지의 출처를 자동으로 표시하게 하는 등의 방식을 도입해 저작인격권을 보호해야 한다”고 설명했다. 덧붙여 정 교수는 “인공지능 그림의 저작권 문제를 해결하기 위해서는 인공지능 그림이 추출될 때 참고했던 이미지 출처를 의무적으로 남기는 것도 좋은 방법”이라고 말했다.

전문가들은 무엇보다 인공지능 기술이 우리 사회를 반영한다는 사실을 간과하지 말라고 당부했다. 심지원(동국대학교 철학과) 교수는 “인공지능이 학습 데이터로 활용하는 재료는 우리 사회에서 만들어 진 것이다. 얼핏 보아서는 인공지능 기술로 생기는 문제가 인공지능 기술과 인간의 문제로 보이지만 실제로는 인간과 인간의 문제라는 것을 잊지 말아야 한다”고 전했다.

댓글 [ 0 ]
댓글 서비스는 로그인 이후 사용가능합니다.
댓글등록
취소
  • 최신순
닫기