본문 바로가기
Technology

Open AI의 DALL-E 2 vs Google Brain의 Imagen(이매진): AI(인공지능) ART에서의 승자는 과연 누구?

by benny lee 2023. 2. 25.
728x90
반응형

IMAGEN vs DALL-E 2
IMAGEN vs DALL-E 2

반응형

이매진(Imagen) vs DALL-E 2

인공지능(AI)은 Text to image(텍스트  이미지) 생성 분야에서  발전을 이루었으며, 구글브레인(Google Brain)의 이매진(Imagen)과 Open AI의 DALL-E 2가 Text to Image(텍스트 두 이미지) 생성 AI(인공지능) 분야에서 경쟁하면서 AI 이미지 경쟁이 가열되고 있습니다. 두 모델 모두 텍스트 프롬프트를 그림으로 변환할 수 있지만 구글은 자사의 시스템이 DALL-E 2에 비하여 "전례 없는 포토 리얼리즘과 깊은 언어의 이해"를 제공하고 있다고 주장하고 있다는데요~~

왤시코기 이미지 비교
왤시코기 이미지 비교

Open AI의 DALL-E 2

DALL-E 2 Open AI  오리지널 버젼인 DALL-E  개량한  모델로 사용자가 이미지화하고 싶은 모든 문장을 요청하기만 하면 놀라운 해상도의 이미지들을 더 빠르게, 말 그대로 "생산"해 낼 수 있는데 이는 이미지 생성 신경망을 이용하여 이전 버젼인 DALL-E를 크게 상회하는 수준이라고 합니다.

dragon fruit 이미지 비교
dragon fruit 이미지 비교

구글브레인(Google Brain)도 이매진(Imagen)

이에 뒤질세라 구글브레인(Google Brain)도 이메진(Imagen)이라는 이름의 이미지 생성 AI를 공개하게 되는데요, 심지어 최근에 공개된 Open AI  DALL-E 2보다도 뛰어난 성능을 보여준다고 합니다. 구글브레인(Google Brain)의 이메진(Imagen)은 컴퓨터 생성 이미지의 해상도 품질 평가에서도 Open AI  DALL-E 2를 앞설 뿐 아니라 인간 심사위원들이(이렇게 구분을 해야 하는 상황이 오다니...ㅠㅠ) 뽑은 이미지들도 구글브레인(Google Brain)의 이매진(Imagen)의 이미지들을 더 선호했다고 합니다.

AI 로봇 커플 이미지 비교
AI 로봇 커플 이미지 비교

혹자들은 이제 스톡 이미지(Stock Image)와 같은 산업은 끝이 났다고 이야기하는 사람들도 있다고 합니다. 구글브레인(Google Brain)의 이매진(Imagen)이 만들어낸 이미지를 본다면 상업적으로 바로 이용이 가능할 정도의 퀄리티의 이미지를 빠른 속도로 원하는 만큼 생산이 가능하니 누가 셔터스톡(Shutterstock)에서 유료로 이미지를 고르고 있겠는가?라고 말이지요.

말을 타고 있는 우주인의 모습 이미지 비교
말을 타고 있는 우주인의 모습 이미지 비교

Text to image(텍스트 투 이미지) 확산 모델의 어두운 면

하지만 이렇게 밝은 면만 존재하는 것은 아닙니다. AI(인공지능)의 특성상 방대한 인터넷 자료의 학습을 통해서 이러한 이미지 생산 과정이 이루어지게 되는데 현재는 윤리적으로 부적합한 데이터는 인간에 의해서 필터링을 통해서 일부 제외하고 통제하에서 학습이 이루어진다고 하지만, 이러한 AI(인공지능) 이미지 생성 모델이 세상에 공개된 후 부정적인 내용의 글과 이미지들로 학습이 된다면 끔찍한 콘텐츠들을 임의로 생산하지 않으리라고 장담하지 못한다는 것입니다. 그리고 더욱 놀라운 것은 인공지능(AI) 분야에서 진보된 기술력을 보유하고 있는 이 두 회사조차도 현재 그 문제들을 수정할 수 있는 해법을 전혀 모르고 있다는 것입니다. 그러한 이유에서 추가적인 안전장치가 고안되기 이전까지 구글브레인(Google Brain)도 이메진(Imagen)을 일반인에게 공개하지 않기로 결정을 했다고 합니다.

만약 진짜처럼 보이는 가짜 콘텐츠들을 만들어 낸다면 그리고 CHATGPT(챗GPT)와 같은 AI(인공지능)에 의해서 기사화되어 인간이 통제할 수 없는 빠른 속도로 유포된다면 편리한 생활을 위해서 고안해 낸 AI(인공지능)에 의해서 혼란만 야기되는 상황이 올 수도 있는 문제인 것입니다.

뉴욕 야경 이미지 비교
뉴욕 야경 이미지 비교

양날의 검과 같은 이매진(Imagen)과 DALL-E 2

얼마전 보도에 따르면  Open AI의 DALL-E 2가 한정된 생산량(무료)과 유료화를 통해서 세상에 일부 공개가 되었다고 들었습니다. 이러한 구글브레인(Google Brain)의 이매진(Imagen)과 Open AI의 DALL-E 2와 같은 Text to image(텍스트  이미지) 확산 모델의 무한한 창의력과 잠재력은 높게 평가하지만 윤리적 도덕적으로 많은 문제와 사회적 혼란을 야기시킬 수 있는 소지가 있기 때문에 기업 간 과도한 경쟁에 의해서 최소한의 안전장치도 없이 떠밀리듯이 사회에 공개되는 것은 바람직하지 않을 수 있을 것입니다. 

관련 이전 글들

2023.02.08 - [Technology] - AI(인공지능) DALL-E 2가 그린 그림, 과연 저작권의 주인은 누구에게?

 

AI(인공지능) DALL-E 2가 그린 그림, 과연 저작권의 주인은 누구에게?

요즈음 CHATGPT(챗 GPT)와 같은 대화형 AI의 공개 이후 우리의 일상에서 AI(인공지능)의 사용이 한결 가까이 다가오는 느낌입니다. CHATGPT(챗 GPT)의 성공적인 공개 이후 검색엔진 시장에서도 대대적인

de-kube.tistory.com

2023.02.01 - [Technology] - CHATGPT(챗GPT), DALL-E 2: AI(인공지능)가 그림, 디자인까지? 도대체 어디까지 가능한거니?

 

CHATGPT(챗GPT), DALL-E 2: AI(인공지능)가 그림, 디자인까지? 도대체 어디까지 가능한거니?

CHATGPT(챗 GPT) 넌 누구니? 요즈음 제일 핫한 이슈는 인공지능이 하루가 다르게 발전하고 있다는 이야기 일 텐데요. 그중에서도 MS와 일론머스크가 공동 투자한 AI 연구소인 OpenAI가 개발한 대화형 AI

de-kube.tistory.com

 

728x90
반응형

댓글