이매진(Imagen) vs DALL-E 2
인공지능(AI)은 Text to image(텍스트 투 이미지) 생성 분야에서 큰 발전을 이루었으며, 구글브레인(Google Brain)의 이매진(Imagen)과 Open AI의 DALL-E 2가 Text to Image(텍스트 두 이미지) 생성 AI(인공지능) 분야에서 경쟁하면서 AI 이미지 경쟁이 가열되고 있습니다. 두 모델 모두 텍스트 프롬프트를 그림으로 변환할 수 있지만 구글은 자사의 시스템이 DALL-E 2에 비하여 "전례 없는 포토 리얼리즘과 깊은 언어의 이해"를 제공하고 있다고 주장하고 있다는데요~~
Open AI의 DALL-E 2
DALL-E 2는 Open AI의 오리지널 버젼인 DALL-E를 개량한 모델로 사용자가 이미지화하고 싶은 모든 문장을 요청하기만 하면 놀라운 해상도의 이미지들을 더 빠르게, 말 그대로 "생산"해 낼 수 있는데 이는 이미지 생성 신경망을 이용하여 이전 버젼인 DALL-E를 크게 상회하는 수준이라고 합니다.
구글브레인(Google Brain)도 이매진(Imagen)
이에 뒤질세라 구글브레인(Google Brain)도 이메진(Imagen)이라는 이름의 이미지 생성 AI를 공개하게 되는데요, 심지어 최근에 공개된 Open AI의 DALL-E 2보다도 뛰어난 성능을 보여준다고 합니다. 구글브레인(Google Brain)의 이메진(Imagen)은 컴퓨터 생성 이미지의 해상도 품질 평가에서도 Open AI의 DALL-E 2를 앞설 뿐 아니라 인간 심사위원들이(이렇게 구분을 해야 하는 상황이 오다니...ㅠㅠ) 뽑은 이미지들도 구글브레인(Google Brain)의 이매진(Imagen)의 이미지들을 더 선호했다고 합니다.
혹자들은 이제 스톡 이미지(Stock Image)와 같은 산업은 끝이 났다고 이야기하는 사람들도 있다고 합니다. 구글브레인(Google Brain)의 이매진(Imagen)이 만들어낸 이미지를 본다면 상업적으로 바로 이용이 가능할 정도의 퀄리티의 이미지를 빠른 속도로 원하는 만큼 생산이 가능하니 누가 셔터스톡(Shutterstock)에서 유료로 이미지를 고르고 있겠는가?라고 말이지요.
Text to image(텍스트 투 이미지) 확산 모델의 어두운 면
하지만 이렇게 밝은 면만 존재하는 것은 아닙니다. AI(인공지능)의 특성상 방대한 인터넷 자료의 학습을 통해서 이러한 이미지 생산 과정이 이루어지게 되는데 현재는 윤리적으로 부적합한 데이터는 인간에 의해서 필터링을 통해서 일부 제외하고 통제하에서 학습이 이루어진다고 하지만, 이러한 AI(인공지능) 이미지 생성 모델이 세상에 공개된 후 부정적인 내용의 글과 이미지들로 학습이 된다면 끔찍한 콘텐츠들을 임의로 생산하지 않으리라고 장담하지 못한다는 것입니다. 그리고 더욱 놀라운 것은 인공지능(AI) 분야에서 진보된 기술력을 보유하고 있는 이 두 회사조차도 현재 그 문제들을 수정할 수 있는 해법을 전혀 모르고 있다는 것입니다. 그러한 이유에서 추가적인 안전장치가 고안되기 이전까지 구글브레인(Google Brain)도 이메진(Imagen)을 일반인에게 공개하지 않기로 결정을 했다고 합니다.
만약 진짜처럼 보이는 가짜 콘텐츠들을 만들어 낸다면 그리고 CHATGPT(챗GPT)와 같은 AI(인공지능)에 의해서 기사화되어 인간이 통제할 수 없는 빠른 속도로 유포된다면 편리한 생활을 위해서 고안해 낸 AI(인공지능)에 의해서 혼란만 야기되는 상황이 올 수도 있는 문제인 것입니다.
양날의 검과 같은 이매진(Imagen)과 DALL-E 2
얼마전 보도에 따르면 Open AI의 DALL-E 2가 한정된 생산량(무료)과 유료화를 통해서 세상에 일부 공개가 되었다고 들었습니다. 이러한 구글브레인(Google Brain)의 이매진(Imagen)과 Open AI의 DALL-E 2와 같은 Text to image(텍스트 투 이미지) 확산 모델의 무한한 창의력과 잠재력은 높게 평가하지만 윤리적 도덕적으로 많은 문제와 사회적 혼란을 야기시킬 수 있는 소지가 있기 때문에 기업 간 과도한 경쟁에 의해서 최소한의 안전장치도 없이 떠밀리듯이 사회에 공개되는 것은 바람직하지 않을 수 있을 것입니다.
관련 이전 글들
2023.02.08 - [Technology] - AI(인공지능) DALL-E 2가 그린 그림, 과연 저작권의 주인은 누구에게?
2023.02.01 - [Technology] - CHATGPT(챗GPT), DALL-E 2: AI(인공지능)가 그림, 디자인까지? 도대체 어디까지 가능한거니?
'Technology' 카테고리의 다른 글
AI(인공지능) DALL-E 2가 그린 그림, 과연 저작권의 주인은 누구에게? (0) | 2023.02.08 |
---|---|
건축의 새로운 페러다임: 모듈러 건축, 과연 블루오션일까? (0) | 2023.02.03 |
CHATGPT(챗GPT), DALL-E 2: AI(인공지능)가 그림, 디자인까지? 도대체 어디까지 가능한거니? (2) | 2023.02.01 |
파이 코인(PI COIN) 가상화폐 세계 제 2의 비트코인 되나? 파이코인 무료 채굴 방법 알려드려요. (4) | 2021.05.01 |
댓글