[국제]챗GPT 텍스트·이미지 통합 모델 출시..."의도 파악해 생성"

챗GPT 개발사 오픈AI가 한층 진화한 새로운 이미지 생성 인공지능(AI) 모델인 '챗GPT-4o(포오) 이미지 생성'(ChatGPT-4o Image Generation) 모델을 출시했습니다.

새 모델은 오픈AI의 대표 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이라고 오픈AI는 설명했습니다.

오픈AI는 "텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"고 설명했습니다.

새 모델은 오픈AI의 기존 이미지 모델인 '달리'(DALL-E)보다 더 쉽고 정교하게 이미지를 생성한다고 소개했습니다.

기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성하는 만큼 복잡한 요청도 쉽게 수행할 수 있게 됩니다.

예를 들어, 기존 AI 이미지 생성 모델들은 단순히 자전거 이미지는 잘 생성하지만, '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 훈련되지 않은 데이터인 만큼 어려움을 겪었습니다.

무엇보다 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다는 게 오픈AI의 설명입니다.

이에 따라 '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래의 종류와 이름을 정확히 매칭해 생성하게 됩니다.

기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨는 종종 깨지는 경우가 많았지만, 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐습니다.

자연법칙에 관한 이미지도 쉽게 만들 수 있습니다.

무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해달라고 하면 문구가 들어간 이미지가 한눈에 보기 쉽게 생성됩니다.

만화를 그려달라고 하면 대화가 들어간 카툰이 깔끔하게 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성합니다.

투명 배경도 지원해 강아지 스티커를 만들 때 투명 배경을 요청하면 이를 반영할 수 있고, 비즈니스 로고와 같은 이미지도 투명 배경으로 생성할 수 있습니다.

오픈AI는 새 모델이 이미지를 생성한다는 점에서 기존 '달리'의 업그레이드 버전이긴 하지만, 두 모델의 기반 기술이 완전히 다른 만큼 새 모델에서 다양한 개선이 이뤄졌다고 설명했습니다.

오픈AI는 새 모델이 또 한국어로도 이미지 생성이 가능하며 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다고 전했습니다.

YTN 이승윤 (risungyoon@ytn.co.kr)

※ '당신의 제보가 뉴스가 됩니다'
[카카오톡] YTN 검색해 채널 추가
[전화] 02-398-8585
[메일] social@ytn.co.kr

[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]

국제

기사목록 전체보기

YTN

많이 본 뉴스

챗GPT 텍스트·이미지 통합 모델 출시..."의도 파악해 생성"

국제