OpenAI, ChatGPT에 새로운 이미지 생성 모델 GPT-4o 통합
OpenAI가 드디어 일을 냈습니다! 챗봇 환경 내에서 바로 이미지 생성이 가능한 4o 모델을 ChatGPT에 도입했다고 해요. 이제 OpenAI의 Dall-E 이미지 생성 모델을 별도로 사용할 필요 없이, ChatGPT 안에서 모든 걸 해결할 수 있게 되었습니다. 물론, Dall-E를 선호하는 사용자를 위해 기존 모델도 여전히 사용 가능하다고 하니 걱정 마세요. 게다가 Sora AI 비디오 생성기도 ChatGPT 내에서 사용할 수 있게 되었다고 합니다.
무료 사용자도 사용 가능!
놀랍게도 이 새로운 기능들은 ChatGPT 무료 사용자뿐만 아니라 ChatGPT Plus, Team, Pro 사용자 모두에게 제공됩니다. 다음 주에는 엔터프라이즈 및 교육 사용자에게도 확대될 예정이라고 하니 정말 기대되네요.
Dall-E 3와의 차이점은?
이전에는 Dall-E 3가 ChatGPT 유료 구독자를 위한 이미지 생성 플러그인이었어요. 무료로 사용하고 싶다면 Microsoft Copilot의 기본 티어를 통해 이용할 수 있었죠. 하지만 이제 GPT-4o 모델 덕분에 ChatGPT 사용자 누구나 이미지 생성을 기본으로 사용할 수 있게 되었습니다. 물론, ChatGPT 무료 티어 사용자는 파일 업로드 및 데이터 분석에 제한이 있을 수 있다고 하니 참고하세요.
더욱 현실적인 이미지와 읽기 쉬운 텍스트
OpenAI는 GPT-4o 모델이 “인간 피드백을 통한 강화 학습(RLHF, reinforcement learning from human feedback)”이라는 출시 후 학습 과정을 거치면서 더욱 현실적인 이미지를 생성하고 텍스트 가독성을 높이는 데 주력했다고 합니다. 2024년 5월 GPT-4o를 발표한 후, OpenAI는 100명이 넘는 “인간 트레이너” 팀을 구성하여 모델에서 오타, 손과 얼굴의 일반적인 오류 등을 찾아 수정했다고 하네요.
투명 배경 이미지 생성 기능 추가
GPT-4o 모델은 투명한 배경을 가진 이미지를 생성하는 기능도 제공합니다. 이는 비즈니스 사용자나 크리에이터에게 매우 유용한 기능인데요, 로고나 아이콘 등을 만들 때 아주 편리할 것 같아요. ChatGPT 멀티모달 제품 책임자인 Jackie Shannon은 WSJ과의 인터뷰에서 이 점을 강조했습니다.
여전히 존재하는 단점들
OpenAI가 많은 개선을 이루었지만, GPT-4o 모델은 여전히 몇 가지 단점을 가지고 있습니다. 그중 하나는 “환각(hallucinations)” 현상인데요, 이는 AI 모델에서 흔히 발생하는 문제로 아직 해결해야 할 과제입니다. 또한, ChatGPT 환경 내에서 편집 일관성을 유지하는 것도 여전히 어려운 문제라고 해요. 하지만 OpenAI는 빠른 시일 내에 업데이트를 제공할 것을 약속했으니 기대해 봐도 좋을 것 같습니다.
윤리 및 법적 문제
OpenAI는 GPT-4o 모델이 “공개적으로 사용 가능한 데이터”와 Shutterstock과의 파트너십을 통해 얻은 독점 데이터를 기반으로 학습되었다고 주장합니다. ChatGPT를 통해 생성된 이미지에는 AI 워터마크가 없지만, C2PA 메타데이터를 포함하여 AI 생성 이미지임을 나타낼 것이라고 합니다. 이는 현재 업계 표준을 따르는 것이라고 하네요.