인공지능의 지속적인 진화가 우리의 디지털 세계를 어떻게 끊임없이 재정의하고 있는지를 보여주는 최근 사례는 현재 연구 단계에 있는 텍스트-이미지 변환 시스템인 DALL-E 3로, 2023년 10월부터 늦가을까지 API와 연구소를 통해 ChatGPT 플러스 및 엔터프라이즈 고객에게 곧 제공될 예정입니다.
이미지 생성의 한 단계 발전
최신 텍스트-이미지 변환 시스템은 단어나 설명을 무시하는 경우가 많아 사용자가 원하는 결과를 얻기 위해 복잡한 엔지니어링 기술을 배워야 하는 경우가 많습니다. DALL-E 3는 제공된 텍스트와 정확히 일치하는 이미지를 생성하는 기능에서 큰 진전을 이루었습니다.
동일한 프롬프트를 사용하더라도 DALL-E 3는 DALL-E 2에 비해 크게 개선된 기능을 제공합니다. 이 시스템은 ChatGPT에서 직접 개발되었기 때문에 ChatGPT를 브레인스토밍 파트너이자 프롬프트를 수정하는 도구로 사용할 수 있습니다. 간단한 문장부터 자세한 문단까지 보고 싶은 내용을 ChatGPT에 요청하기만 하면 됩니다.
아이디어를 제공하면 ChatGPT가 DALL-E 3를 위한 맞춤형 세부 프롬프트를 자동으로 생성하여 아이디어에 생명을 불어넣어 줍니다. 특정 이미지가 마음에 들지만 정확히 원하는 방식이 아닌 경우 몇 마디만 말하면 ChatGPT에 변경을 요청할 수 있습니다.
ChatGPT 플러스 및 엔터프라이즈 고객을 위한 새로운 기능
앞서 말씀드린 바와 같이, DALL-E 3는 10월 초에 ChatGPT 플러스 및 엔터프라이즈 고객에게 곧 제공될 예정입니다. DALL-E 2와 마찬가지로 DALL-E 3로 생성된 이미지는 고객의 자산이 되며, 복제, 판매 또는 제품에 사용하기 위해 허가를 요청할 필요가 없습니다.

보안에 집중
이전 버전과 마찬가지로 온라인에서 폭력적, 성인용 또는 혐오 콘텐츠를 생성하는 DALL-E 3의 기능을 제한하기 위한 조치가 취해졌습니다.
유해한 세대 방지
DALL-E 3에는 공인의 이름 식별을 요청하는 요청을 거부하는 완화 조치가 마련되어 있습니다. 모델을 테스트하여 위험성을 평가하고 선전 및 잘못된 정보와 같은 영역에서 완화 노력을 알리는 도메인 전문가인 레드 팀원과의 협력을 통해 공인 생성 및 시각적 표현의 과다 또는 부족과 관련된 악의적인 편견과 같은 위험 영역에서 보안 성능이 개선되었습니다.
내부 테스트
이미지가 AI로 생성된 경우 사람들이 이를 식별할 수 있는 가장 좋은 방법을 찾기 위한 연구도 진행 중입니다. 따라서 이미지가 DALL-E 3에 의해 생성되었는지 여부를 식별할 수 있는 새로운 내부 도구인 출처 분류기를 테스트하고 있으며, 이 도구를 사용하여 생성된 이미지가 어떻게 사용될 수 있는지 더 잘 이해할 수 있기를 희망하고 있습니다.
크리에이티브 제어
DALL-E 3는 생존 아티스트의 스타일로 이미지를 요청하는 요청을 거부하도록 설계되었습니다. 이제 아티스트는 향후 이미지 생성 템플릿 생성에서 자신의 이미지를 제외할 수도 있습니다.
결론
DALL-E 3는 이미지-텍스트 생성 및 시각적 커뮤니케이션의 획기적인 발전을 의미합니다. ChatGPT와의 기본 통합을 통해 고품질의 맞춤형 시각적 콘텐츠 제작을 간소화할 수 있습니다. 그러나 특히 유해하거나 오해의 소지가 있는 콘텐츠의 방지와 관련하여 이 기술의 윤리적이고 책임감 있는 사용을 지속적으로 평가하는 것이 중요합니다.
보안과 크리에이티브 제어에 대한 관심이 높아지면서 DALL-E 3는 기업, 아티스트, 디지털 커뮤니케이션을 위한 강력한 리소스로서 온라인 시각적 경험을 향상시키고 풍부하게 만들 수 있는 잠재력을 지니고 있습니다. 이 혁신이 어떻게 진화하고 끊임없이 변화하는 사회에 통합될지 지켜볼 필요가 있습니다.