Google, 무료로 사용할 수 있는 강력한 AI 이미지 생성기 출시

게시 됨: 2024-08-23

시각적 콘텐츠가 디지털 환경을 지배하는 시대에 이미지 생성을 위한 강력하고 접근 가능한 도구에 대한 수요가 급증했습니다. 소셜 미디어 게시물부터 전문적인 프레젠테이션에 이르기까지 독특하고 시각적으로 매력적인 이미지를 만드는 능력은 더 이상 사치가 아니라 필수입니다.

이러한 추세를 인식한 Google은 현재 미국에서 무료로 사용할 수 있는 최첨단 AI 이미지 생성기인 Imagen 3를 출시하여 게임을 강화했습니다. 이러한 발전은 단지 창작자들의 승리가 아니라 AI 기술의 민주화에 있어 중요한 도약입니다.

Imagen 3는 지난 5월 Google의 I/O 기조연설에서 처음으로 세상에 소개되었습니다. 하지만 Google이 이 도구에 대한 포괄적인 연구 논문을 발표하고 나서야 회사의 AI Test Kitchen 서비스를 통해 널리 접근할 수 있게 되었습니다. 이러한 움직임은 아마추어 및 전문 콘텐츠 제작자 모두에게 새로운 가능성의 영역을 열어 업계 최고 수준의 정교한 도구를 제공합니다.

Imagen 3의 핵심 기능은 시중의 다른 AI 이미지 생성기와 매우 유사합니다. 사용자가 텍스트 프롬프트를 입력하면 약 30초 내에 제공된 설명을 기반으로 일련의 이미지가 구현됩니다. Google은 Imagen 3가 "평가 당시 다른 최첨단 모델보다 선호된다"고 자랑스럽게 밝혔으며 초기 리뷰는 이러한 주장을 뒷받침하는 것으로 보입니다.

AI 이미지 생성 세계의 판도를 바꾸는 요소

Imagen 3가 경쟁사와 다른 점은 무엇입니까? PetaPixel이 실시한 테스트에서 이 도구는 Midjourney 및 OpenAI의 DALL-E와 같은 인기 플랫폼에서 생성된 이미지에 필적하는 고품질 이미지를 생성하는 놀라운 능력을 보여주었습니다. Imagen 3가 현재 무료로 사용할 수 있다는 사실은 이러한 대안에 비해 상당한 우위를 제공하여 대중이 고급 이미지 생성 기술에 더 쉽게 접근할 수 있게 해줍니다.

관련 기사
  • 우정의 역동성을 발견하기 위한 Snapchat Planets 가이드
    Snapchat 행성 탐색: 우정의 역학 발견
  • 11가지 iOS 에뮬레이터: Mac과 Windows에서 게임과 앱 실행
    11가지 iOS 에뮬레이터: Mac과 Windows에서 게임과 앱 실행

Google은 Imagen 3를 "최고 품질의 텍스트-이미지 모델" 로 선전하여 이전 제품에 비해 몇 가지 주요 개선 사항을 강조했습니다. 회사에 따르면 최신 버전은 이전 모델보다 더 세밀하고, 더 풍부한 조명과, 방해가 되는 아티팩트가 적은 이미지를 생성할 수 있다고 합니다.

이러한 향상된 기능은 복잡한 프롬프트를 해석하고 정확하게 렌더링하는 모델의 능력에서 특히 두드러지며, 이는 특정 시각적 스타일이나 복잡한 세부 사항이 포함된 이미지를 생성하려는 사용자에게 필수적인 기능입니다.

예를 들어 Imagen 3에서 생성된 테스트 이미지 중 하나는 눈표범의 얼굴을 클로즈업한 이미지입니다. 이 이미지는 밝은 색 털에 대한 동물의 복잡한 검은색 무늬와 연한 녹색 눈이 보는 사람을 뚫어지게 바라보고 있는 모습을 포착합니다. 눈표범의 얼굴을 강조하기 위해 세부 묘사 수준과 배경을 예술적으로 흐리게 처리하는 방식은 도구의 고급 기능을 보여줍니다.

Imagen 3에 눈표범 클로즈업을 요청합니다.
Imagen 3에 눈표범 클로즈업을 요청하고 있습니다.

또 다른 테스트 이미지에는 파란색 양복 재킷 아래 흰색 셔츠를 입은 짧은 곱슬머리의 남자가 카메라를 향해 웃고 있는 모습이 담겨 있다. 야외 도시 환경을 암시하는 흐릿한 배경은 실제 사진으로 쉽게 착각할 수 있는 실제와 같은 인물 사진을 만드는 모델의 숙련도를 강조합니다.

전문적인 얼굴 사진을 만들어 달라고 요청합니다.
전문적인 얼굴 사진을 만들어달라고 요청하고 있습니다.

이해와 정확성의 한 단계 발전

Imagen 3의 가장 눈에 띄는 개선 사항 중 하나는 프롬프트를 이해하고 처리하는 능력이 향상되었다는 점입니다. Google은 자세한 설명을 해석하는 모델의 용량을 대폭 업그레이드하여 다양한 시각적 스타일을 생성하고 더 길고 복잡한 프롬프트에서 미세한 세부정보를 정확하게 캡처할 수 있도록 했습니다.

이러한 발전은 창의적인 프로젝트, 마케팅 자료 또는 교육 목적 등 이미지의 높은 정밀도를 요구하는 사용자에게 매우 중요합니다.

예를 들어, Imagen 3에서 생성된 고요한 흑백 풍경 사진은 숲이 우거진 지역을 흐르는 구불구불한 강과 부분적으로 흐린 하늘을 배경으로 우뚝 솟은 눈 덮인 산의 범위를 담고 있습니다. 이미지의 구성과 디테일에 대한 관심은 자연 장면에 대한 모델의 정교한 이해와 시청자의 공감을 불러일으키는 시각적으로 인상적인 이미지를 만드는 능력을 나타냅니다.

고요한 흑백풍경사진을 부탁해 -01

고요한 흑백풍경사진을 부탁해 -02

그러나 많은 장점에도 불구하고 Imagen 3 개발의 일부 측면은 여전히 ​​수수께끼에 싸여 있습니다. Google은 모델 학습에 사용되는 특정 데이터에 대해 비교적 입을 다물고 있습니다. 도구 출시와 함께 제공되는 연구 논문에서는 Imagen 3가 "이미지, 텍스트 및 관련 주석으로 구성된 대규모 데이터 세트" 에 대해 훈련되었다고 언급하지만 그 이상의 세부 정보는 거의 제공하지 않습니다.

이러한 투명성 부족으로 인해 데이터세트에 AI 커뮤니티의 공통 관심사인 저작권 보호 이미지가 상당수 포함될 수 있다는 추측이 나왔습니다.

이미지 생성을 넘어서: 인페인팅의 힘

Imagen 3는 처음부터 이미지를 생성하는 것 외에도 사용자에게 인페인팅이라는 기술을 사용하여 기존 이미지를 편집할 수 있는 기능을 제공합니다. AI 이미지 편집 영역에서 점점 대중화되고 있는 이 방법을 사용하면 사용자가 이미지의 일부를 선택하고 새로운 프롬프트에 따라 수정할 수 있습니다.

예를 들어, 사용자가 피사체의 옷 색상을 변경하거나 풍경에 새 요소를 추가하려는 경우 몇 번의 키 입력만으로 이를 수행할 수 있습니다.

인페인팅 기능은 Imagen 3의 다용성을 크게 향상시켜 새로운 이미지를 만드는 것뿐만 아니라 기존 이미지를 개선하고 개선하는 데에도 유용한 도구가 됩니다. 이 기능은 처음부터 시작하지 않고도 이미지를 빠르게 조정해야 하는 디자이너, 마케팅 담당자 및 콘텐츠 제작자에게 새로운 가능성을 열어줍니다.

그러나 많은 AI 도구와 마찬가지로 Imagen 3에도 특정 제한 사항이 있다는 점에 유의하는 것이 중요합니다. Google은 논란의 여지가 있거나 잠재적으로 유해한 이미지가 생성되는 것을 방지하기 위한 보호 장치를 구현했습니다. 예를 들어, PetaPixel이 "카말라 해리스(Kamala Harris)와 도널드 트럼프(Donald Trump)가 손을 잡고 있는" 이미지를 생성하려고 시도했을 때 요청이 거부되었습니다. 마찬가지로 유명 예술가나 저작권이 있는 작품의 스타일로 이미지를 만들려는 시도도 저항에 부딪혔습니다.

그러나 대부분의 기술과 마찬가지로 사용자는 이러한 제한 사항을 해결하는 방법을 찾았습니다. 프롬프트를 조정하면 모델의 제한 사항을 실행하지 않고도 원하는 결과와 매우 유사한 결과를 얻을 수 있는 경우가 많습니다. 예를 들어, Imagen 3 에 "1942년 와이오밍 주 그랜드 티턴 국립공원에서 촬영한 극적인 흑백 사진을 만들어 보세요" 라고 요청하면 사용자는 Ansel Adams의 상징적인 사진을 연상시키는 이미지를 생성할 수 있습니다.

The Verge는 "들판에서 달리는 만화 같은 파란색 고슴도치 이미지"를 요청하여 유사한 해결 방법을 시연했습니다. 결과 이미지는 Sonic the Hedgehog와 매우 유사하여 사용자가 저작권 제한을 직접 위반하지 않고 창의적으로 우회할 수 있는 방법을 보여줍니다.

도전과 논쟁

Imagen 3는 대체로 호평을 받았지만 논란이 없지는 않았습니다. 올해 초 Google은 Gemini의 AI 이미지 생성기가 편견을 과도하게 수정하여 특정 생성 이미지에서 백인을 삭제했다는 비난을 받은 후 반발에 직면했습니다. 이 사건은 특히 표현과 편견과 관련하여 이미지 생성에서 AI의 윤리적 영향에 대한 광범위한 대화를 촉발시켰습니다.

이러한 항의에 대응하여 Google은 Gemini에서 이미지 생성기를 제거하여 자사가 개발하는 기술에 대해 책임을 지겠다는 회사의 의지를 보여주었습니다. Gemini를 둘러싼 논란은 Imagen 3과 같은 AI 도구 개발에 있어 지속적인 경계와 윤리적 고려의 중요성을 강조합니다.

이러한 기술이 더욱 발전하고 널리 사용됨에 따라 의도하지 않은 결과가 발생할 가능성이 커지므로 기업에서는 투명성, 공정성 및 책임을 우선시하는 것이 필수적입니다.

Imagen 3에 액세스하는 방법

Imagen 3의 기능을 탐색하는 데 관심이 있는 사람들의 경우 도구에 액세스하는 것은 비교적 간단합니다. 미국 사용자는 DeepMind 웹사이트를 방문하고 AI Test Kitchen 서비스로 이동하여 이미지 생성기를 시험해 볼 수 있습니다. 여기에서 학생들은 다양한 프롬프트를 실험하고, 인페인팅 기능을 테스트하고, Google의 최신 AI 혁신의 힘을 직접 경험할 수 있습니다.

최종 생각

결론적으로, Google의 Imagen 3 출시는 AI 기반 이미지 생성의 진화에 중요한 이정표를 세웠습니다. Google은 시중 최고의 모델과 경쟁할 수 있는 고품질 도구를 무료로 제공함으로써 AI 분야를 발전시킬 뿐만 아니라 더 많은 사람들이 AI에 더 쉽게 접근할 수 있도록 만들고 있습니다.

기술이 계속 발전함에 따라 Imagen 3 및 유사한 도구에서 훨씬 더 인상적인 기능을 볼 수 있으며 인간의 창의성과 기계 학습 사이의 경계가 더욱 모호해질 것으로 예상됩니다.

전문 디자이너이든, 일반 콘텐츠 제작자이든, 아니면 단순히 AI의 최신 발전에 대해 궁금한 사람이든 Imagen 3는 살펴볼 가치가 있는 도구입니다. 성능, 정밀도 및 접근성이 결합되어 오늘날의 창작자들이 사용할 수 있는 디지털 도구의 증가하는 무기고에 귀중한 추가 기능을 제공합니다. 그럼 왜 기다려? AI가 생성한 이미지의 세계에 뛰어들어 Google의 Imagen 3로 무엇을 만들 수 있는지 알아보세요.