paint-brush
CodeFormer를 사용하여 AI가 생성한 괴물을 인간으로 전환~에 의해@mikeyoung44
4,734 판독값
4,734 판독값

CodeFormer를 사용하여 AI가 생성한 괴물을 인간으로 전환

~에 의해 Mike Young5m2023/04/12
Read on Terminal Reader
Read this story w/o Javascript

너무 오래; 읽다

CodeFormer는 오래된 사진과 AI 생성 얼굴 모두에서 작동하도록 설계된 강력한 얼굴 복원 알고리즘입니다. Nvidia T4 GPU 하드웨어에서 평균 실행 시간은 10초이며 실행당 비용은 0.0055달러인 Image-to-Image 모델입니다. CodeFormer의 기본 기술은 Transformer 기반 예측 네트워크를 기반으로 합니다.

People Mentioned

Mention Thumbnail
featured image - CodeFormer를 사용하여 AI가 생성한 괴물을 인간으로 전환
Mike Young HackerNoon profile picture
0-item

AI 이미지 복원의 세계를 직접 체험해 보는 여행

가끔 AI가 생성한 사진이 조금... 이상하게 나올 때도 있어요. 품질이 낮을 수도 있고, 이미지를 완벽하지 않게 만드는 이상한 아티팩트가 있을 수도 있습니다. 하지만 두려워하지 마세요! CodeFormer는 문제를 해결하고 해당 이미지를 즉시 수정할 수 있도록 도와줍니다. 이 가이드에서는 CodeFormer 모델을 소개하고, 작동 방식을 보여주고, 이를 사용하여 약간 뒤틀린 AI 생성 사진을 수정하는 방법을 설명합니다. 아래에 표시된 다른 AI 모델에서 얻은 이상한 이미지를 정리하는 데 사용한 정확한 단계를 안내해 드리겠습니다.


이 친구는 무섭고 무섭게 생겼어요. Arcane-Diffusion의 원본 세대입니다.


본 이미지는 에서 퍼왔습니다 비전확산 다른 블로그 게시물에 사용했던 모델입니다. 제가 따라한 것과 동일한 작업 흐름을 사용하여 생성된 이미지를 정리하고 더 보기 좋게 확대하는 방법을 보여 드리겠습니다. Replicate Python SDK를 사용하여 이 연습을 수행할 예정이지만 지원되는 다른 언어도 많이 있습니다. 복제 시 .


이 가이드에서는 다음을 사용하는 방법도 보여 드리겠습니다. 코덱스 복제 유사한 모델을 찾고 어떤 모델이 마음에 드는지 결정합니다. Replicate Codex는 AI 모델을 검색, 필터링, 정렬 및 비교하고 AI 프로젝트에 적합한 모델을 찾을 수 있는 무료 커뮤니티 도구입니다.


CodeFormer는 Replicate Codex에서 가장 인기 있는 모델 중 하나입니다.


CodeFormer는 Replicate Codex에서 6위를 차지했습니다. 8백만 회 이상 실행될 정도로 매우 인기가 높습니다. 따라서 커뮤니티가 이 도구를 정말 좋아한다고 해도 과언이 아닙니다. 이는 여러분도 이 도구를 사용하고 싶어할 수도 있다는 뜻입니다!

CodeFormer 소개

CodeFormer, 작성자: 슈저우 는 오래된 사진과 AI가 생성한 얼굴 모두에서 작동하도록 설계된 강력한 얼굴 복원 알고리즘입니다. Nvidia T4 GPU 하드웨어에서 평균 실행 시간은 10초이며 실행당 비용은 0.0055달러인 Image-to-Image 모델입니다.


CodeFormer의 기본 기술은 코드 예측을 위한 글로벌 구성과 컨텍스트를 모델링하는 Transformer 기반 예측 네트워크를 기반으로 합니다. 이를 통해 모델은 입력이 심하게 저하된 경우에도 대상 면에 매우 가까운 자연스러운 면을 발견할 수 있습니다. 충실도와 품질 간의 유연한 균형을 가능하게 하는 제어 가능한 기능 변환 모듈도 포함되어 있습니다. CodeFormer의 작동 방식에 대해 자세히 알아볼 수 있습니다. Github에서 .

CodeFormer의 입력과 출력 이해

이 프로젝트 작업을 시작하기 전에 잠시 모델이 기대하는 입력과 출력을 이해해 보겠습니다.

입력

  1. image (file): 수정하려는 입력 이미지입니다.
  2. codeformer_fidelity (숫자): 품질(낮은 숫자)과 충실도(높은 숫자) 간의 균형입니다. 기본값: 0.5.
  3. background_enhance (boolean): Real-ESRGAN으로 배경 이미지를 강화할지 여부. 기본값: 거짓.
  4. face_upsample (부울): 고해상도 AI 생성 이미지에 대해 복원된 얼굴을 업샘플링할지 여부입니다. 기본값: 거짓.
  5. upscale (integer): 이미지의 최종 업샘플링 스케일입니다. 기본값: 2.

출력

모델의 출력은 고정된 이미지를 나타내는 URI 문자열입니다. 이는 JSON 개체이며 아래 형식과 같습니다.

 { "type": "string", "title": "Output", "format": "uri" }

이제 입력과 출력을 이해했으므로 CodeFormer를 사용하여 뒤틀린 AI 생성 사진을 수정하는 방법을 살펴보겠습니다.

CodeFormer 사용에 대한 단계별 가이드

코딩할 준비가 되지 않은 경우 UI를 통해 Replicate에서 CodeFormer의 "데모"와 직접 상호 작용할 수 있습니다. 당신은 할 수 있습니다 이 링크를 사용하세요 인터페이스와 직접 상호작용하고 사용해 보세요! 이는 모델의 매개변수를 가지고 놀면서 빠른 피드백과 검증을 얻을 수 있는 좋은 방법입니다.


좀 더 기술적이며 결국 CodeFormer 위에 멋진 도구를 구축하려는 경우 다음의 간단한 단계에 따라 Replicate의 모델을 사용하여 이미지를 복원하고 향상할 수 있습니다.

복제 계정과 API 키가 준비되어 있는지 확인하세요!

1단계: Python 클라이언트 설치

이것은 매우 쉽습니다:

 pip install replicate

2단계: API 토큰 설정

계정 탭의 복제에서 이를 얻을 수 있습니다.

 export REPLICATE_API_TOKEN=[token]

3단계: 모델 실행

Replicate Python SDK를 사용하여 이 작업을 수행하려면 몇 줄의 코드만 있으면 됩니다.


 import replicate output = replicate.run( "sczhou/codeformer:7de2ea26c616d5bf2245ad0d5e24f0ff9a6204578a5c876db53142edd9d2cd56", input={"image": open("path/to/file", "rb")} ) print(output)


이 단계에서는 replicate 라이브러리를 가져오고 run 함수를 호출하여 제공된 입력 이미지로 CodeFormer 모델을 실행합니다. 출력은 고정된 이미지를 나타내는 URI 문자열로 인쇄됩니다.


다음은 이 프로세스에서 얻은 출력 이미지로, 제가 시작한 끔찍한 입력과 대조됩니다. 정말 개선되었습니다!


와, 이게 훨씬 더 좋아 보이네요. CodeFormer를 사용한 전(왼쪽)과 후(오른쪽) 이미지.


더 나아가기 - Replicate Codex를 사용하여 다른 이미지 복원 모델 찾기

Replicate Codex는 이미지 생성, 이미지 간 변환 등 다양한 창의적 요구 사항을 충족하는 AI 모델을 발견할 수 있는 환상적인 리소스입니다. 이는 Replicate의 모든 모델에 대한 완전히 검색 가능하고 필터링 가능하며 태그가 지정된 데이터베이스이며 모델을 비교하고 가격별로 정렬하거나 작성자별로 탐색할 수도 있습니다. 무료이며, 새 모델이 출시되면 직접 사용해 볼 수 있도록 알려주는 다이제스트 이메일도 있습니다.


CodeFormer와 유사한 모델을 찾고 싶다면...

1단계: Replicate Codex 방문

다음으로 향하세요 코덱스 복제 유사한 모델 검색을 시작하세요.

2단계: 검색창 사용

페이지 상단의 검색창을 이용하면 '이미지 복원', '얼굴 보정', '초해상도' 등 특정 키워드로 모델을 검색할 수 있습니다. 검색어와 관련된 모델 목록이 표시됩니다.

3단계: 결과 필터링

검색 결과 페이지 오른쪽에는 모델 목록의 범위를 좁히는 데 도움이 되는 여러 필터가 있습니다. 유형(이미지-이미지, 텍스트-이미지 등), 비용, 인기도 또는 특정 제작자를 기준으로 모델을 필터링하고 정렬할 수 있습니다.


Replicate Codex에서 가장 인기 있는 복원 모델을 찾아보세요.


이러한 필터를 적용하면 특정 요구 사항과 선호도에 가장 적합한 모델을 찾을 수 있습니다. 예를 들어, 가장 인기 있는 이미지 복원 모델을 찾고 있는 경우 검색한 다음 실행 횟수별로 정렬하면 됩니다. 이 경우 오래된 사진을 복원하는 데에도 사용한 GFPGAN 모델을 찾을 수 있습니다. 내 글은 여기에 자세한 내용은. 아래에 GFPGAN의 복원 예시를 포함시켰으므로 이미지를 처리하는 방법도 이해할 수 있습니다.

GFPGAN 출력의 예 - 오래된 사진에서 더 잘 작동하는 것으로 나타났습니다.


결론

이 가이드에서는 CodeFormer 모델을 살펴보고 입력 및 출력에 대해 알아보고 이를 사용하여 뒤틀린 AI 생성 사진을 수정하는 방법을 시연했습니다. 또한 Replicate Codex의 검색 및 필터 기능을 활용하여 유사한 모델을 찾고 해당 출력을 비교하는 방법에 대해 논의하여 AI 기반 이미지 향상 및 복원 세계에서 시야를 넓힐 수 있었습니다.


이 가이드가 여러분이 AI의 창의적 가능성을 탐구하고 상상력을 실현하는 데 영감을 주었기를 바랍니다. 읽어 주셔서 감사합니다. Replicate Codex로 AI의 세계를 탐험하고 이미지를 향상시켜 보세요!


여기에도 게시됨