아마존 Titan Image Generator G1 모델

Titan Image Generator G1Amazon은 이미지 생성 모델입니다. 텍스트에서 이미지를 생성하고 사용자가 기존 이미지를 업로드 및 편집할 수 있습니다. 이 모델은 자연어 텍스트에서 이미지를 생성할 수 있으며 기존 이미지 또는 생성된 이미지를 편집하거나 변형을 생성하는 데에도 사용할 수 있습니다. 사용자는 마스크 없이 텍스트 프롬프트를 사용하여 이미지를 편집하거나 이미지 마스크를 사용하여 이미지의 일부를 편집할 수 있습니다. 아웃페인팅으로 이미지의 경계를 확장하고 인페인팅으로 이미지를 채울 수 있습니다. 또한 필요에 따라 텍스트 프롬프트를 기반으로 이미지의 변형을 생성할 수도 있습니다.

Amazon Titan Image Generator G1 모델은 제작자가 1~5개의 참조 이미지를 가져오고 새로운 컨텍스트에서 주어진 주제 이미지를 생성할 수 있는 즉각적인 사용자 지정을 지원합니다. 이 모델은 이미지의 주요 특성을 보존하고, 즉각적인 엔지니어링 없이 이미지 기반 스타일 전송을 수행하고, 미세 조정 없이 여러 참조 이미지에서 스타일 믹싱을 생성합니다.

책임감 있는 AI 사용에 대한 모범 사례를 지속적으로 지원하기 위해 Titan Foundation Models는 데이터에서 유해한 콘텐츠를 탐지 및 제거하고, 사용자 입력에서 부적절한 콘텐츠를 거부하고, 부적절한 콘텐츠 (예: 증오심 발언, 욕설, 폭력) 가 포함된 모델 출력을 필터링하도록 구축되었습니다. Titan 이미지 생성기 FM은 생성된 모든 이미지에 보이지 않는 워터마크를 추가합니다.

Amazon Bedrock 콘솔 (미리 보기) 의 워터마크 탐지 기능을 사용하거나 Amazon Bedrock 워터마크 탐지 API (미리 보기) 를 호출하여 이미지에 Titan Image Generator의 워터마크가 포함되어 있는지 확인할 수 있습니다.

아마존 Titan Image Generator G1 프롬프트 엔지니어링 가이드라인에 대한 자세한 내용은 Amazon Titan Image Generator G1 Prompt 엔지니어링 모범 사례를 참조하십시오.

모델 ID – amazon.titan-image-generator-v1
최대 입력 문자 - 512자
최대 입력 이미지 크기 - 5MB (일부 특정 해상도만 지원됨)
인/아웃 페인팅을 사용한 최대 이미지 크기 — 1,408 x 1,408픽셀
이미지 변형을 사용한 최대 이미지 크기 - 4,096x4,096픽셀
언어 - 영어
출력 유형 - 이미지
지원되는 이미지 유형 - JPEG, JPG, PNG
추론 유형 - 온디맨드, 프로비저닝된 처리량
지원되는 사용 사례 - 이미지 생성, 이미지 편집, 이미지 변형

특성

T ext-to-image (T2I) 생성 — 텍스트 프롬프트를 입력하고 새 이미지를 출력으로 생성합니다. 생성된 이미지는 텍스트 프롬프트에 설명된 개념을 캡처합니다.
T2I 모델 미세 조정 - 여러 이미지를 가져와서 나만의 스타일과 개인 맞춤으로 캡처한 다음 핵심 T2I 모델을 미세 조정합니다. 미세 조정된 모델은 특정 사용자의 스타일과 개인 맞춤을 준수하는 이미지를 생성합니다.
이미지 편집 옵션 - 인페인팅, 아웃페인팅, 변형 생성, 이미지 마스크를 사용하지 않는 자동 편집 등이 포함됩니다.
인페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 마스크 내의 영역을 재구성합니다. 인페인팅을 사용하면 마스크된 요소를 제거하고 배경 픽셀로 바꿀 수 있습니다.
아웃페인팅 - 사용자가 입력하거나 모델에서 추정한 이미지 및 분할 마스크를 입력으로 사용하고 영역을 매끄럽게 확장하는 새 픽셀을 생성합니다. 이미지를 경계선까지 확장할 때 마스크된 이미지의 픽셀을 보존하려면 정밀한 아웃페인팅을 사용합니다. 기본값 아웃페인팅을 사용하면 분할 설정에 따라 마스크된 이미지의 픽셀을 이미지 경계까지 확장할 수 있습니다.
이미지 변형 — 1~5개의 이미지와 선택적 프롬프트를 입력으로 사용합니다. 입력 이미지의 내용은 보존하지만 스타일과 배경이 달라지는 새 이미지를 생성합니다.

참고

미세 조정된 모델을 사용하는 경우 API 또는 모델의 인페인팅 또는 아웃페인팅 기능을 사용할 수 없습니다.

파라미터

Amazon 추론 Titan Image Generator G1 파라미터에 대한 자세한 내용은 Amazon Titan Image Generator G1 추론 파라미터를 참조하십시오.

미세 조정

Amazon Titan Image Generator G1 모델 미세 조정에 대한 자세한 내용은 다음 페이지를 참조하십시오.

Titan Image Generator G1미세 조정 및 가격 책정

이 모델은 다음 예제 공식을 사용하여 작업당 총 가격을 계산합니다.

총 가격 = 단계* Batch 크기 * 표시된 이미지당 가격

최소값 (자동):

최소 걸음 수 (자동) - 500
최소 배치 크기 - 8
기본 학습률 - 0.00001
표시된 이미지당 가격 - 0.005

하이퍼파라미터 설정 미세 조정

단계 — 모델이 각 배치에 노출되는 횟수. 기본 걸음 수 설정은 없습니다. 10~40,000 사이의 숫자 또는 “자동”의 문자열 값을 선택해야 합니다.

단계 설정 - 자동 — Amazon Bedrock은 교육 정보를 기반으로 적절한 값을 결정합니다. 교육 비용보다 모델 성능을 우선시하려면 이 옵션을 선택하십시오. 단계 수는 자동으로 결정됩니다. 이 수치는 데이터세트를 기준으로 일반적으로 1,000에서 8,000 사이입니다. 모델을 데이터에 노출하는 데 사용되는 단계 수는 작업 비용의 영향을 받습니다. 작업 비용 계산 방법을 이해하려면 가격 세부 정보의 요금 예제 섹션을 참조하십시오. (자동을 선택한 경우 걸음 수가 이미지 수와 어떻게 관련되는지 알아보려면 위의 예제 표를 참조하십시오.)

단계 설정 - 사용자 지정 — Bedrock에서 사용자 지정 모델을 훈련 데이터에 노출할 단계 수를 입력할 수 있습니다. 이 값은 10에서 40,000 사이일 수 있습니다. 더 낮은 스텝 카운트 값을 사용하면 모델에서 생성되는 이미지당 비용을 줄일 수 있습니다.

Batch size — 모델 매개변수가 업데이트되기 전에 처리된 샘플 수입니다. 이 값은 8에서 192 사이이며 8의 배수입니다.

학습률 — 각 학습 데이터 배치 이후 모델 매개변수가 업데이트되는 비율입니다. 이 값은 0과 1 사이의 부동 소수점 값입니다. 학습률은 기본적으로 0.00001로 설정됩니다.

미세 조정 절차에 대한 자세한 내용은 모델 사용자 지정 작업 제출을 참조하십시오.

출력

Titan Image Generator G1출력 이미지 크기와 품질을 사용하여 이미지 가격 책정 방식을 결정합니다. Titan Image Generator G1크기를 기준으로 두 개의 가격 세그먼트가 있습니다. 하나는 512*512 이미지용이고 다른 하나는 1024*1024 이미지용입니다. 가격은 이미지 높이*너비, 512*512 이하 또는 512*512 이상의 이미지 크기를 기준으로 책정됩니다.

Amazon 베드락 요금에 대한 자세한 내용은 Amazon 베드락 요금을 참조하십시오.

워터마크 감지

참고

Amazon Bedrock 콘솔 및 API용 워터마크 감지는 공개 프리뷰 릴리스에서 사용할 수 있으며, 이 버전에서는 생성된 워터마크만 탐지합니다. Titan Image Generator G1 이 기능은 현재 및 지역에서만 사용할 수 있습니다. us-west-2 us-east-1 워터마크 검출은 에서 생성된 워터마크를 매우 정확하게 탐지하는 것입니다. Titan Image Generator G1 원본 이미지에서 이미지를 수정하면 탐지 결과의 정확도가 떨어질 수 있습니다.

이 모델은 생성된 모든 이미지에 보이지 않는 워터마크를 추가하여 잘못된 정보의 확산을 줄이고 저작권 보호를 지원하며 콘텐츠 사용을 추적합니다. 워터마크 감지 기능을 사용하면 모델이 이미지를 생성했는지 여부를 확인할 수 있으며, Titan Image Generator G1 모델은 이 워터마크의 존재 여부를 확인합니다.

참고

워터마크 탐지 API는 프리뷰 중이며 변경될 수 있습니다. SDK를 사용할 가상 환경을 만드는 것이 좋습니다. 워터마크 탐지 API는 최신 SDK에서 사용할 수 없으므로 워터마크 탐지 API가 포함된 버전을 설치하기 전에 가상 환경에서 최신 버전의 SDK를 제거하는 것이 좋습니다.

이미지를 업로드하여 이미지에 워터마크가 있는지 감지할 수 있습니다. Titan Image Generator G1 콘솔을 사용하여 아래 단계에 따라 이 모델에서 워터마크를 감지할 수 있습니다.

워터마크를 감지하려면: Titan Image Generator G1

Amazon Bedrock 콘솔에서 Amazon Bedrock 콘솔을 엽니다.
Amazon Bedrock의 탐색 창에서 개요를 선택합니다. 빌드 및 테스트 탭을 선택합니다.
세이프가드 섹션에서 워터마크 탐지로 이동하여 워터마크 탐지 보기를 선택합니다.
이미지 업로드를 선택하고 JPG 또는 PNG 형식의 파일을 찾습니다. 허용되는 최대 파일 크기는 5MB입니다.
업로드되면 이름, 파일 크기, 마지막으로 수정한 날짜가 포함된 이미지 썸네일이 표시됩니다. 업로드 섹션에서 이미지를 삭제하거나 교체하려면 X를 선택합니다.
분석을 선택하여 워터마크 탐지 분석을 시작합니다.
결과 아래에서 이미지를 미리 볼 수 있으며, 워터마크가 감지되면 이미지 아래에 워터마크가 감지되고 이미지 전체에 배너가 표시됩니다. 워터마크가 감지되지 않으면 이미지 아래의 텍스트에 워터마크가 감지되지 않음으로 표시됩니다.
다음 이미지를 로드하려면 업로드 섹션의 이미지 썸네일에서 X를 선택하고 분석할 새 이미지를 선택합니다.

프롬프트 엔지니어링 지침

마스크 프롬프트 - 이 알고리즘은 픽셀을 개념으로 분류합니다. 사용자는 마스크 프롬프트의 해석에 따라 마스크할 이미지 영역을 분류하는 데 사용할 텍스트 프롬프트를 제공합니다. 프롬프트 옵션은 더 복잡한 프롬프트를 해석하고 마스크를 분할 알고리즘으로 인코딩할 수 있습니다.

이미지 마스크 - 이미지 마스크를 사용하여 마스크 값을 설정할 수도 있습니다. 이미지 마스크를 마스크의 프롬프트 입력과 결합하여 정확도를 향상시킬 수 있습니다. 이미지 마스크 파일은 다음 파라미터에 부합해야 합니다.

마스크 이미지의 마스크 이미지 값은 0(검은색) 또는 255(흰색)여야 합니다. 값이 0인 이미지 마스크 영역은 사용자 프롬프트 또는 입력 이미지의 이미지로 재생성됩니다.
maskImage 필드는 base64 인코딩 이미지 문자열이어야 합니다.
마스크 이미지는 입력 이미지와 크기가 같아야 합니다(높이와 너비가 동일).
입력 이미지와 마스크 이미지에는 PNG 또는 JPG 파일만 사용할 수 있습니다.
마스크 이미지는 흑백 픽셀 값만 사용해야 합니다.
마스크 이미지는 RGB 채널만 사용할 수 있습니다(알파 채널은 미지원).

Amazon Titan Image Generator G1 프롬프트 엔지니어링에 대한 자세한 내용은 Amazon Titan Image Generator G1 Prompt 엔지니어링 모범 사례를 참조하십시오.

일반적인 프롬프트 엔지니어링 지침은 프롬프트 엔지니어링 지침을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

Amazon Titan Multimodal Embeddings G1

아마존 베드락 스튜디오