프로비저닝된 처리량 관리 - Amazon Bedrock

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

프로비저닝된 처리량 관리

프로비저닝된 처리량을 구매한 후에는 해당 처리량에 대한 세부 정보를 보거나 업데이트하거나 삭제할 수 있습니다.

프로비저닝된 처리량에 대한 정보 보기

구매한 프로비저닝된 처리량에 대한 정보를 보는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 단계를 따르세요.

Console
프로비저닝된 처리량에 대한 정보를 보려면
  1. 에 AWS Management Console로그인하고 https://console.aws.amazon.com/bedrock/ 에서 Amazon Bedrock 콘솔을 엽니다.

  2. 왼쪽 탐색 창의 평가 및 배포에서 프로비저닝된 처리량을 선택합니다.

  3. 프로비저닝된 처리량 섹션에서 프로비저닝된 처리량을 선택합니다.

  4. 프로비저닝된 처리량 개요 섹션에서 프로비저닝된 처리량에 대한 세부 정보를 확인하고 태그 섹션에서 프로비저닝된 처리량과 관련된 태그를 확인하십시오.

API

특정 프로비저닝된 처리량에 대한 정보를 검색하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 GetProvisionedModelThroughput요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내십시오. 프로비저닝된 처리량의 이름 또는 ARN을 로 지정합니다. provisionedModelId

계정의 모든 프로비저닝된 처리량에 대한 정보를 나열하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 ListProvisionedModelThroughputs요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내십시오. 반환되는 결과 수를 제어하기 위해 다음과 같은 선택적 파라미터를 지정할 수 있습니다.

필드 간단한 설명
maxResults 응답으로 반환할 최대 결과 수입니다.
nextToken maxResults필드에 지정한 수보다 많은 결과가 있는 경우 응답은 nextToken 값을 반환합니다. 다음 결과 배치를 보려면 다른 요청으로 nextToken 값을 보내십시오.

결과를 정렬하고 필터링하기 위해 지정할 수 있는 기타 선택적 매개 변수에 대한 내용은 을 참조하십시오 GetProvisionedModelThroughput.

에이전트의 모든 태그를 나열하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트와 함께 ListTagsForResource요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내고 프로비저닝된 처리량에 Amazon 리소스 이름 (ARN) 을 포함하십시오.

코드 예제를 참조하십시오.

프로비저닝된 처리량 편집

기존 프로비저닝된 처리량의 이름 또는 태그를 편집할 수 있습니다.

프로비저닝된 처리량과 관련된 모델을 변경할 때는 다음과 같은 제한이 적용됩니다.

  • 기본 모델과 연결된 프로비저닝된 처리량의 모델은 변경할 수 없습니다.

  • 프로비저닝된 처리량이 사용자 지정 모델과 연결된 경우 해당 모델을 사용자 지정한 기본 모델이나 동일한 기본 모델에서 파생된 다른 사용자 지정 모델과의 연결을 변경할 수 있습니다.

프로비저닝된 처리량이 업데이트되는 동안 최종 고객의 지속적인 트래픽을 방해하지 않고 프로비저닝된 처리량을 사용하여 추론을 실행할 수 있습니다. 프로비저닝된 처리량과 관련된 모델을 변경한 경우 업데이트가 완전히 배포될 때까지 이전 모델의 출력을 받을 수 있습니다.

프로비저닝된 처리량을 편집하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 단계를 따르세요.

Console
  1. 에 AWS Management Console로그인하고 https://console.aws.amazon.com/bedrock/ 에서 Amazon Bedrock 콘솔을 엽니다.

  2. 왼쪽 탐색 창의 평가 및 배포에서 프로비저닝된 처리량을 선택합니다.

  3. 프로비저닝된 처리량 섹션에서 프로비저닝된 처리량을 선택합니다.

  4. 편집을 선택합니다. 다음 필드를 편집할 수 있습니다.

    • 프로비저닝된 처리량 이름 - 프로비저닝된 처리량의 이름을 변경합니다.

    • 모델 선택 - 프로비저닝된 처리량이 사용자 지정 모델과 연결된 경우 관련 모델을 변경할 수 있습니다.

  5. 태그 섹션에서 프로비저닝된 처리량과 관련된 태그를 편집할 수 있습니다. 자세한 정보는 리소스 태깅을 참조하세요.

  6. 변경 내용을 저장하려면 편집사항 저장을 선택합니다.

  7. 콘솔에는 프로비저닝된 처리량 개요 페이지가 표시됩니다. 프로비저닝된 처리량 테이블의 프로비저닝된 처리량 상태는 업데이트 중으로 표시됩니다. 프로비저닝된 처리량 업데이트가 완료되면 상태가 서비스 중으로 바뀝니다. 업데이트가 실패하면 상태가 실패로 바뀝니다.

API

프로비저닝된 처리량을 편집하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UpdateProvisionedModelThroughput요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내십시오.

다음 표는 파라미터와 요청 본문을 간략하게 설명합니다 (자세한 정보 및 요청 구조는 요청 구문 참조). UpdateProvisionedModelThroughput

변수 필수? 사용 사례
provisionedModelId 업데이트할 프로비저닝된 처리량의 이름 또는 ARN을 지정하려면
desiredModelId 아니요 프로비저닝된 처리량과 연결할 새 모델을 지정합니다 (기본 모델과 연결된 프로비저닝된 처리량에는 사용할 수 없음).
desiredProvisionedModel이름 아니요 프로비저닝된 처리량의 새 이름을 지정하려면

작업이 성공하면 응답은 HTTP 200 상태 응답을 반환합니다. 프로비저닝된 처리량을 언제 사용할 수 있는지 확인하려면 GetProvisionedModelThroughput요청을 보내고 상태가 인지 확인하십시오. InService 상태일 때는 프로비저닝된 처리량을 업데이트하거나 삭제할 수 없습니다. Updating 업데이트가 실패하면 상태가 으로 표시되고 Failed GetProvisionedModelThroughput응답에는 a가 포함됩니다. failureMessage

프로비저닝된 처리량에 태그를 추가하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 TagResource요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내고 프로비저닝된 처리량에 Amazon 리소스 이름 (ARN) 을 포함하십시오. 요청 본문에는 각 태그에 지정하는 키-값 쌍이 포함된 객체인 tags 필드가 포함되어 있습니다.

프로비저닝된 처리량에서 태그를 제거하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 UntagResource요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내고 프로비저닝된 처리량에 Amazon 리소스 이름 (ARN) 을 포함하십시오. tagKeys요청 파라미터는 제거하려는 태그의 키가 포함된 목록입니다.

코드 예제를 참조하십시오.

프로비저닝된 처리량 삭제

프로비저닝된 처리량을 삭제하는 방법을 알아보려면 선택한 방법에 해당하는 탭을 선택하고 단계를 따르세요.

참고

약정 기간이 완료되기 전에는 약정이 포함된 프로비저닝된 처리량을 삭제할 수 없습니다.

Console
  1. 에 AWS Management Console로그인하고 https://console.aws.amazon.com/bedrock/ 에서 Amazon Bedrock 콘솔을 엽니다.

  2. 왼쪽 탐색 창의 평가 및 배포에서 프로비저닝된 처리량을 선택합니다.

  3. 프로비저닝된 처리량 섹션에서 프로비저닝된 처리량을 선택합니다.

  4. 삭제를 선택합니다.

  5. 콘솔에는 삭제가 영구적임을 경고하는 양식 양식이 표시됩니다. 계속 진행하려면 확인을 선택합니다.

  6. 프로비저닝된 처리량은 즉시 삭제됩니다.

API

프로비저닝된 처리량을 삭제하려면 Amazon Bedrock 컨트롤 플레인 엔드포인트를 사용하여 DeleteProvisionedModelThroughput요청 (요청 및 응답 형식과 필드 세부 정보는 링크 참조) 을 보내십시오. 프로비저닝된 처리량의 이름 또는 ARN을 로 지정합니다. provisionedModelId 삭제에 성공하면 응답은 HTTP 200 상태 코드를 반환합니다.

코드 예제를 참조하십시오.