

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 소스 동기화
<a name="kb-managed-sync"></a>

지식 기반을 만든 후에는 데이터를 수집하거나 동기화하여 데이터를 쿼리할 수 있습니다. 수집은 데이터 소스의 원시 데이터를 벡터 임베딩으로 변환합니다.

수집을 시작하기 전에 데이터 소스가 다음 조건을 충족하는지 확인합니다.
+ 데이터 소스에 대한 연결 정보를 구성했습니다. [데이터 소스 연결을 참조하세요](kb-managed-connect-ds.md). 지식 기반을 만드는 과정에서 데이터 소스를 구성하게 됩니다.
+ 선택한 벡터 임베딩 모델을 구성했습니다. [지원되는 벡터 임베딩 모델을 참조하세요](kb-managed-create.md#kb-managed-embedding-models). 지식 기반을 만드는 과정에서 벡터 임베딩을 구성하게 됩니다.
+ 파일이 지원되는 형식입니다. 자세한 내용은 [지원되는 문서 형식을 참조하세요](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base-ds.html#kb-ds-supported-doc-formats-limits).
+ 파일은 AWS 일반 참조의 [서비스 할당량](kb-managed-quotas.md) 및 할당량에 지정된 **수집 작업 파일 크기를** 초과하지 않습니다.

데이터 소스에서 파일을 추가, 수정 또는 제거할 때마다 데이터 소스를 동기화하여 지식 기반에 다시 인덱싱해야 합니다. 동기화는 증분적으로 이루어지므로 Amazon Bedrock은 마지막 동기화 이후에 추가, 수정 또는 삭제된 문서만 처리합니다.

데이터를 지식 기반에 수집하고 최신 데이터와 동기화하는 방법을 알아보려면 원하는 방법에 해당하는 탭을 선택하고 다음 단계를 따릅니다.

------
#### [ Console ]

**데이터를 지식 기반에 수집하고 최신 데이터와 동기화하는 방법**

1. 에 로그인 AWS Management Console 하고 Amazon Bedrock AgentCore > **기본 제공 도구** > **지식 기반으로** 이동합니다.

1. 지식 기반을 선택합니다.

1. **데이터 소스** 섹션에서 **동기화**를 선택하여 데이터 수집 또는 최신 데이터 동기화를 시작합니다. 현재 진행 중인 데이터 소스 동기화를 중지하려면 **중지**를 선택합니다. 데이터 소스 동기화를 중지하려면 데이터 소스가 현재 동기화 중이어야 합니다. **동기화**를 다시 선택하여 나머지 데이터를 수집할 수 있습니다.

1. 데이터 수집이 완료되면 녹색 성공 배너가 나타납니다.

1. 데이터 소스를 선택하여 **동기화 기록**을 볼 수 있습니다. **경고 보기**를 선택하여 데이터 수집 작업이 실패한 이유를 확인합니다.

------
#### [ API ]

데이터를 지식 기반에 수집하고 최신 데이터와 동기화하려면 [Amazon Bedrock Agents 빌드 타임 엔드포인트](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)를 사용하여 [StartIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StartIngestionJob.html) 요청을 전송합니다. `knowledgeBaseId` 및 `dataSourceId`를 지정합니다. [StopIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_StopIngestionJob.html) 요청을 전송하여 현재 실행 중인 데이터 수집 작업을 중지할 수도 있습니다. `dataSourceId`, `ingestionJobId`, 및 `knowledgeBaseId`을 지정합니다. 데이터 수집을 중지하려면 데이터 수집 작업이 현재 실행 중이어야 합니다. 준비가 되면 `StartIngestionJob` 요청을 다시 보내 나머지 데이터를 수집할 수 있습니다.

[Amazon Bedrock Agents 빌드 타임 엔드포인트](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)를 사용하여 [GetIngestionJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_GetIngestionJob.html) 요청의 응답에서 반환된 `ingestionJobId`를 사용해 수집 작업의 상태를 추적합니다. 또한 `knowledgeBaseId` 및 `dataSourceId`를 지정합니다.
+ 수집 작업이 완료되면 응답의 `status`는 `COMPLETE`가 됩니다.
+ 응답의 `statistics` 객체는 데이터 소스의 문서 관련 수집 성공 여부에 대한 정보를 반환합니다.

또한 [Amazon Bedrock Agents 빌드 타임 엔드포인트](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#bra-bt)를 사용하여 [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html) 요청을 전송해 데이터 소스의 모든 수집 작업에 대한 정보를 볼 수 있습니다. 데이터가 수집되는 지식 기반의 `dataSourceId` 및 `knowledgeBaseId`를 지정합니다.
+ `filters` 객체에서 검색할 상태를 지정하여 결과를 필터링합니다.
+ 작업이 시작된 시각 또는 `sortBy` 객체를 지정하여 작업 상태를 기준으로 정렬합니다. 오름차순 또는 내림차순을 지정할 수 있습니다.
+ 응답으로 반환할 최대 결과 수를 `maxResults` 필드에 설정할 수 있습니다. 설정한 수보다 많은 결과가 있는 경우 응답에서 `nextToken`이 반환되며, 이를 또 다른 [ListIngestionJobs](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_ListIngestionJobs.html) 요청으로 전송하여 다음 작업 배치를 확인할 수 있습니다.

------