기술적 큐 샷 감지 Amazon Rekognition Video 세그먼트 탐지 API 정보

저장된 비디오에서 비디오 세그먼트 감지

Amazon Rekognition Video는 블랙 프레임 및 엔드 크레딧과 같은 유용한 비디오 세그먼트를 식별하는 API를 제공합니다.

시청자들은 그 어느 때보다 많은 콘텐츠를 보고 있습니다. 특히 OTT(Over-The-Top) 및 VOD(온디맨드 비디오) 플랫폼을 통해 언제 어디서나 어떤 화면에서든 다양한 콘텐츠를 선택할 수 있습니다. 콘텐츠의 양이 급증하면서 미디어 기업들은 콘텐츠를 준비하고 관리하는 데 어려움을 겪고 있습니다. 콘텐츠 준비와 관리는 고품질의 시청 환경을 제공하고 더 나은 콘텐츠로 수익을 창출하는 데 매우 중요합니다. 오늘날 기업은 관련 교육을 이수한 대규모 인력 팀을 통해 다음과 같은 태스크를 수행하고 있습니다.

콘텐츠 내에서 오프닝 및 엔딩 크레딧 위치 찾기
광고를 삽입할 적절한 지점 선택(예: 무음 블랙 프레임 시퀀스)
더 나은 인덱싱을 위해 비디오를 작은 클립으로 분할

이러한 수작업 프로세스는 비용이 많이 들고 속도가 느릴 뿐만 아니라 매일 아카이브에서 생성, 라이선싱 및 검색되는 콘텐츠 양에 맞추어 규모를 조정할 수 없습니다.

Amazon Rekognition Video를 사용하면 기계 학습(ML)으로 구동되는 완전 관리형 전용 비디오 세그먼트 탐지 API를 사용하여 운영 미디어 분석 작업을 자동화할 수 있습니다. Amazon Rekognition Video 세그먼트 API를 사용하면 대량의 비디오를 손쉽게 분석하고 블랙 프레임이나 샷 전환 등의 마커를 감지할 수 있습니다. 각 감지에 대해 SMPTE(Society of Motion Picture and Television Engineers) 타임코드, 타임스탬프 및 프레임 번호가 생성됩니다. ML 경험은 필요하지 않습니다.

Amazon Rekognition Video는 Amazon Simple Storage Service(S3) 버킷에 저장된 동영상을 분석합니다. 반환되는 SMPTE 타임코드는 프레임 단위의 정밀성을 갖추고 있습니다. Amazon Rekognition Video는 감지된 비디오 세그먼트의 정확한 프레임 번호를 제공하고 다양한 비디오 프레임 속도 형식을 자동으로 처리합니다. Amazon Rekognition Video에서 정확한 프레임 정보를 갖춘 메타데이터를 사용하면 특정 태스크를 완전히 자동화할 수도 있고, 숙련된 인간 작업자의 검토 워크로드를 현저히 줄여 보다 창의적인 작업에 집중할 수 있게 지원합니다. 이를 통해 클라우드에서 콘텐츠 준비, 광고 삽입, 콘텐츠에 '몰아보기 마커' 추가 등의 태스크를 대규모로 수행할 수 있습니다.

요금에 대한 자세한 내용은 Amazon Rekognition 요금을 참조하세요.

Amazon Rekognition Video 세그먼트 감지는 두 가지 유형의 세그멘테이션 작업, 즉 기술적 큐 감지 및 샷 감지을 지원합니다.

주제

기술적 큐

기술적 큐는 비디오에서 블랙 프레임, 색상 막대, 오프닝 크레딧, 엔딩 크레딧, 스튜디오 로고, 기본 프로그램 콘텐츠를 식별합니다.

블랙 프레임

광고를 삽입하거나 장면 또는 오프닝 크레딧과 같은 프로그램 세그먼트의 끝을 표시하기 위한 신호로 사용되는 오디오가 없는 빈 블랙 프레임이 비디오에 포함된 경우가 많습니다. Amazon Rekognition Video를 사용하면 블랙 프레임 시퀀스를 감지하여 광고 삽입을 자동화하고, VOD 콘텐츠를 패키징하고, 다양한 프로그램 세그먼트나 장면을 구분할 수 있습니다. 페이드 아웃이나 음성 해설 등의 오디오가 있는 블랙 프레임은 콘텐츠로 간주되어 반환되지 않습니다.

크레딧

Amazon Rekognition Video는 영화 또는 TV 프로그램에서 오프닝 및 엔딩 크레딧이 시작하고 끝나는 정확한 프레임을 자동으로 식별할 수 있습니다. 이 정보를 사용하여 VOD(비디오 온 디맨드) 애플리케이션의 비디오 내에 '다음 에피소드' 또는 '인트로 건너뛰기'와 같은 '몰아보기 마커' 또는 대화형 시청자 프롬프트를 생성할 수 있습니다. 비디오 내 프로그램 콘텐츠의 첫 번째 프레임과 마지막 프레임도 감지할 수 있습니다. Amazon Rekognition Video는 간단한 롤링 크레딧부터 콘텐츠와 함께 제공되는 더 까다로운 크레딧에 이르기까지 다양한 오프닝 및 엔딩 크레딧 스타일을 처리하도록 훈련되었습니다.

색상 막대

Amazon Rekognition Video를 사용하면 브로드캐스트 모니터, 프로그램 및 카메라에서 색상이 올바르게 보정되도록 특정 패턴으로 표시되는 색상 세트인 SMPTE 색상 막대를 표시하는 비디오 섹션을 감지할 수 있습니다. SMPTE 색상 막대에 대한 자세한 내용은 SMPTE 색상 막대를 참조하십시오. 이 메타데이터는 콘텐츠에서 색상 막대 세그먼트를 제거하여 VOD 애플리케이션용 콘텐츠를 준비하거나 색상 막대가 콘텐츠 대신 기본 신호로 계속 표시될 때 녹화에서 브로드캐스트 신호 손실과 같은 문제를 감지하는 데 유용합니다.

슬레이트

슬레이트는 일반적으로 시작 부분에 가까운 비디오 섹션으로, 에피소드, 스튜디오, 비디오 형식, 오디오 채널 등에 대한 텍스트 메타데이터를 포함합니다. Amazon Rekognition Video는 슬레이트의 시작과 끝을 식별할 수 있으므로 텍스트 메타데이터를 사용하거나 최종 시청을 위해 콘텐츠를 준비할 때 슬레이트를 제거하는 것이 쉽습니다.

스튜디오 로고

스튜디오 로고는 프로그램 제작에 참여한 프로덕션 스튜디오의 로고나 엠블럼을 보여주는 시퀀스입니다. Amazon Rekognition Video는 사용자가 검토를 통해 스튜디오를 식별할 수 있도록 이런 시퀀스를 감지합니다.

내용

콘텐츠는 TV 프로그램 또는 영화에서 프로그램 또는 관련 요소가 포함된 부분입니다. 블랙 프레임, 크레딧, 색상 막대, 슬레이트, 스튜디오 로고는 콘텐츠로 간주되지 않습니다. Amazon Rekognition Video는 비디오에 있는 각 콘텐츠 세그먼트의 시작과 끝을 감지할 수 있으므로 사용자가 프로그램의 런타임 또는 특정 세그먼트를 찾을 수 있습니다.

콘텐츠 세그먼트는 다음이 포함되지만 이에 제한되지는 않습니다.

두 개의 광고 시간 사이에 들어가는 프로그램 장면
비디오 시작 부분에 나오는 이전 에피소드의 간단한 요약
크레딧 뒤에 나오는 보너스 콘텐츠
‘텍스트가 없는’ 콘텐츠, 예를 들어 원래는 오버레이된 텍스트가 있었지만 다른 언어로 번역을 지원하기 위해 텍스트가 제거되어 있는 모든 프로그램 장면의 집합

Amazon Rekognition Video에서 모든 콘텐츠 세그먼트 탐지를 완료한 후에는 도메인 지식을 적용하거나 사람이 검토할 수 있도록 보내서 각 세그먼트를 추가로 분류할 수 있습니다. 예를 들어 사용자의 비디오가 항상 지난 에피소드 요약으로 시작한다면 첫 번째 콘텐츠 세그먼트를 요약으로 분류할 수 있습니다.

다음 다이어그램은 프로그램 또는 영화 타임라인의 기술적 큐 세그먼트를 보여 줍니다. 색상 막대와 오프닝 크레딧, 요약 및 메인 프로그램과 같은 콘텐츠 세그먼트, 동영상 전체의 검은색 프레임, 최종 크레딧이 있는 것을 확인하세요.

색상 막대, 요약 세그먼트, 프로그램 콘텐츠 세그먼트 2개, 쇼 또는 영화 타임라인을 나타내는 검은색 프레임.

샷 감지

샷은 하나의 카메라로 연속 촬영한 서로 연결된 일련의 사진으로 시간과 공간에서 연속적인 동작을 나타냅니다. Amazon Rekognition Video를 사용하면 각 샷의 시작, 종료 및 재생 시간을 감지할 수 있을 뿐만 아니라 콘텐츠의 모든 샷을 셀 수 있습니다. 다음과 같은 태스크에 샷 메타데이터를 사용할 수 있습니다.

선택한 샷을 사용하여 프로모션 비디오 생성
샷 중간에 누군가가 말을 할 때와 같이 시청자의 경험을 방해하지 않는 위치에 광고 삽입
샷 간의 전환 콘텐츠를 방지하는 미리 보기 썸네일 세트 생성

샷 감지는 다른 카메라로의 확실한 전환이 있는 정확한 프레임에 표시됩니다. 한 카메라에서 다른 카메라로 부드럽게 전환되는 경우 Amazon Rekognition Video는 해당 전환을 생략합니다. 이를 통해 샷 시작 및 종료 시간에 실제 콘텐츠가 없는 섹션이 포함되지 않습니다.

다음 다이어그램은 필름 스트립의 샷 감지 세그먼트를 보여줍니다. 각 샷은 한 카메라 각도 또는 위치에서 다음 각도 또는 위치로 전환하는 것을 통해 식별됩니다.

도시 거리, 자동차 대시보드, 숲길, 어린이, 새끼 병아리, 사진작가 실루엣이 있는 일몰 호수를 보여주는 7개 번호가 매겨진 사진.

Amazon Rekognition Video 세그먼트 탐지 API 정보

저장된 비디오를 세그먼트화하려면 비동기 StartSegmentDetection 및 GetSegmentDetection API 작업을 사용하여 세그먼테이션 작업을 시작하고 결과를 가져옵니다. 세그먼트 감지 기능은 Amazon S3 버킷에 저장된 비디오를 받아 JSON 출력을 반환합니다. StartSegmentdetection API 요청을 구성하여 기술적 큐만, 샷 전환만 또는 둘 다를 감지하도록 선택할 수 있습니다. 최소 예측 신뢰도에 대한 임계값을 설정하여 감지된 세그먼트를 필터링할 수도 있습니다. 자세한 내용은 Amazon Rekognition Segment API 사용 단원을 참조하십시오. 예제 코드는 예제: 저장된 비디오에서 세그먼트 감지 항목을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

저장된 비디오에서 텍스트 감지

Amazon Rekognition Segment API 사용