생성형 AI 워크로드 평가 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

생성형 AI 워크로드 평가

Tabby Ward 및 Deepak Dixit, Amazon Web Services(AWS)

2024년 11월(문서 기록)

생성형 AI 워크로드 평가는 생성형 AI 워크로드를 생성하거나 업데이트하기 위한 조직의 준비 상태를 평가하고 개선하는 것을 목표로 하는 전략적 방법입니다. 생성형 AI를 비즈니스 운영에 통합하면 사물의 작동 방식이 크게 변화하고 새로운 효율성과 기능을 제공할 수 있으므로이 평가가 중요합니다. 그러나 생성형 AI를 성공적으로 채택하려면 현재 시스템을 철저히 이해하고 미래를 위한 명확한 계획을 세우는 것이 중요합니다.

생성형 AI 워크로드는 텍스트, 이미지, 코드 또는 기타 데이터 유형과 같은 새 콘텐츠를 생성할 수 있는 인공 지능 모델을 사용하는 컴퓨팅 작업을 말합니다. 이러한 워크로드에는 일반적으로 상당한 컴퓨팅 성능, GPUs와 같은 특수 하드웨어, 훈련 및 추론을 위한 대규모 데이터 세트가 필요합니다. 생성형 AI 워크로드를 작업에 통합하면 다음과 같은 몇 가지 문제가 발생합니다.

  • 인프라 요구 사항: 생성형 AI 모델에 필요한 중요한 컴퓨팅 리소스 및 특수 하드웨어 프로비저닝.

  • 데이터 관리: 대규모 데이터 세트를 처리하면서 데이터 품질, 개인 정보 보호 및 규정 준수를 보장합니다.

  • 기술 격차: AI 기술 및 모델 배포에 대한 전문 지식이 부족합니다.

  • 윤리적 고려 사항: AI 생성 콘텐츠의 편향, 공정성 및 투명성 해결.

  • 통합 복잡성: 생성형 AI를 기존 워크플로 및 레거시 시스템에 원활하게 통합합니다.

  • 비용 관리: 잠재적 이점과 높은 구현 및 운영 비용의 균형을 맞춥니다.

이러한 문제를 해결하려면 신중한 계획, 인프라 및 인재에 대한 투자, 구현에 대한 전략적 접근 방식이 필요합니다.

이 가이드의 목적

생성형 AI는 많은 산업에서 빠르게 중요한 구성 요소가 되고 있습니다. 이는 혁신적인 기회를 제공하지만 통합, 규정 준수 및 확장성 측면에서도 문제를 야기합니다. 많은 조직이 취약한 기술적 기반, 변화에 대한 저항, 데이터 품질 문제로 인해 AI를 완전히 활용하기 위해 노력하고 있습니다. 생성형 AI 워크로드 평가는 현대화 요구 사항을 식별하고, 구현 범위를 정의하고, 레거시 시스템과 사고에 도전하여 이러한 문제를 해결합니다. 또한 최소 실행 가능 제품(MVPs 결정하는 데 도움이 되며 대상 솔루션 아키텍처를 개발하여 AI 채택에 대한 구조화되고 전략적인 접근 방식을 보장하는 데 도움이 됩니다.

이 가이드는 조직이 생성형 AI 기술을 채택하는 복잡성을 탐색하는 데 도움이 되는 구조화된 접근 방식의 역할을 합니다. 이 가이드는 처음부터 요구 사항을 명확하게 정의하는 대신 다음을 지원합니다.

  • 조직 내 생성형 AI의 잠재적 사용 사례 식별.

  • 생성형 AI 채택에 대한 조직의 준비 상태 평가.

  • 사용 사례 목표 및 확장 목표를 정의하고 구체화합니다.

  • 생성형 AI 구현의 범위 및 요구 사항 결정.

  • 대상 솔루션 아키텍처 개발.

대상 고객 및 이점

이 평가는 생성형 AI 워크로드 현대화의 기술적 측면을 평가하려는 솔루션 아키텍트, 엔터프라이즈 아키텍트 및 애플리케이션 아키텍트를 위해 특별히 설계되었습니다. 또한 팀의 전반적인 준비 상태, 리소스 할당 및 활성화 요구 사항을 측정하려는 프로그램 및 인력 관리자에게도 유용합니다. 업계 모범 사례는 AI 채택 준비 상태를 보장하기 위한 포괄적인 평가의 중요성을 강조합니다. 여기에는 아키텍처, 스토리지, 규정 준수, 통합, 테스트, 배포 및 자동화 평가가 포함됩니다.

범위

다음 주제는 생성형 AI 워크로드 평가 방법의 범위 내에 있습니다.

  • 현재 생성형 AI 기술 및 모델(예: 대규모 언어 모델, 이미지 생성 모델)

  • 생성 기법을 사용하는 좁은 AI 애플리케이션

  • 생성형 AI를 기존 시스템 및 워크플로와 통합

  • 생성형 AI 모델 훈련 및 미세 조정을 위한 데이터 전략

  • 현재 생성형 AI 애플리케이션에 대한 윤리적 고려 사항 및 책임 있는 AI 사례

  • 프로덕션 환경에서 생성형 AI를 위한 테스트 및 배포 전략

  • 생성형 AI 구현을 위한 보안 및 개인 정보 보호 고려 사항

  • 생성형 AI 워크로드의 성능 최적화 및 확장성

  • 다양한 산업에서 생성형 AI의 사용 사례 및 애플리케이션

  • 생성형 AI 출력 및 품질 보증 프로세스 평가

다음 주제는 범위를 벗어납니다.

  • 인공 일반 지능(AGI) 및 인공 지능(ASI) 시나리오

  • 현재 생성형 모델을 넘어 AI의 투기적 미래 발전

  • AI의 양자 컴퓨팅 애플리케이션

  • Neuromorphic 컴퓨팅 및 brain-computer 인터페이스

  • AI 시스템의 인식 및 자기 인식

  • 현재 생성형 AI 애플리케이션을 넘어서는 고급 AI의 장기적인 사회적 영향

  • 가상의 미래 AI 기술을 위한 규제 프레임워크

  • 기계에서 지능과 의식의 특성에 대한 철학적 논쟁

  • AI의 극단적인 엣지 사례 또는 고도로 투기적인 사용 사례

  • 독점 AI 모델 또는 아키텍처의 세부 기술 사양