大型模型推論 (LMI) 容器文件

Deep Java Library 文件網站上提供大型模型推論 (LMI) 容器文件。

本文件專為需要部署和最佳化 Amazon SageMaker AI 上大型語言模型 (LLMs) 的開發人員、資料科學家和機器學習工程師撰寫。它可協助您使用 LMI 容器，這是由提供的專用 Docker 容器，用於 LLM 推論 AWS。它提供概觀、部署指南、支援推論程式庫的使用者指南，以及進階教學課程。

透過使用 LMI 容器文件，您可以：

了解 LMI 容器的元件和架構
了解如何為您的使用案例選取適當的執行個體類型和後端
使用 LLMs SageMaker
使用量化、張量平行處理和連續批次處理等功能來最佳化效能
為 SageMaker AI 端點建立基準和調整基準，以獲得最佳輸送量和延遲

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

模型平行處理和大型模型推論

LMI 的 SageMaker AI 端點參數