選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

主成分分析 (PCA) 演算法

焦點模式
主成分分析 (PCA) 演算法 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

PCA 為無人監管的機器學習演算法,嘗試降低資料集內的維數 (功能數量),同時仍保留所需的資訊。透過找出一組稱為元件的新特徵來完成此目的,為與另一組特徵無關的複合原始特徵。它們也會受到限制,讓第一個元件說明資料中最有可能出現的變異、第二個元件中次有可能出現的變異,以此類推。

在 Amazon SageMaker AI 中,PCA 有兩種模式運作,視情況而定:

  • 一般:針對含有稀疏資料的資料集以及中等數量的觀察與特徵。

  • 隨機:針對含有大量觀察與特徵的資料集。此模式使用近似值演算法。

PCA 使用表格式資料。

行代表您想要在較低的維度空間內嵌的觀察。欄則代表您想要在尋找降低近似值的功能。演算法計算共變異數矩陣 (或者在分散方法中的預算值),接著在此摘要上執行單一值分解以生產主要元件。

PCA 演算法的輸入/輸出介面

針對訓練,PCA 期望獲得訓練通道中提供的資料,並選擇性支援傳遞給測試資料集的資料集,由最終演算法評分。訓練支援 recordIO-wrapped-protobufCSV 兩種格式。您可以使用檔案模式或管道模式,以 recordIO-wrapped-protobufCSV 格式的資料來訓練模型。

對於推論,PCA 支援 text/csvapplication/jsonapplication/x-recordio-protobuf。結果將以含有向量 “投影” 的 application/jsonapplication/x-recordio-protobuf 格式傳回。

如需輸入和輸出檔案格式的詳細資訊,請參閱適用於推論的PCA 回應格式以及PCA 範例筆記本

PCA 演算法的 EC2 執行個體建議事項

PCA 支援用於訓練和推論的 CPU 和 GPU 執行個體。哪些執行個體類型擁有最高效能大部分根據輸入資料的詳細規格而定。若為 GPU 執行個體,PCA 支援 P2、P3、G4dn 和 G5。

PCA 範例筆記本

如需示範如何使用 SageMaker AI 主要元件分析演算法分析 MNIST 資料集中從零到九的手寫數字影像的範例筆記本,請參閱使用 MNIST 的 PCA 簡介。如需如何建立和存取可用於在 SageMaker AI 中執行範例的 Jupyter 筆記本執行個體的說明,請參閱 Amazon SageMaker 筆記本執行個體。建立並開啟筆記本執行個體後,請選取 SageMaker AI 範例索引標籤,以查看所有 SageMaker AI 範例的清單。使用 NTM 演算法模組化範例筆記本的主題位於 Amazon 演算法簡介一節。若要開啟筆記本,請按一下其使用標籤,然後選取建立複本

下一個主題:

運作方式

上一個主題:

推論格式
隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。