Amazon S3 分析 – 儲存類別分析 - Amazon Simple Storage Service

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon S3 分析 – 儲存類別分析

您可以使用 Amazon S3 分析「儲存類別分析」來分析儲存體存取模式,協助您決定何時將正確的資料轉移至正確的儲存類別。這個新的 Amazon S3 分析功能會觀察資料存取模式,協助您決定何時將不常存取的 STANDARD 儲存,轉移至 STANDARD_IA (IA 表示不常存取) 儲存類別。如需儲存體方案的詳細資訊,請參閱「使用 Amazon S3 儲存體方案」。

在儲存體方案分析觀察一段時間之已篩選資料集的不常存取模式後,您可以使用分析結果協助改善生命週期組態。您可以設定儲存體方案分析,分析儲存貯體中的所有物件。或者,您可以設定篩選條件,依共同的字首 (亦即,名稱使用共同字串開頭的物件)、物件標籤或這兩者來分組物件進行分析。您一定會發現,依物件群組篩選,是最能發揮儲存體方案分析優勢的方法。

重要

儲存類別分析僅提供標準到標準 IA 類別的建議。

您的每一個儲存貯體最多可有 1,000 個儲存體方案分析,而每項篩選條件都會得到不同的分析。多篩選條件的組態可讓您分析特定的物件群組,從而改進將物件轉換為 STANDARD_IA 的生命週期組態。

儲存類別分析會在 Amazon S3 主控台中,提供每日更新的儲存用量視覺化。您也可以將這些每日用量資料匯出到 S3 儲存貯體,並在試算表應用程式中檢視這些資料,或使用 Amazon 等商業智慧工具進行檢視 QuickSight。

有與儲存類別分析相關的成本。如需定價資訊,請參閱「管理與複寫」Amazon S3 定價

如何設定儲存體方案分析?

您可以藉由設定您要分析的物件資料來設定儲存體方案分析。設定儲存體方案分析可以執行下列作業:

  • 分析儲存貯體的全部內容。

    您會收到儲存貯體中所有物件的分析。

  • 分析依前綴及標籤分組的物件。

    您可以設定篩選條件,依字首、物件標籤或這兩者來分組物件進行分析。您設定的每項篩選條件都會收到不同的分析。您的每一個儲存貯體最多可有 1,000 個篩選條件組態。

  • 匯出分析資料。

    當您設定儲存貯體或篩選條件的儲存體方案分析時,可以選擇每天將分析資料匯出至檔案。當日的分析會新增到檔案中,成為所設定之篩選條件的歷史分析日誌。此檔案在所選的目標會每日更新。在選取要匯出的資料時,您必須指定檔案寫入的目標儲存貯體及選用的目標字首。

您可以使用 Amazon S3 主控台、REST API 或 AWS CLI 或 AWS 開發套件來設定儲存類別分析。

如何使用儲存體方案分析?

您可以使用儲存體方案分析,觀察一段時間的資料存取模式從中收集資訊,藉此改善 STANDARD_IA 儲存體的生命週期管理。在設定篩選條件之後的 24 到 48 小時內,您在 Amazon S3 主控台中會開始看到根據篩選條件的資料分析。但儲存體方案分析會觀察篩選所得之資料集的存取模式 30 天或更久,先收集分析資訊,然後再提供結果。分析在得到第一次的結果之後會繼續進行,並隨著存取模模式變更而更新結果。

第一次設定篩選條件時,Amazon S3 主控台可能需要一點時間來分析您的資料。

儲存體方案分析會觀察篩選所得之資料集的存取模式 30 天或久,以收集足夠的資訊進行分析。當儲存類別分析收集到足夠的資訊後,您在 Amazon S3 主控台中會看到分析完成的訊息。

在對不常存取的物件執行分析時,儲存類別分析會觀察篩選後的物件集,這些物件是根據上傳到 Amazon S3 後的存留期而組合在一起。儲存體方案分析會依據下列因素,觀察篩選後的資料集,判斷存留期群組是否不常存取:

  • STANDARD 儲存體方案中的物件超過 128 KB。

  • 您的每一個存留期群組之平均儲存體總量。

  • 每個存留期群組傳出的平均位元組數 (非經常性)。

  • Analytics 的匯出資料只包含對儲存體方案分析相關資料的要求。這可能會造成要求數、上傳總計及要求的位元組數,與儲存體指標或您內部系統追蹤所顯示數據有所差異。

  • 失敗的 GET 及 PUT 要求不會計入分析。但您仍會在儲存指標中看到失敗的要求。

我擷取了多少儲存體?

Amazon S3 主控台會以圖表顯示在觀察期間,已從篩選後的資料集擷取多少儲存體。

我擷取了多少百分比的儲存體?

Amazon S3 主控台也會以圖表顯示在觀察期間,已從篩選後的資料集擷取多少百分比的儲存體。

如本主題前文所述,在對不常存取的物件執行分析時,儲存類別分析會觀察篩選後的物件集,這些物件是根據上傳到 Amazon S3 後的存留期而組合在一起。儲存體方案分析使用下列預先定義的物件存留期群組:

  • 不及 15 天的 Amazon S3 物件

  • 15-29 天的 Amazon S3 物件

  • 30-44 天的 Amazon S3 物件

  • 45-59 天的 Amazon S3 物件

  • 60-74 天的 Amazon S3 物件

  • 75-89 天的 Amazon S3 物件

  • 90-119 天的 Amazon S3 物件

  • 120-149 天的 Amazon S3 物件

  • 150-179 天的 Amazon S3 物件

  • 180-364 天的 Amazon S3 物件

  • 365-729 天的 Amazon S3 物件

  • 超過 730 天 (含) 的 Amazon S3 物件

觀察存取模式一般大約需要 30 天,才能收集到足夠的資訊取得分析結果。此期間也可能會超過 30 天,視資料的特有的存取模式而定。然而,在設定篩選條件之後的 24 到 48 小時內,您在 Amazon S3 主控台中會開始看到根據篩選條件的資料分析。在 Amazon S3 主控台中,您可以看到依物件存留期群組分組的每日物件存取分析。

我的儲存體中不常存取的部分有多少?

Amazon S3 主控台會顯示存取模式,並依預先定義的物件存留期群組分組。顯示的 Frequently accessed (經常存取)Infrequently accessed (不常存取) 文字是作為協助您完成生命週期建立程序的視覺輔助。

如何匯出儲存體方案分析資料?

您可以選擇將儲存體方案分析的分析報告匯出為逗號分隔值 (CSV) 的一般檔案。報告會每日更新,並依據您設定的物件存留期群組加以篩選。使用 Amazon S3 主控台建立篩選條件時,您可以選擇匯出報告選項。選取資料匯出時,必須指定寫入檔案的目標儲存貯體,並選擇是否要指定目標字首。您可以將資料匯出到其他帳戶中的目標儲存貯體。目標儲存貯體與您設定所要分析的儲存貯體,必須位在相同的區域。

您必須在目的地儲存貯體上建立儲存貯體政策,以授予 Amazon S3 許可,以驗證 AWS 帳戶 擁有儲存貯體的物件,並將物件寫入定義位置的儲存貯體。如需政策範例,請參閱「授予 S3 清查與 S3 分析的許可」。

當您設定儲存體方案分析報告 24 小時後,就會開始每天收到匯出的報告。之後,Amazon S3 會持續監視並提供每日的匯出。

您可以在試算表應用程式中開啟 CSV 檔案,或將檔案匯入其他應用程式 (例如 Amazon) QuickSight。如需搭配 Amazon 使用 Amazon S3 檔案的相關資訊 QuickSight,請參閱 Amazon 使用 QuickSight 者指南中的使用 Amazon S3 檔案建立資料集

檔案匯出中的資料在物件存留期群組中會依日期儲存,如下列範例所示。若儲存體方案是 STANDARD,資料列也會包含 ObjectAgeForSIATransitionRecommendedObjectAgeForSIATransition 資料行的資料。

匯出儲存類別分析資料的螢幕擷取畫面,依物件年齡群組內的日期排序。

報告結尾的物件存留期群組指定為 ALL。ALL 資料列包含該天所有存留期群組的累加總計,包括小於 128 KB 的物件。

匯出儲存類別分析資料的螢幕擷取畫面,其中包含累計總計的所有列。

下節說明報告中使用的資料行。

匯出的檔案配置

下表說明匯出之檔案的配置。

使用捲軸查看表格的其餘部分。

Amazon S3 儲存類別分析匯出檔案配置
資料欄名稱 維度/指標 DataType 描述
日期 維度 字串 記錄的處理日期。格式為 MM-DD-YYYY。
ConfigId 維度 字串

新增篩選組態時,輸入作為篩選名稱的值。

篩選條件 維度 字串

Filter欄位會刻意設定為空值。

StorageClass 維度 字串

資料的儲存體方案。

ObjectAge 維度 字串

篩選條件中,物件的存留期群組。除了 128KB+ 物件的 12 個不同存留期群組 (0-14 天、 15-29 天、30-44 天、45-59 天、60-74 天、75-89 天、 90-119 天、120-149 天、150-179 天、180-364 天、365-729 天、730 天+) 之外,值 'ALL' 代表所有的存留期群組。

ObjectCount 指標 Integer

每個儲存類別當日計入的物件總數。此值僅針對 AgeGroup='ALL' 填入,並顯示所有存留期群組當日計入的物件總數。

DataUploaded_ MB 指標 Number

每個儲存類別當日上傳的資料總計 (MB)。此值僅針對 AgeGroup='ALL' 填入,並顯示所有存留期群組當日計入的上傳總數,以 MB 為單位。(請注意,因為分段上傳要求目前不具儲存體方案資訊,所以匯出資料中不會列出物件分段上傳的活動)。

Storage_MB 指標 數字

存留期群組中每個儲存體方案當日儲存體數量總計 (MB)。對於 AgeGroup='ALL',此值是所有存留期群組當日儲存體數量總計 (MB)。

DataRetrieved_ MB 指標 數字

存留期群組中每個儲存體方案當日使用 GET 要求傳出的資料量 (MB)。對於 AgeGroup='ALL',此值是所有存留期群組當日使用 GET 要求傳出的資料量總計 (MB)。

GetRequestCount 指標 Integer

存留期群組中每個儲存體方案當日發出的 GET 和 PUT 要求數。對於 AgeGroup ='ALL',該值表示當天所有年齡組的總 GET 和 PUT 請求計數。

注意

該 GetRequestCount 列被錯誤標記,還包括每個存儲類發出的 PUT 請求的數量。

CumulativeAccessRatio 指標 數字

累積存取率。此比率可用於表示任一指定存留期群組的用量/位元組狀況,藉此判斷存留期群組是否符合轉換為 STANDARD_IA 的資格。

ObjectAgeFor安全裁判 指標 整數 (天數)

僅當 AgeGroup=’ALL’ 與儲存體方案為 STANDARD 時才可有此值。其表示所觀察到轉移到 STANDARD_IA 後的存留期。

RecommendedObjectAgeFor安全裁判 指標 整數 (天數)

僅當 AgeGroup=’ALL’ 與儲存體方案為 STANDARD 時才可有此值。其表示考慮在 ObjectAgeForSIATransition 穩定後轉換為 STANDARD_IA 的物件存留期 (天)。