天氣指數 - Amazon Forecast

Amazon Forecast 不再提供給新客戶。Amazon Forecast 的現有客戶可以繼續正常使用該服務。了解更多」

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

天氣指數

Amazon 天氣預報指數是內建的特徵,可將歷史和預測的天氣資訊整合到您的模型中。它特別適用於零售使用案例,其中溫度和降水會顯著影響產品需求。

啟用天氣指數後,「Forecast」只會將天氣特徵化套用至時間序列,在此序列中可在預測值訓練期間找到準確度的改善。如果用天氣資訊補充時間序列並不能提高其在回溯測試期間的 Forecast 準確性,則「預測」不會將「天氣指數」套用至該特定時間序列。

要應用天氣指數,您必須包括地理位置屬性在目標時間序列資料集和任何相關的時間序列資料集中。您還需要指定時區用於您的目標時間序列時間戳記。如需資料集要求的詳細資訊,請參閱法規與限制

蟒蛇筆記本

對於一個 step-by-step 有關使用天氣指數的指南,請參閱紐約出租車:Amazon Forecast 與天氣指數

啟用天氣指數

天氣指數在預測訓練階段啟用。使用時CreateAutoPredictor操作時,天氣指數包含在AdditionalDataset資料類型。

啟用天氣索引之前,您必須在目標時間序列和相關時間序列資料集中包含地理位置屬性,並定義時間戳記的時區。如需詳細資訊,請參閱《》加入地理位置資訊指定時區

您可以使用 Forecast 控制台或 Forecast 軟件開發工具包(SDK)啟用天氣指數。

Console

啟用天氣索引

  1. 登入AWS Management Console並在以下位置打開 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/

  2. 資料集」下方,選擇您的資料集群組。

  3. 在導覽窗格中,選擇预测值

  4. 選擇訓練新的預測

  5. 選擇啟用天氣索引

SDK

啟用天氣索引

使用CreateAutoPredictor作業中,透過新增啟用天氣索引"Name": "weather""Value": "true"AdditionalDataset資料類型。

"DataConfig": { ... "AdditionalDatasets": [ ... { "Name": "weather", } ] },

將地理位置資訊新增至資料集

若要使用天氣索引,您必須為目標時間序列和相關時間序列資料集中的每個項目包含地理位置屬性。屬性是使用geolocation資料集結構描述中的屬性類型。

資料集中的所有地理位置值必須僅位於單一區域內。這些地區是:美國(不包括夏威夷和阿拉斯加),加拿大,南美洲,中美洲,亞太地區,歐洲和非洲和中東。

以下列兩種格式之一指定地理位置屬性:

  • 緯度 & 經度(所有區域)-以十進位格式指定緯度和經度 (範例:47.61_-122.33)

  • 郵政編碼(僅限美國)-指定國家/地區代碼(美國),後面接著 5 位數的郵遞區碼(例如:US_98121)

所有區域都支援「緯度和經度」格式。郵遞區號格式僅支援美國地區。

緯度 & 經度邊界

以下是接受區域的緯度和縱向邊界:

US Region

界限: 緯度, 經度

Map of North America showing United States, parts of Canada and Mexico with major cities.
Canada Region

界限: 緯度, 經度

Map showing northern Canada and parts of the US, highlighting territories and major cities.
Europe Region

界限: 緯度, 經度 (2), 經度

Map of Northern Europe and surrounding regions showing countries and major cities.
South America Region

界限: 緯度, 經度 (0), 經度。

Map of South America showing countries, major cities, and Brazilian states.
Asia Pacific Region

界限: 緯度, 經度

Map showing East Asia, Southeast Asia, and Australia with country names and ocean labels.
Central America Region

界限: 緯度, 經度 (0)。

Map showing southern US, Mexico, Central America, and Caribbean with major cities and bodies of water.
Africa & Middle East Region

界限: 緯度, 經度

Map showing North Africa, Middle East, and parts of Europe with country names and borders.

在資料集結構描述中包含地理位置

使用主控台或CreateDataset作業中,將位置屬性類型定義為目標時間序列和任何相關時間序列的 JSON 結構描述內的「地理位置」。結構描述中的屬性必須按照它們出現在資料集中的順序進行排序。

{ "Attributes":[ { "AttributeName": "timestamp", "AttributeType": "timestamp" }, { "AttributeName": "target_value", "AttributeType": "float" }, { "AttributeName": "item_id", "AttributeType": "string" }, { "AttributeName": "location", "AttributeType": "geolocation" } ] }

設定地理位置格式

地理位置屬性的格式可以是郵政編碼或者緯度 & 經度格式。您可以使用「Forecast」主控台或「Forecast 軟體開發套件」(SDK) 來設定地理位置格式。

Console

若要將地理位置屬性新增至時間序列資料集

  1. 登入AWS Management Console並在以下位置打開 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/

  2. 選擇 Create dataset group (建立資料集群組)

  3. Schema,設置您的地理位置屬性類型geolocation

  4. 地理位置格式」下拉式清單中,選擇您的位置格式。

Dataset details form with name, frequency, and schema builder for attribute specification.

您也可以定義 JSON 格式的屬性,並從地理位置格式下拉式清單。

SDK

若要將地理位置屬性新增至時間序列資料集

使用 CreateDatasetImportJob作業中,設定值GeolocationFormat至下列其中一項:

  • 緯度 & 經度(所有地區):"LAT_LONG"

  • 郵政編碼(僅限美國地區):"CC_POSTALCODE"

例如,若要指定緯度和經度格式,請包含以下內容:CreateDatasetImportJob要求:

{ ... "GeolocationFormat": "LAT_LONG" }

指定時區

您可以讓 Amazon Forecast 自動將您的時區資訊與地理位置屬性同步,也可以手動為整個資料集指派單一時區。

自動同步時區與地理位置

此選項非常適合包含多個時區中時間戳記的資料集,而這些時間戳記會以本地時間表示。Forecast 會根據項目的地理位置屬性,為目標時間序列資料集中的每個項目指派一個時區。

您可以使用「Forecast」主控台或「Forecast SDK」自動同步時間戳記與地理位置屬性。

Console

使用地理位置屬性同步時區

  1. 登入AWS Management Console並在以下位置打開 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/

  2. 在導覽窗格中,選擇建立資料集群組

  3. 在 中資料集匯入詳情,選擇將時區與位置同步

Dataset import form with fields for name, time zone, S3 data location, and IAM role.
SDK

使用地理位置屬性同步時區

使用 CreateDatasetImportJob操作,集"UseGeolocationForTimeZone""true"

{ ... "UseGeolocationForTimeZone": "true" }

手動選取單一時區

注意

您可以手動選取美國地區加拿大地區南美洲中央美洲亞太地區歐洲,以及非洲及中東地區。但是,所有地理位置值仍必須位於其中一個區域內。

此選項非常適合具有所有時間戳記在單一時區內的資料集,或者如果所有時間戳記都標準化為單一時區。使用此選項會將相同的時區套用至資料集中的每個項目。

天氣指數接受以下時區:

美國地區

  • America/Los_Angeles

  • 美洲/鳳凰城

  • 美洲/大丹佛

  • 美洲/大芝加哥

  • America/New_York

加拿大地區

  • 美洲/大溫哥華

  • 美洲/埃德蒙頓

  • 美洲/大里賈納

  • 美洲/大溫尼伯

  • 美洲/大多倫多

  • 美洲/大哈利法克斯

  • 美洲/約翰斯島

歐洲

  • 歐洲 / 倫敦

  • 歐洲/大巴黎

  • 歐洲 / 赫爾辛基

南美洲

  • 美洲/布埃納斯艾利斯

  • 美洲/諾羅尼亞

  • 美洲/加拉加斯

亞太地區

  • 亞洲/大亞伯爾

  • 亞洲/卡拉奇

  • 亞洲/加爾多爾各

  • 亞洲/加德滿都

  • 亞洲/大達卡

  • 亞洲/仰光

  • 亞洲/大亞洲曼谷

  • 亞洲/新加坡

  • 亞洲/大亞洲/首爾

  • 澳大利亞/阿德萊德

  • 澳大利亞/墨爾本

  • 澳大利亞/洛德豪

  • 澳大利亞/歐克拉

  • 太平洋/諾福克

  • 太平洋/大洋奧克蘭

中央美洲

  • 美洲/波多黎各

非洲及中東

  • 非洲/亞洲/亞洲

  • 亞洲/大德黑蘭

  • 亞洲/大亞洲/杜拜

Other (其他)

  • 太平洋/中央美洲

  • 太平洋/香山

  • 太平洋/大馬克薩斯

  • 美洲/大安克雷奇

  • 大西洋/佛得角群

  • 亞洲/阿納德爾

  • 太平洋/漆咸

  • 太平洋/安德伯里

  • 太平洋/基里蒂馬斯

其他列出資料集中的項目是否位於接受的地區之一內,但您的時間戳記已標準化為該地區以外的時區。

如需有效時區名稱的完整清單,請參閱喬達時間圖書館

您可以使用 Forecast 主控台或 Forecast SDK 手動設定資料集的時區。

Console

若要選取資料集的單一時區

  1. 登入AWS Management Console並在以下位置打開 Amazon Forecast 控制台https://console.aws.amazon.com/forecast/

  2. 在導覽窗格中,選擇建立資料集群組

  3. 在 中資料集匯入詳情,選擇選擇時區

例如,使用下列指令將洛杉磯時間 (太平洋標準時間) 套用至資料集。

Dataset import form with fields for name, time zone, data location, and IAM role.
SDK

若要選取資料集的單一時區

使用 CreateDatasetImportJob操作,集"TimeZone"到有效的時區。

例如,使用下列指令將洛杉磯時間 (太平洋標準時間) 套用至資料集。

{ ... "TimeZone": "America/Los_Angeles" }

法規與限制

使用天氣指數時,有以下條件和限制:

  • 可用演算法:如果使用舊式預測值,當您使用 CNN-QR、DeePar+ 和先知演算法訓練預測值時,可以啟用天氣索引。天氣指數不適用於華宇、ETS 和 NPTS。

  • Forecast Frequency:有效的預測頻率為MinutelyHourly,以及Daily

  • Forecast 總時程:預測總時程不得超過 future 14 天。有關每個預測頻率的預測總時程限制,請參考下列清單:

    • 1 minute500 項

    • 5 minutes500 項

    • 10 minutes500 項

    • 15 minutes500 項

    • Hourly-

    • Daily-14

  • 時間序列長度:使用天氣指數訓練模型時,「Forecast」會在「Forecast」天氣資料集特徵化的開始日期之前截斷具有時間戳記的所有時間序列資料集。「Forecast」氣象資料集特徵化包含下列開始日期:

    • 美國地區:2018 年 7 月 2 日

    • 歐洲:2018 年 7 月 2 日

    • 亞太地區:2018 年 7 月 2 日

    • 加拿大地區:2019 年 7 月 2 日

    • 南美洲:2020 年 1 月 2 日

    • 中央美洲:2020 年 9 月 2 日

    • 非洲及中東地區:2021 年 3 月 25 日

    啟用天氣指數後,在預測值訓練期間,將不會使用開始日期之前具有時間戳記的資料點。

  • 位置數量:目標時間序列資料集不得超過 2000 個唯一位置。

  • 區域邊界:資料集中的所有項目都必須位於單一區域內。

  • 最小時間序列長度:由於測試天氣指數時的額外資料需求,時間序列資料集的最小長度為:

    3 × ForecastHorizon + (BacktestWindows + 1) × BacktestWindowOffset

    如果您的時間序列資料集不符合此需求,請考慮減少下列項目:

    • ForecastHorizon-縮短您的預測總時程。

    • BacktestWindowOffset-在回溯測試期間縮短測試集的長度。

    • BacktestWindows-減少回溯測試的數量。