本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
第 2 步:將數據上傳到 Amazon CloudSearch 進行索引
您可以將要搜尋的資料上傳到網域,以便 Amazon CloudSearch 可以建立和部署可搜尋的索引。若要由 Amazon 編製索引 CloudSearch,資料必須以 JSON 或 XML 格式化。Amazon 主 CloudSearch 控台可以自動將下列檔案類型轉換為所需的格式:
-
JSON 或 XML 格式的文件批次 (.json、.xml)
-
逗號分隔值 (.csv)
-
文字文件 (.txt)
當您上傳 CSV 檔案時,Amazon 會分別 CloudSearch 剖析每一列。第一列會定義文件欄位,而後續各列則成為單獨的文件。對於所有其他檔案類型,Amazon CloudSearch 會建立單一文件,並將檔案內容對應至單一文字欄位。如果檔案有提供中繼資料,中繼資料將對應至相應的文件欄位;經由文件中繼資料所產生的欄位因檔案類型而異。
IMDb 電影範例資料已處理成 JSON 格式。
本教程介紹瞭如何通過 Amazon CloudSearch 控制台提交數據,但您也可以convert和命令行工具一upload documents起使用,並使用該documents/batch
資源上傳文檔。(若要上傳超過 5 MB 的資料,必須使用命令列工具或 API)。
將範例資料上傳至您的電影網域
-
轉到 Amazon CloudSearch 控制台 https://console.aws.amazon.com/cloudsearch/home
. -
在左側導覽窗格中選擇 Domains (網域)。選擇您的電影域名以查看域儀表板。
-
選擇動作,上載文件。
-
選擇樣本數據,然後從溺水中選擇 IMDb 電影(演示)。
-
選擇下一步。
-
檢閱上載摘要,然後選擇「上載文件」,將資料傳送至您的網域以供索引。
注意
若要查看資料的格式化方式,請選擇下載產生的文件批次。如需如何自行準備資料的詳細資訊,請參閱準備您的資料。
您現在擁有一個功能齊全的 Amazon CloudSearch 網域,您可以開始搜尋。系統會依收到的順序持續套用更新,因此您可以立即開始搜尋您的網域。