第 2 步:將數據上傳到 Amazon CloudSearch 進行索引 - Amazon CloudSearch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

第 2 步:將數據上傳到 Amazon CloudSearch 進行索引

您可以將要搜尋的資料上傳到網域,以便 Amazon CloudSearch 可以建立和部署可搜尋的索引。若要由 Amazon 編製索引 CloudSearch,資料必須以 JSON 或 XML 格式化。Amazon 主 CloudSearch 控台可以自動將下列檔案類型轉換為所需的格式:

  • JSON 或 XML 格式的文件批次 (.json、.xml)

  • 逗號分隔值 (.csv)

  • 文字文件 (.txt)

當您上傳 CSV 檔案時,Amazon 會分別 CloudSearch 剖析每一列。第一列會定義文件欄位,而後續各列則成為單獨的文件。對於所有其他檔案類型,Amazon CloudSearch 會建立單一文件,並將檔案內容對應至單一文字欄位。如果檔案有提供中繼資料,中繼資料將對應至相應的文件欄位;經由文件中繼資料所產生的欄位因檔案類型而異。

IMDb 電影範例資料已處理成 JSON 格式。

本教程介紹瞭如何通過 Amazon CloudSearch 控制台提交數據,但您也可以convert和命令行工具一upload documents起使用,並使用該documents/batch資源上傳文檔。(若要上傳超過 5 MB 的資料,必須使用命令列工具或 API)。

將範例資料上傳至您的電影網域
  1. 轉到 Amazon CloudSearch 控制台 https://console.aws.amazon.com/cloudsearch/home.

  2. 在左側導覽窗格中選擇 Domains (網域)。選擇您的電影域名以查看域儀表板。

  3. 選擇動作上載文件

  4. 選擇樣本數據,然後從溺水中選擇 IMDb 電影(演示)

  5. 選擇下一步

  6. 檢閱上載摘要,然後選擇「上載文件」,將資料傳送至您的網域以供索引。

    注意

    若要查看資料的格式化方式,請選擇下載產生的文件批次。如需如何自行準備資料的詳細資訊,請參閱準備您的資料

您現在擁有一個功能齊全的 Amazon CloudSearch 網域,您可以開始搜尋。系統會依收到的順序持續套用更新,因此您可以立即開始搜尋您的網域。