什麼是資料共用? - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是資料共用?

資料共用是在 Amazon Redshift 中共用資料的單位。使用數據庫共享相同或不同 AWS 帳戶 的數據。 AWS 帳戶此外,也可以在不同的 Amazon Redshift 叢集之間共用資料以供讀取用。

每個資料共用都與 Amazon Redshift 叢集中的特定資料庫相關聯。

生產者叢集管理員可以建立資料共用,並新增資料共用物件以與其他叢集共用資料,此動作稱為輸出共用。取用者叢集管理員可以從其他叢集接收資料共用,此動作稱為輸入共用。有關生產者和取用者的詳細資訊,請參閱 資料共用生產者和取用者

Datashare 物件是叢集上特定資料庫的物件,生產者叢集管理員可以將其新增至資料共用,以便與資料取用者共用。對於資料取用者而言,資料共用物件是唯讀的。資料共用物件的範例包括資料表、檢視和使用者定義函數。建立資料共用或編輯資料共用時,您可以隨時將資料共用物件新增至資料共用。

調整叢集大小或暫停生產者叢集時,資料共用會繼續運作。

資料共用有不同的類型。

標準資料共用

使用標準資料存檔,您可以在佈建的叢集、無伺服器工作群組、可用區域和. AWS 帳戶 AWS 區域您可以在叢集類型之間共用,也可以在佈建的叢集和 Amazon Redshift Serverless 之間共用。

若要共用資料,請注意下列佈建的叢集、無伺服器命名空間和 AWS 帳戶 識別碼:

  • 佈建的叢集命名空間是識別 Amazon Redshift 佈建叢集的識別碼。命名空間全域唯一識別碼 (GUID) 會在建立佈建的叢集時自動建立,並附加至叢集。Amazon Resource Name (ARN) 命名空間會使用 arn:{partition}:redshift:{region}:{account-id}:namespace:{namespace-guid} 格式。您可以在 Amazon Redshift 主控台的叢集詳細資料頁面上查看已佈建叢集的命名空間。

    在資料共用工作流程中,命名空間 GUID 值和叢集命名空間 ARN 會用於與 AWS 帳戶中的叢集共用資料。您也可以使用 current_namespace 函數尋找目前叢集的命名空間。

  • 無伺服器命名空間是識別 Amazon Redshift Serverless 的識別碼。命名空間全域唯一識別碼 (GUID) 會在建立 Amazon Redshift Serverless 時自動建立,並附加至執行個體。無伺服器命名空間 ARN 使用 arn:{partition}:redshift-serverless:{region}:{account-id}:namespace/{namespace-guid} 格式。

  • AWS 帳戶 可以是數據存儲器的消費者,並且每個用 12 位數 ID 表示。 AWS 帳戶

對於標準共用,請考量到下列內容:

  • 刪除生產者叢集時,Amazon Redshift 會刪除生產者叢集所建立的資料共用。備份和還原生產者叢集時,建立的資料共用仍會存在還原的叢集上。但是,授予其他叢集的資料共用權限在還原的叢集上不再有效。警將資料共用的使用許可重新授予所需的取用者叢集。取用者叢集上的取用者資料庫會指向建立快照集之原始叢集的資料共用。若要從還原的叢集查詢共用資料,取用者叢集管理員會建立不同的資料庫。或者,管理員可以捨棄並重新建立現有的使用者資料庫,以使用新還原叢集中的資料共用。

  • 刪除取用者叢集並從快照中將其還原時,先前與此叢集共用的存取權將不再有效,也不再可見。如果還原的取用者叢集上仍需要資料共用的存取權,則生產者叢集管理員必須再次將資料共用的使用權授予已還原的取用者叢集。取用者叢集管理員必須捨棄從非作用中資料庫建立的任何過時取用者資料庫。然後,管理員必須在生產者重新授予許可之後,從資料共用中重新建立取用者資料庫。由於從原始叢集還原的叢集上的叢集命名空間 GUID 不同,因此當取用者或生產者叢集從備份還原時,請重新授予資料共用許可。

資料共用生產者和取用者

資料生產者 (也稱為資料共用生產者 (data sharing producer 或 datashare producer)) 是您要從中共用資料的叢集。生產者叢集管理員和資料庫擁有者可以使用 CREATE DATASHARE 命令來建立資料共用。您可以從要產生器叢集與用戶叢集共用的資料庫,新增綱要、資料表、檢視表和 SQL 使用者定義函數 (UDF) 等物件。

資料 AWS Data Exchange 庫的資料生產者 (也稱為提供者 AWS Data Exchange) 可透過授權資料。 AWS Data Exchange核准的提供者可以將 AWS Data Exchange 資料庫新增至產品。 AWS Data Exchange

當客戶訂閱含有資 AWS Data Exchange 料庫的產品時, AWS Data Exchange 會自動將客戶新增為產品隨附的所有 AWS Data Exchange 資料庫上的資料消費者。 AWS Data Exchange 也會在訂閱結束時將所有客戶從 AWS Data Exchange 資料庫中移除。 AWS Data Exchange 還可以自動管理帶有 AWS Data Exchange 數據庫的付費產品的帳單,發票開立,付款收款和付款分配。如需詳細資訊,請參閱 AWS Data Exchange 資料庫。若要註冊為 AWS Data Exchange 資料提供者,請參閱開始成為提供者

資料取用者 (也稱為資料共用取用者 (data sharing consumer 或 datashare consumer)) 是從生產者叢集接收資料共用的叢集。

共用資料的 Amazon Redshift 叢集可以位於相同、不同 AWS 帳戶 或不同 AWS 區域,因此您可以跨組織共用資料並與其他方協同合作。取用者叢集管理員會接收其獲得使用權的資料共用,並檢閱每個資料共用的內容。若要使用共用的資料,取用者叢集管理員會從資料共用中建立 Amazon Redshift 資料庫。然後,管理員會將資料庫的許可指派給取用者叢集中的使用者和角色。授予許可之後,使用者和角色可以將共用物件列為標準中繼資料查詢的一部分,以及取用者叢集上的本機資料。他們可以立即開始查詢。

如果您是擁有有效訂 AWS Data Exchange 閱的消費者 (也稱為訂閱者 AWS Data Exchange),您可以在 Amazon Redshift 中尋找、訂閱和查詢精細的 up-to-date 資料,而不需要擷取、轉換和載入資料。如需詳細資訊,請參閱 AWS Data Exchange 資料庫