Regola di analisi personalizzata in AWS Clean Rooms - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Regola di analisi personalizzata in AWS Clean Rooms

In AWS Clean Rooms, una regola di analisi personalizzata è un nuovo tipo di regola di analisi che consente di eseguire query personalizzate sulla tabella configurata. Le query SQL personalizzate sono ancora limitate al solo SELECT comando, ma possono utilizzare più costrutti SQL rispetto alle query di aggregazione ed elenco (ad esempio, funzioni di finestra, OUTER JOIN, CTE o sottoquery; per un elenco completo, consulta il AWS Clean Rooms riferimento SQL). Le query SQL personalizzate non devono seguire una struttura di query come le query di aggregazione e le query a elenco.

La regola di analisi personalizzata supporta casi d'uso più avanzati rispetto a quelli che possono essere supportati dalla regola di aggregazione e analisi degli elenchi, come l'analisi di attribuzione personalizzata, il benchmarking, l'analisi di incrementalità e l'individuazione dell'audience. Ciò si aggiunge a un superset dei casi d'uso supportati dalle regole di aggregazione e analisi degli elenchi.

La regola di analisi personalizzata supporta anche la privacy differenziale. La privacy differenziale è un quadro matematicamente rigoroso per la protezione della privacy dei dati. Per ulteriori informazioni, consulta AWS Clean Rooms Privacy differenziale. Quando si crea un modello di analisi, AWS Clean Rooms Differential Privacy controlla il modello per determinare se è compatibile con la struttura di interrogazione generica per Differential Privacy. AWS Clean Rooms Questa convalida garantisce che non si crei un modello di analisi non consentito con una tabella differenziale protetta dalla privacy.

Per configurare la regola di analisi personalizzata, i proprietari dei dati possono scegliere di consentire l'esecuzione di query personalizzate specifiche, archiviate in modelli di analisi, sulle tabelle configurate. I proprietari dei dati esaminano i modelli di analisi prima di aggiungerli al controllo di analisi consentito nella regola di analisi personalizzata. I modelli di analisi sono disponibili e visibili solo nella collaborazione in cui vengono creati (anche se la tabella è associata ad altre collaborazioni) e possono essere eseguiti solo dal membro che può eseguire query nell'ambito di tale collaborazione.

In alternativa, i membri possono scegliere di consentire ad altri membri (fornitori di query) di creare query senza revisione. I membri aggiungono gli account dei provider di query controllati dai provider di query consentiti nella regola di analisi personalizzata. Se il provider di query è il membro che può eseguire le query, possono eseguire qualsiasi query direttamente sulla tabella configurata. I provider di query possono anche creare interrogazioni creando modelli di analisi. Tutte le query create dai provider di query possono essere eseguite automaticamente sulla tabella in tutte le collaborazioni in cui Account AWS è presente e la tabella è associata.

I proprietari dei dati possono consentire solo ai modelli di analisi o agli account di creare query, non entrambi. Se il proprietario dei dati lo lascia vuoto, il membro che può eseguire le query non può eseguire query sulla tabella configurata.

Struttura predefinita della regola di analisi personalizzata

L'esempio seguente include una struttura predefinita che mostra come completare una regola di analisi personalizzata con la privacy differenziale attivata. Il userIdentifier valore è la colonna che identifica in modo univoco gli utenti, ad esempio user_id. Quando in una collaborazione sono attivate due o più tabelle con privacy differenziale, è AWS Clean Rooms necessario configurare la stessa colonna come colonna dell'identificatore utente in entrambe le regole di analisi per mantenere una definizione coerente degli utenti tra le tabelle.

{ "allowedAnalyses": ["ANY_QUERY"] | string[], "allowedAnalysisProviders": [], "differentialPrivacy": { "columns": [ { "name": "userIdentifier" } ] } }

Puoi eseguire una delle seguenti operazioni:

  • Aggiungi gli ARN dei modelli di analisi al controllo consentito delle analisi. In questo caso, il allowedAnalysisProviders controllo non è incluso.

    { allowedAnalyses: string[] }
  • Aggiungi gli Account AWS ID dei membri al allowedAnalysisProviders controllo. In questo caso, si aggiunge ANY_QUERY qualcosa al allowedAnalyses controllo.

    { allowedAnalyses: ["ANY_QUERY"], allowedAnalysisProviders: string[] }

Esempio di regola di analisi personalizzata

L'esempio seguente dimostra come due aziende possono collaborare AWS Clean Rooms utilizzando la regola di analisi personalizzata.

L'azienda A dispone di dati sui clienti e sulle vendite. L'azienda A è interessata a comprendere l'incrementalità delle vendite di una campagna pubblicitaria sul sito della Società B. L'azienda B dispone di dati sulle visualizzazioni e attributi dei segmenti utili all'azienda (ad esempio, il dispositivo utilizzato per visualizzare la pubblicità).

L'azienda A ha una query di incrementalità specifica che desidera eseguire nell'ambito della collaborazione.

Per creare una collaborazione ed eseguire un'analisi personalizzata in collaborazione, le aziende eseguono le seguenti operazioni:

  1. L'azienda A crea una collaborazione e crea un'iscrizione. La collaborazione ha l'azienda B come altro membro della collaborazione. La società A consente la registrazione delle interrogazioni nella collaborazione e la registrazione delle interrogazioni nel proprio account.

  2. L'azienda B crea un'appartenenza alla collaborazione. Consente la registrazione delle interrogazioni nel proprio account.

  3. L'azienda A crea una tabella configurata con CRM

  4. La società A aggiunge una regola di analisi personalizzata vuota alla tabella configurata per le vendite.

  5. La società A associa la tabella configurata per le vendite alla collaborazione.

  6. La società B crea una tabella configurata per la visualizzazione.

  7. La società B aggiunge una regola di analisi personalizzata vuota alla tabella configurata per la visualizzazione.

  8. La società B associa la tabella configurata per la visualizzazione alla collaborazione.

  9. La società A visualizza la tabella delle vendite e la tabella delle visualizzazioni associate alla collaborazione e crea un modello di analisi, aggiungendo la query di incrementalità e il parametro per il mese della campagna.

    { "analysisParameters": [ { "defaultValue": "" "type": "DATE" "name": "campaign_month" } ], "description": "Monthly incrementality query using sales and viewership data" "format": "SQL" "name": "Incrementality analysis" "source": "WITH labeleddata AS ( SELECT hashedemail, deviceid, purchases, unitprice, purchasedate, CASE WHEN testvalue IN ('value1', 'value2', 'value3') THEN 0 ELSE 1 END AS testgroup FROM viewershipdata ) SELECT labeleddata.purchases, provider.impressions FROM labeleddata INNER JOIN salesdata ON labeleddata.hashedemail = provider.hashedemail WHERE MONTH(labeleddata.purchasedate) > :campaignmonth AND testgroup = :group " }
  10. La società A aggiunge il proprio account (ad esempio, 444455556666) al controllo consentito dal fornitore di analisi nella regola di analisi personalizzata. Utilizzano il controllo del provider di analisi consentito perché desiderano consentire l'esecuzione di tutte le query create sulla tabella configurata per le vendite.

    { "allowedAnalyses": [ "ANY_QUERY" ], "allowedAnalysisProviders": [ "444455556666" ] }
  11. L'azienda B vede il modello di analisi creato nell'ambito della collaborazione e ne esamina il contenuto, inclusi la stringa di query e il parametro.

  12. La società B stabilisce che il modello di analisi soddisfa il caso d'uso dell'incrementalità e soddisfa i requisiti di privacy relativi alle modalità di interrogazione della tabella configurata per la visualizzazione.

  13. La società B aggiunge il modello di analisi ARN al controllo di analisi consentito nella regola di analisi personalizzata della tabella di visualizzazione. Utilizzano il controllo di analisi consentito perché desiderano solo consentire l'esecuzione della query di incrementalità sulla tabella configurata per la visualizzazione.

    { "allowedAnalyses": [ "arn:aws:cleanrooms:us-east-1:111122223333:membership/41327cc4-bbf0-43f1-b70c-a160dddceb08/analysistemplate/1ff1bf9d-781c-418d-a6ac-2b80c09d6292" ] }
  14. La società A esegue il modello di analisi e utilizza il valore del parametro. 05-01-2023

Regola di analisi personalizzata con privacy differenziale

Nel AWS Clean Rooms, la regola di analisi personalizzata supporta la privacy differenziale. La privacy differenziale è un framework matematicamente rigoroso per la protezione della privacy dei dati che consente di proteggere i dati dai tentativi di reidentificazione.

La privacy differenziale supporta analisi aggregate come la pianificazione di campagne pubblicitarie, la post-ad-campaign misurazione, il benchmarking in un consorzio di istituti finanziari e i test A/B per la ricerca sanitaria.

La struttura e la sintassi delle query supportate sono definite in. Struttura e sintassi delle query

Regola di analisi personalizzata con esempio di privacy differenziale

Considerate l'esempio di regola di analisi personalizzata presentato nella sezione precedente. Questo esempio dimostra come è possibile utilizzare la privacy differenziale per proteggere i dati dai tentativi di reidentificazione, permettendo al contempo al partner di acquisire informazioni fondamentali per l'azienda dai dati. Supponiamo che l'azienda B, che dispone dei dati sulle visualizzazioni, voglia proteggere i propri dati utilizzando una privacy differenziale. Per completare la configurazione della privacy differenziale, l'azienda B completa i seguenti passaggi:

  1. La società B attiva la privacy differenziale aggiungendo una regola di analisi personalizzata alla tabella configurata per la visualizzazione. La società B seleziona viewershipdata.hashedemail come colonna identificativa dell'utente.

  2. La società B aggiunge una politica sulla privacy differenziale alla collaborazione per rendere disponibile la tabella dei dati di visualizzazione per le interrogazioni. L'azienda B seleziona la politica predefinita per completare rapidamente la configurazione.

La società A, che desidera comprendere l'incrementalità delle vendite di una campagna pubblicitaria sul sito dell'azienda B, utilizza il modello di analisi. Poiché la query è compatibile con la struttura di interrogazione generica di AWS Clean Rooms Differential Privacy, la query viene eseguita correttamente.

Struttura e sintassi delle query

Le query contenenti almeno una tabella con la privacy differenziale attivata devono rispettare la sintassi seguente.

query_statement: [cte, ...] final_select cte: WITH sub_query AS ( inner_select [ UNION | INTERSECT | UNION_ALL | EXCEPT/MINUS ] [ inner_select ] ) inner_select: SELECT [user_id_column, ] expression [, ...] FROM table_reference [, ...] [ WHERE condition ] [ GROUP BY user_id_column[, expression] [, ...] ] [ HAVING condition ] final_select: SELECT [expression, ...] | COUNT | COUNT_DISTINCT | SUM | AVG | STDDEV FROM table_reference [, ...] [ WHERE condition ] [ GROUP BY expression [, ...] ] [ HAVING COUNT | COUNT_DISTINCT | SUM | AVG | STDDEV | condition ] [ ORDER BY column_list ASC | DESC ] [ OFFSET literal ] [ LIMIT literal ] expression: column_name [, ...] | expression AS alias | aggregation_functions | window_functions_on_user_id | scalar_function | CASE | column_name math_expression [, expression] window_functions_on_user_id: function () OVER (PARTITION BY user_id_column, [column_name] [ORDER BY column_list ASC|DESC])
Nota

Per quanto riguarda la struttura e la sintassi delle query di privacy differenziali, tenete presente quanto segue:

  • Le sottoquery non sono supportate.

  • Le Common Table Expressions (CTE) dovrebbero emettere la colonna dell'identificatore utente se una tabella o un CTE coinvolgono dati protetti dalla privacy differenziale. I filtri, i raggruppamenti e le aggregazioni devono essere eseguiti a livello di utente.

  • Final_select consente le funzioni di aggregazione COUNT DISTINCT, COUNT, SUM, AVG e STDDEV.

Per ulteriori dettagli su quali parole chiave SQL sono supportate per la privacy differenziale, vedere. Funzionalità SQL di AWS Clean Rooms Differential Privacy