Ricerca di valori negli JSON array - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ricerca di valori negli JSON array

Per determinare se esiste un valore specifico all'interno di un array JSON con codifica, utilizzate la funzione. json_array_contains

La query seguente elenca i nomi degli utenti che partecipano a "project2".

WITH dataset AS ( SELECT * FROM (VALUES (JSON '{"name": "Bob Smith", "org": "legal", "projects": ["project1"]}'), (JSON '{"name": "Susan Smith", "org": "engineering", "projects": ["project1", "project2", "project3"]}'), (JSON '{"name": "Jane Smith", "org": "finance", "projects": ["project1", "project2"]}') ) AS t (users) ) SELECT json_extract_scalar(users, '$.name') AS user FROM dataset WHERE json_array_contains(json_extract(users, '$.projects'), 'project2')

Questa query restituisce un elenco di utenti.

+-------------+ | user | +-------------+ | Susan Smith | +-------------+ | Jane Smith | +-------------+

La seguente query di esempio elenca i nomi degli utenti che hanno completato progetti con il numero totale di progetti completati. Esegue le seguenti operazioni:

  • Utilizza istruzioni SELECT nidificate per chiarezza.

  • Estrae la matrice di progetti.

  • Converte la matrice in una matrice nativa di coppie chiave-valore utilizzando CAST.

  • Estrae ogni singolo elemento di matrice utilizzando l'operatore UNNEST.

  • Filtra i valori ottenuti in base ai progetti completati e li conta.

Nota

Quando si utilizza CAST to, MAP è possibile specificare l'elemento chiave come VARCHAR (String nativo in Presto), ma lasciare il valore cosìJSON, poiché i valori in MAP sono di tipi diversi: String per la prima coppia chiave-valore e Boolean per la seconda.

WITH dataset AS ( SELECT * FROM (VALUES (JSON '{"name": "Bob Smith", "org": "legal", "projects": [{"name":"project1", "completed":false}]}'), (JSON '{"name": "Susan Smith", "org": "engineering", "projects": [{"name":"project2", "completed":true}, {"name":"project3", "completed":true}]}'), (JSON '{"name": "Jane Smith", "org": "finance", "projects": [{"name":"project2", "completed":true}]}') ) AS t (users) ), employees AS ( SELECT users, CAST(json_extract(users, '$.projects') AS ARRAY(MAP(VARCHAR, JSON))) AS projects_array FROM dataset ), names AS ( SELECT json_extract_scalar(users, '$.name') AS name, projects FROM employees, UNNEST (projects_array) AS t(projects) ) SELECT name, count(projects) AS completed_projects FROM names WHERE cast(element_at(projects, 'completed') AS BOOLEAN) = true GROUP BY name

Questa query restituisce il seguente risultato:

+----------------------------------+ | name | completed_projects | +----------------------------------+ | Susan Smith | 2 | +----------------------------------+ | Jane Smith | 1 | +----------------------------------+