Configurazione dell'estensione pg_cron Concessione delle autorizzazioni per utilizzare pg_cron agli utenti del database Programmazione di processi pg_cron Riferimento per l'estensione pg_cron

Pianificazione della manutenzione con l'estensione PostgreSQL pg_cron

Puoi utilizzare l'estensione PostgreSQL pg_cron per pianificare i comandi di manutenzione all'interno di un database PostgreSQL. Per ulteriori informazioni sull'estensione, consulta Che cos'è pg_cron? nella documentazione di pg_cron.

L'estensione pg_cron è supportata sul motore Aurora PostgreSQL versioni 12.6 e successive

Per ulteriori informazioni sull'uso di pg_cron, consulta Schedule jobs with pg_cron on your RDS for PostgreSQL or your Aurora PostgreSQL-Compatible Edition databases (Pianificazione dei processi con pg_cron sui database RDS per PostgreSQL o Aurora edizione compatibile con PostgreSQL).

Argomenti

Configurazione dell'estensione pg_cron
Concessione delle autorizzazioni per utilizzare pg_cron agli utenti del database
Programmazione di processi pg_cron
Riferimento per l'estensione pg_cron

Configurazione dell'estensione pg_cron

Configura l'estensione pg_cron come riportato di seguito:

Modifica il gruppo di parametri personalizzati associato all'istanza database PostgreSQL aggiungendo pg_cron al valore del parametro shared_preload_libraries.

Per rendere effettive le modifiche apportate al gruppo di parametri, riavvia l'istanza database PostgreSQL. Per ulteriori informazioni sull'utilizzo dei gruppi di parametri, consulta Amazon Aurora PostgreSQL parametri.
Dopo il riavvio dell'istanza database PostgreSQL, esegui il comando riportato di seguito utilizzando un account che dispone delle autorizzazioni rds_superuser. Ad esempio, se hai utilizzato le impostazioni di default quando hai creato il cluster di database Aurora PostgreSQL, connettiti come utente postgres e crea l'estensione.
```
CREATE EXTENSION pg_cron;
```
Lo scheduler pg_cron è impostato nel database PostgreSQL predefinito denominato postgres. Gli oggetti pg_cron vengono creati in questo database postgres e tutte le azioni di pianificazione vengono eseguite in questo database.
Puoi usare le impostazioni predefinite oppure puoi pianificare i processi da eseguire in altri database all'interno dell'istanza database di PostgreSQL. Per pianificare i processi per altri database all'interno dell'istanza database di PostgreSQL, consulta l'esempio in Pianificazione di un processo cron per un database diverso da quello predefinito.

Concessione delle autorizzazioni per utilizzare pg_cron agli utenti del database

L'installazione dell'estensione pg_cron richiede privilegi rds_superuser. Tuttavia, le autorizzazioni per utilizzare pg_cron possono essere concesse (da un membro del gruppo/ruolo rds_superuser) ad altri utenti del database, in modo che possano pianificare i propri lavori. Ti consigliamo di concedere le autorizzazioni allo schema cron solo se in base alle esigenze se migliora le operazioni nell'ambiente di produzione.

Per concedere a un database l'autorizzazione utente nello schema cron, esegui il seguente comando:


postgres=> GRANT USAGE ON SCHEMA cron TO db-user;

Questo dà db-user il permesso di accedere allo cron schema per pianificare i cron job per gli oggetti a cui hanno i permessi di accesso. Se l'utente del database non dispone di autorizzazioni, il processo non va a buon fine dopo aver pubblicato il messaggio di errore nel file postgresql.log, come mostrato di seguito:


2020-12-08 16:41:00 UTC::@:[30647]:ERROR: permission denied for table table-name
2020-12-08 16:41:00 UTC::@:[27071]:LOG: background worker "pg_cron" (PID 30647) exited with exit code 1

In altre parole, assicuratevi che gli utenti del database a cui sono concesse le autorizzazioni sullo cron schema dispongano anche delle autorizzazioni sugli oggetti (tabelle, schemi e così via) che intendono pianificare.

Nella tabella vengono inoltre registrati i dettagli del cron job e del suo esito positivo o negativo. cron.job_run_details Per ulteriori informazioni, consulta Tabelle per la pianificazione dei processi e l'acquisizione dello stato .

Programmazione di processi pg_cron

Nelle sezioni seguenti viene illustrato come è possibile pianificare varie attività di gestione utilizzando le attività pg_cron.

Nota

Quando crei processi pg_cron, controlla che l'impostazione max_worker_processes sia maggiore del numero di cron.max_running_jobs. Un processo pg_cron non riesce se i processi worker in background vengono esauriti. Il numero predefinito di processi pg_cron è 5. Per ulteriori informazioni, consulta Parametri per la gestione dell'estensione pg_cron.

Argomenti

Vacuum di una tabella
Eliminazione della tabella della cronologia di pg_cron
Registrazione degli errori solo nel file postgresql.log
Pianificazione di un processo cron per un database diverso da quello predefinito

Vacuum di una tabella

Autovacuum gestisce la manutenzione del vacuum per la maggior parte dei casi. Tuttavia, potresti voler programmare un vacuum di una tabella specifica in un momento di tua scelta.

Di seguito è riportato un esempio di utilizzo della funzione cron.schedule per impostare un processo in modo da utilizzare VACUUM FREEZE su una tabella specifica ogni giorno alle 22:00 (GMT).


SELECT cron.schedule('manual vacuum', '0 22 * * *', 'VACUUM FREEZE pgbench_accounts');
 schedule
----------
1
(1 row)

Dopo l'esecuzione dell'esempio precedente, è possibile controllare la cronologia nella tabella cron.job_run_details come riportato di seguito.


postgres=> SELECT * FROM cron.job_run_details;
jobid  | runid | job_pid | database | username | command                        | status    | return_message | start_time                    | end_time
-------+-------+---------+----------+----------+--------------------------------+-----------+----------------+-------------------------------+-------------------------------
 1     | 1     | 3395    | postgres | adminuser| vacuum freeze pgbench_accounts | succeeded | VACUUM         | 2020-12-04 21:10:00.050386+00 | 2020-12-04 21:10:00.072028+00
(1 row)

Di seguito è riportata un'interrogazione della cron.job_run_details tabella per vedere i job falliti.


postgres=> SELECT * FROM cron.job_run_details WHERE status = 'failed';
jobid | runid | job_pid | database | username | command                       | status | return_message                                   | start_time                    | end_time
------+-------+---------+----------+----------+-------------------------------+--------+--------------------------------------------------+-------------------------------+------------------------------
 5    | 4     | 30339   | postgres | adminuser| vacuum freeze pgbench_account | failed | ERROR: relation "pgbench_account" does not exist | 2020-12-04 21:48:00.015145+00 | 2020-12-04 21:48:00.029567+00
(1 row)

Per ulteriori informazioni, consulta Tabelle per la pianificazione dei processi e l'acquisizione dello stato .

Eliminazione della tabella della cronologia di pg_cron

La tabella cron.job_run_details contiene una cronologia di processi cron che può crescere a dismisura nel tempo. Si consiglia di pianificare un processo che elimini questa tabella. Ad esempio, conservare una settimana di voci può essere sufficiente per la risoluzione dei problemi.

Nell'esempio seguente viene utilizzata la funzione cron.schedule per pianificare un processo che viene eseguito ogni giorno a mezzanotte per rimuovere la tabella cron.job_run_details. Il processo conserva solo gli ultimi sette giorni. Utilizza l'account rds_superuser per pianificare il processo come riportato di seguito.


SELECT cron.schedule('0 0 * * *', $$DELETE 
    FROM cron.job_run_details 
    WHERE end_time < now() - interval '7 days'$$);

Per ulteriori informazioni, consulta Tabelle per la pianificazione dei processi e l'acquisizione dello stato .

Registrazione degli errori solo nel file postgresql.log

Per disattivare la scrittura nella tabella cron.job_run_details, modifica il gruppo di parametri associato all'istanza database PostgreSQL e disattiva il parametro cron.log_run. L'estensione pg_cron non scrive più nella tabella e acquisisce gli errori solo nel file postgresql.log. Per ulteriori informazioni, consulta Modifica dei parametri in un gruppo di parametri DB in .

Utilizza il seguente comando per controllare il valore del parametro cron.log_run.


postgres=> SHOW cron.log_run;

Per ulteriori informazioni, consulta Parametri per la gestione dell'estensione pg_cron.

Pianificazione di un processo cron per un database diverso da quello predefinito

I metadati per pg_cron sono tutti contenuti nel database predefinito PostgreSQL denominato postgres. Poiché i worker in background vengono utilizzati per l'esecuzione dei processi cron di manutenzione, puoi pianificare un processo in uno qualsiasi dei database all'interno dell'istanza database PostgreSQL.

Nota

Solo gli utenti con rds_superuser ruolo o rds_superuser privilegi possono elencare tutti i cron job nel database. Gli altri utenti possono visualizzare solo i propri lavori nella cron.job tabella.

Nel database cron, pianifica il processo come si farebbe normalmente utilizzando cron.schedule.


postgres=> SELECT cron.schedule('database1 manual vacuum', '29 03 * * *', 'vacuum freeze test_table');

Con il ruolo rds_superuser, aggiorna la colonna del database per il processo appena creato in modo che venga eseguito in un altro database all'interno dell'istanza database PostgreSQL.
```
postgres=> UPDATE cron.job SET database = 'database1' WHERE jobid = 106;
```

Verifica eseguendo una query sulla tabella cron.job.


postgres=> SELECT * FROM cron.job;
jobid | schedule    | command                        | nodename  | nodeport | database | username  | active | jobname
------+-------------+--------------------------------+-----------+----------+----------+-----------+--------+-------------------------
106   | 29 03 * * * | vacuum freeze test_table       | localhost | 8192     | database1| adminuser | t      | database1 manual vacuum
  1   | 59 23 * * * | vacuum freeze pgbench_accounts | localhost | 8192     | postgres | adminuser | t      | manual vacuum
(2 rows)

Nota

In alcune situazioni, è possibile aggiungere un processo cron che si intende eseguire in un database diverso. In questi casi, il processo potrebbe essere eseguito nel database predefinito (postgres) prima di aggiornare la colonna del database corretta. Se il nome utente dispone delle autorizzazioni, il processo viene eseguito correttamente nel database predefinito.

Riferimento per l'estensione pg_cron

È possibile utilizzare i seguenti parametri, funzioni e tabelle con l'estensione pg_cron. Per ulteriori informazioni, consultare Che cos'è pg_cron? nella documentazione di pg_cron.

Argomenti

Parametri per la gestione dell'estensione pg_cron
Riferimento alla funzione: cron.schedule
Riferimento alla funzione: cron.unschedule
Tabelle per la pianificazione dei processi e l'acquisizione dello stato

Parametri per la gestione dell'estensione pg_cron

Di seguito è riportato l'elenco dei parametri che consentono di controllare il comportamento dell'estensione pg_cron.

Parametro	Descrizione
cron.database_name	Il database in cui vengono conservati i metadati `pg_cron`.
`cron.host`	Il nome host per connettersi a PostgressQL. Non è possibile modificare questo valore.
`cron.log_run`	Registra tutti i processi eseguiti nella tabella `job_run_details`. I valori sono `on` o `off`. Per ulteriori informazioni, consulta Tabelle per la pianificazione dei processi e l'acquisizione dello stato .
`cron.log_statement`	Registra tutte le istruzioni cron prima di eseguirle. I valori sono `on` o `off`.
`cron.max_running_jobs`	Numero massimo di processi che possono essere eseguiti contemporaneamente.
`cron.use_background_workers`	Utilizza i worker in background anziché le sessioni client. Non è possibile modificare questo valore.

Puoi utilizzare il comando SQL seguente per visualizzare questi parametri e i relativi valori.


postgres=> SELECT name, setting, short_desc FROM pg_settings WHERE name LIKE 'cron.%' ORDER BY name;

Riferimento alla funzione: cron.schedule

Questa funzione pianifica un processo cron. Il processo viene inizialmente pianificato nel database postgres predefinito. La funzione restituisce un valore bigint che rappresenta l'identificativo del processo. Per pianificare l'esecuzione di processi in altri database all'interno dell'istanza database di PostgreSQL, consulta l'esempio in Pianificazione di un processo cron per un database diverso da quello predefinito.

La funzione ha due diverse sintassi.

Sintassi


cron.schedule (job_name,
    schedule,
    command
);

cron.schedule (schedule,
    command
);

Parametri

Parametro	Descrizione
`job_name`	Il nome del processo cron.
`schedule`	Il testo che indica la pianificazione per il processo cron. Il formato è il formato cron standard.
`command`	Testo del comando da eseguire.

Esempi


postgres=> SELECT cron.schedule ('test','0 10 * * *', 'VACUUM pgbench_history');
 schedule
----------
      145
(1 row)

postgres=> SELECT cron.schedule ('0 15 * * *', 'VACUUM pgbench_accounts');
 schedule
----------
      146
(1 row)

Riferimento alla funzione: cron.unschedule

Questa funzione elimina un processo cron. Puoi specificare job_name o job_id. Una policy assicura che l'utente sia il proprietario e possa rimuovere la pianificazione per il processo. La funzione restituisce un valore Booleano che indica la riuscita o l'errore.

La funzione ha la seguente sintassi.

Sintassi


cron.unschedule (job_id);

cron.unschedule (job_name);

Parametri

Parametro	Descrizione
`job_id`	Un identificativo di processo restituito dalla funzione `cron.schedule` quando è stato pianificato il processo cron.
`job_name`	Il nome di un processo cron pianificato con la funzione `cron.schedule`.

Esempi


postgres=> SELECT cron.unschedule(108);
 unschedule
------------
 t
(1 row)

postgres=> SELECT cron.unschedule('test');
 unschedule
------------
 t
(1 row)

Tabelle per la pianificazione dei processi e l'acquisizione dello stato

Le seguenti tabelle vengono create e utilizzate per pianificare i processi cron e registrare il modo in cui i processi vengono completati.

Tabella Descrizione

Tabella	Descrizione
`cron.job`	Contiene i metadati relativi a ciascun processo pianificato. La maggior parte delle interazioni con questa tabella dovrebbe essere eseguita tramite le funzioni `cron.schedule` e `cron.unschedule`. Importante Si sconsiglia di concedere privilegi di aggiornamento/inserimento direttamente a questa tabella. In questo modo, si consente all'utente di aggiornare la colonna `username` da eseguire come `rds-superuser`.
`cron.job_run_details`	Contiene informazioni cronologiche sulle esecuzioni precedenti dei processi pianificati. Ciò è utile per analizzare lo stato, i messaggi restituiti e l'ora di inizio e di fine dall'esecuzione del processo. Nota Per evitare che questa tabella cresca in maniera indefinita, è necessario eliminarla su base regolare. Per un esempio, consulta Eliminazione della tabella della cronologia di pg_cron.

cron.job

Contiene i metadati relativi a ciascun processo pianificato. La maggior parte delle interazioni con questa tabella dovrebbe essere eseguita tramite le funzioni cron.schedule e cron.unschedule.

Importante

Si sconsiglia di concedere privilegi di aggiornamento/inserimento direttamente a questa tabella. In questo modo, si consente all'utente di aggiornare la colonna username da eseguire come rds-superuser.

cron.job_run_details

Contiene informazioni cronologiche sulle esecuzioni precedenti dei processi pianificati. Ciò è utile per analizzare lo stato, i messaggi restituiti e l'ora di inizio e di fine dall'esecuzione del processo.

Nota

Per evitare che questa tabella cresca in maniera indefinita, è necessario eliminarla su base regolare. Per un esempio, consulta Eliminazione della tabella della cronologia di pg_cron.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Gestione delle partizioni con l'estensione pg_partman

Utilizzo pgAudit per registrare l'attività del database