Função REGEXP_COUNT - Amazon Redshift

Função REGEXP_COUNT

Pesquisa uma string quanto a um padrão de expressão regular e retorna um inteiro que indica o número de vezes que o padrão especificado ocorre na string. Se nenhuma correspondência for encontrada, a função retornará 0. Para ter mais informações sobre expressões regulares, consulte Operadores POSIX e Expressão regular na Wikipédia.

Sintaxe

REGEXP_COUNT( source_string, pattern [, position [, parameters ] ] )

Argumentos

source_string

Uma string CHAR ou VARCHAR.

pattern

Um literal de string UTF-8 que representa um padrão de expressão regular. Para obter mais informações, consulte Operadores POSIX.

position

(Opcional) Um INTEGER positivo que indica a posição em source_string para começar a pesquisar. A posição é baseada no número de caracteres, e não bytes, de forma que caracteres multibyte são contados como caracteres simples. O padrão é 1. Se a posição for menor que 1, a pesquisa começará no primeiro caractere da source_string. Se a posição for maior que o número de caracteres na source_string, o resultado será 0.

parameters

(Opcional) Uma ou mais literais de string que indicam como a função corresponde ao padrão. Os valores possíveis são os seguintes:

  • c – Executa a correspondência diferenciando maiúsculas e minúsculas. O padrão é usar a correspondência diferenciando maiúsculas e minúsculas.

  • i – Executa a correspondência sem diferenciar maiúsculas de minúsculas.

  • p — Interpreta o padrão com o dialeto de expressão regular compatível com Perl (PCRE - Perl Compatible Regular Expression). Para ter mais informações sobre PCRE, consulte Perl Compatible Regular Expressions na Wikipédia.

Tipo de retorno

INTEGER

Exemplos

Para contar o número de vezes em que uma sequência de três letras ocorre, use o exemplo a seguir.

SELECT REGEXP_COUNT('abcdefghijklmnopqrstuvwxyz', '[a-z]{3}'); +--------------+ | regexp_count | +--------------+ | 8 | +--------------+

Para contar as ocorrências da string FOX usando correspondência sem diferenciar letras maiúsculas de minúsculas, use o exemplo a seguir.

SELECT REGEXP_COUNT('the fox', 'FOX', 1, 'i'); +--------------+ | regexp_count | +--------------+ | 1 | +--------------+

Para usar um padrão escrito no dialeto PCRE para localizar palavras contendo pelo menos um número e uma letra minúscula, use o exemplo a seguir. O exemplo usa o operador ?=, que tem uma conotação específica look-ahead em PCRE. Este exemplo conta o número de ocorrências de tais palavras, com correspondência diferenciando maiúsculas de minúsculas.

SELECT REGEXP_COUNT('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 'p'); +--------------+ | regexp_count | +--------------+ | 2 | +--------------+

Para usar um padrão escrito no dialeto PCRE para localizar palavras contendo pelo menos um número e uma letra minúscula, use o exemplo a seguir. Ele usa o operador ?=, que tem uma conotação específica em PCRE. Este exemplo conta o número de ocorrências de tais palavras, mas difere do exemplo anterior na medida em que usa correspondência sem diferenciar maiúsculas dee minúsculas.

SELECT REGEXP_COUNT('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 'ip'); +--------------+ | regexp_count | +--------------+ | 3 | +--------------+

O exemplo a seguir usa dados da tabela USERS do banco de dados de amostra TICKIT. Para obter mais informações, consulte Banco de dados de exemplo.

Para contar o número de vezes que nome de domínio de nível superior é org ou edu, use o exemplo a seguir.

SELECT email, REGEXP_COUNT(email,'@[^.]*\.(org|edu)') FROM users ORDER BY userid LIMIT 4; +-----------------------------------------------+--------------+ | email | regexp_count | +-----------------------------------------------+--------------+ | Etiam.laoreet.libero@sodalesMaurisblandit.edu | 1 | | Suspendisse.tristique@nonnisiAenean.edu | 1 | | amet.faucibus.ut@condimentumegetvolutpat.ca | 0 | | sed@lacusUtnec.ca | 0 | +-----------------------------------------------+--------------+