REGEXP_SUBSTR 函數 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

REGEXP_SUBSTR 函數

搜尋規則運算式模式,傳回字串中的字元。REGEXP_SUBSTR 類似於 SUBSTRING 函數 函數,但可讓您在字串中搜尋規則表達式模式。如果函數不能比對規則運算式與字串中的任何字元,則傳回一個空字串。如需規則表達式的相關資訊,請參閱 POSIX 運算子

語法

REGEXP_SUBSTR( source_string, pattern [, position [, occurrence [, parameters ] ] ] )

引數

source_string

要搜尋的字串運算式。

pattern

代表規則運算式模式的 UTF-8 字串常值。如需詳細資訊,請參閱 POSIX 運算子

position

正整數,表示在 source_string 內開始搜尋的位置。位置以字元數為基礎,而不是位元組,所以多位元組字元視為單一字元。預設為 1。如果 position 小於 1,則從 source_string 的第一個字元開始搜尋。如果 position 大於 source_string 中的字元數,則結果為空字串 ("")。

occurrence

正整數,表示要使用哪一個出現的模式。REGEXP_SUBSTR 略過前 occurrence -1 個相符項目。預設為 1。如果 occurrence 小於 1 或大於 source_string 中的字元數,則忽略搜尋,且結果為 NULL。

參數

一或多個字串常值,表示函數如何比對模式。可能值如下:

  • c - 進行區分大小寫比對。預設是使用區分大小寫比對。

  • i - 進行不區分大小寫比對。

  • e - 使用子運算式擷取子字串。

    如果 pattern 包含子表達式,REGEXP_SUBSTR 使用 pattern 中的第一個子表達式來比對子字串。子運算式是用括號括起來的模式中的運算式。例如,對於模式 'This is a ',會比對第一個運算式和字串 'This is a (\\w+)' 後跟一個單詞。具有 e 參數的 REGEXP_SUBSTR 不會傳回 pattern,而是僅傳回子運算式內的字串。

    REGEXP_SUBSTR 只考慮第一個子表達式;忽略其他子表達式。如果模式沒有子表達式,REGEXP_SUBSTR 會忽略 'e' 參數。

  • p - 使用 Perl 相容規則運算式 (PCRE) 方言解釋此模式。

傳回類型

VARCHAR

範例

下列範例傳回電子郵件地址在 @ 和網域域名之間的部分。查詢的 users 資料來自 Amazon Redshift 範例資料。如需詳細資訊,請參閱 範本資料庫

SELECT email, regexp_substr(email,'@[^.]*') FROM users ORDER BY userid LIMIT 4; email | regexp_substr -----------------------------------------------+-------------------------- Suspendisse.tristique@nonnisiAenean.edu | @nonnisiAenean amet.faucibus.ut@condimentumegetvolutpat.ca | @condimentumegetvolutpat sed@lacusUtnec.ca | @lacusUtnec Cum@accumsan.com | @accumsan

下列範例會使用不區分大小寫的比對,傳回與第一次出現的字串 FOX 相對應的輸入部分。

SELECT regexp_substr('the fox', 'FOX', 1, 1, 'i'); regexp_substr --------------- fox

下列範例會使用不區分大小寫的比對,傳回與第二次出現的字串 FOX 相對應的輸入部分。結果為 NULL (空),因為沒有第二次出現。

SELECT regexp_substr('the fox', 'FOX', 1, 2, 'i'); regexp_substr ---------------

下列範例會傳回以小寫字母開頭之輸入的第一部分。這在函數上與沒有 c 參數的相同 SELECT 陳述式完全相同。

SELECT regexp_substr('THE SECRET CODE IS THE LOWERCASE PART OF 1931abc0EZ.', '[a-z]+', 1, 1, 'c'); regexp_substr --------------- abc

下列範例會使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞。它使用 ?= 運算子,該運算子在 PCRE 中具有特定的前瞻內涵。此範例會傳回對應於第二個這類字詞的輸入部分。

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'p'); regexp_substr --------------- a1234

下列範例會使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞。它使用 ?= 運算子,該運算子在 PCRE 中具有特定的前瞻內涵。此範例會傳回與第二個此類字詞對應的輸入部分,但與前一個範例不同,因為它使用不區分大小寫的比對。

SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'ip'); regexp_substr --------------- A1234

下列範例會使用子運算式,使用不區分大小寫的比對來尋找符合模式 'this is a (\\w+)' 的第二個字串。它傳回括號內的子運算式。

SELECT regexp_substr( 'This is a cat, this is a dog. This is a mouse.', 'this is a (\\w+)', 1, 2, 'ie'); regexp_substr --------------- dog