語法引數傳回類型範例

REGEXP_SUBSTR 函數

搜尋規則運算式模式，傳回字串中的字元。REGEXP_SUBSTR 類似於 SUBSTRING 函數函數，但可讓您在字串中搜尋規則表達式模式。如果函數不能比對規則運算式與字串中的任何字元，則傳回一個空字串。如需規則表達式的詳細資訊，請參閱 POSIX 運算子和 Wikipedia 中的規則表達式。

語法


REGEXP_SUBSTR( source_string, pattern [, position [, occurrence [, parameters ] ] ] )

引數

source_string

要搜尋的字串運算式。

pattern

代表規則表達式模式的 UTF-8 字串常值。如需詳細資訊，請參閱POSIX 運算子。

position

正整數，表示在 source_string 內開始搜尋的位置。位置以字元數為基礎，而不是位元組，所以多位元組字元視為單一字元。預設為 1。如果 position 小於 1，則從 source_string 的第一個字元開始搜尋。如果 position 大於 source_string 中的字元數，則結果為空字串 ("")。

occurrence

正整數，表示要使用哪一個出現的模式。REGEXP_SUBSTR 略過前 occurrence -1 個相符項目。預設為 1。如果出現少於 1 個或大於 source_string 中的字元數，則會忽略搜尋，且結果為空白。

參數

一或多個字串常值，表示函數如何比對模式。可能值如下：

c - 進行區分大小寫比對。預設是使用區分大小寫比對。
i - 進行不區分大小寫比對。
e - 使用子運算式擷取子字串。

如果 pattern 包含子表達式，REGEXP_SUBSTR 使用 pattern 中的第一個子表達式來比對子字串。子運算式是用括號括起來的模式中的運算式。例如，對於模式 'This is a '，會比對第一個運算式和字串 'This is a (\\w+)' 後跟一個單詞。具有 e 參數的 REGEXP_SUBSTR 不會傳回 pattern，而是僅傳回子運算式內的字串。

REGEXP_SUBSTR 只考慮第一個子表達式；忽略其他子表達式。如果模式沒有子表達式，REGEXP_SUBSTR 會忽略 'e' 參數。
p - 使用 Perl 相容規則運算式 (PCRE) 方言解釋此模式。如需 PCRE 的詳細資訊，請參閱 Wikipedia 中的 Perl 相容規則表達式。

傳回類型

VARCHAR

範例

下列範例傳回電子郵件地址在 @ 和網域域名之間的部分。查詢的 users 資料來自 Amazon Redshift 範例資料。如需詳細資訊，請參閱範本資料庫。


SELECT email, regexp_substr(email,'@[^.]*')
FROM users
ORDER BY userid LIMIT 4;

                     email                     |      regexp_substr
-----------------------------------------------+--------------------------
 Suspendisse.tristique@nonnisiAenean.edu       | @nonnisiAenean
 amet.faucibus.ut@condimentumegetvolutpat.ca   | @condimentumegetvolutpat
 sed@lacusUtnec.ca                             | @lacusUtnec
 Cum@accumsan.com                              | @accumsan

下列範例會使用不區分大小寫的比對，傳回與第一次出現的字串 FOX 相對應的輸入部分。


SELECT regexp_substr('the fox', 'FOX', 1, 1, 'i');

 regexp_substr
---------------
 fox

下列範例會使用不區分大小寫的比對，傳回與第二次出現的字串 FOX 相對應的輸入部分。結果為空（非空值，長度 0)，因為沒有第二次出現。


SELECT regexp_substr('the fox', 'FOX', 1, 2, 'i');

 regexp_substr
---------------

下列範例會傳回以小寫字母開頭之輸入的第一部分。這在函數上與沒有 c 參數的相同 SELECT 陳述式完全相同。


SELECT regexp_substr('THE SECRET CODE IS THE LOWERCASE PART OF 1931abc0EZ.', '[a-z]+', 1, 1, 'c');

 regexp_substr
---------------
 abc

下列範例會使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞。它使用 ?= 運算子，該運算子在 PCRE 中具有特定的前瞻內涵。此範例會傳回對應於第二個這類字詞的輸入部分。


SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'p');

 regexp_substr
---------------
 a1234

下列範例會使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞。它使用 ?= 運算子，該運算子在 PCRE 中具有特定的前瞻內涵。此範例會傳回與第二個此類字詞對應的輸入部分，但與前一個範例不同，因為它使用不區分大小寫的比對。


SELECT regexp_substr('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 'ip');

 regexp_substr
---------------
 A1234

下列範例會使用子運算式，使用不區分大小寫的比對來尋找符合模式 'this is a (\\w+)' 的第二個字串。它傳回括號內的子運算式。


SELECT regexp_substr(
               'This is a cat, this is a dog. This is a mouse.',
               'this is a (\\w+)', 1, 2, 'ie');
           
 regexp_substr
---------------
 dog

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

REGEXP_REPLACE

REPEAT