REGEXP_INSTR 函數 - Amazon Redshift

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

REGEXP_INSTR 函數

在字串中搜尋規則表達式模式,並傳回整數指出相符子字串的開始位置或結尾位置。如果找不到相符項目,則函數會傳回 0。REGEXP_INSTR 類似於 POSITION 函數,但可讓您在字串中搜尋規則表達式模式。如需規則表達式的相關資訊,請參閱 POSIX 運算子

語法

REGEXP_INSTR( source_string, pattern [, position [, occurrence] [, option [, parameters ] ] ] ] )

引數

source_string

要搜尋的字串表達式,例如欄名。

pattern

代表規則運算式模式的 UTF-8 字串常值。如需詳細資訊,請參閱 POSIX 運算子

position

(選用) 正 INTEGER,表示在 source_string 內開始搜尋的位置。位置以字元數為基礎,而不是位元組,所以多位元組字元視為單一字元。預設值為 1。如果 position 小於 1,則從 source_string 的第一個字元開始搜尋。如果 position 大於 source_string 中的字元數,則結果為 0

occurrence

(選用) 正 INTEGER,表示要使用哪一個出現的模式。REGEXP_INSTR 略過前 occurrence-1 個相符項目。預設值為 1。如果 occurrence 小於 1 或大於 source_string 中的字元數,則忽略搜尋,且結果為 0

option

(選用) 此值指出要傳回相符項目第一個字元的位置 (0),還是相符項目後第一個字元的位置 (1)。非零值與 1 相同。預設值為 0

參數

(選用) 一或多個字串常值,表示函數如何比對模式。可能值如下:

  • c - 進行區分大小寫比對。預設是使用區分大小寫比對。

  • i - 進行不區分大小寫比對。

  • e - 使用子運算式擷取子字串。

    如果 pattern 包含子表達式,REGEXP_INSTR 使用 pattern 中的第一個子表達式來比對子字串。REGEXP_INSTR 只考慮第一個子表達式;忽略其他子表達式。如果模式沒有子表達式,REGEXP_INSTR 會忽略 'e' 參數。

  • p - 使用 Perl 相容規則運算式 (PCRE) 方言解釋此模式。

傳回類型

Integer

範例

下列範例使用 TICKIT 範例資料庫中 USERS 資料表的資料。如需詳細資訊,請參閱 範本資料庫

若要搜尋網域名稱開頭的 @ 字元,並傳回第一個相符項目的開始位置,請使用以下範例。

SELECT email, REGEXP_INSTR(email, '@[^.]*') FROM users ORDER BY userid LIMIT 4; +-----------------------------------------------+--------------+ | email | regexp_instr | +-----------------------------------------------+--------------+ | Etiam.laoreet.libero@sodalesMaurisblandit.edu | 21 | | Suspendisse.tristique@nonnisiAenean.edu | 22 | | amet.faucibus.ut@condimentumegetvolutpat.ca | 17 | | sed@lacusUtnec.ca | 4 | +-----------------------------------------------+--------------+

若要搜尋單字 Center 的變體,並傳回第一個相符項目的開始位置,請使用以下範例。

SELECT venuename, REGEXP_INSTR(venuename,'[cC]ent(er|re)$') FROM venue WHERE REGEXP_INSTR(venuename,'[cC]ent(er|re)$') > 0 ORDER BY venueid LIMIT 4; +-----------------------+--------------+ | venuename | regexp_instr | +-----------------------+--------------+ | The Home Depot Center | 16 | | Izod Center | 6 | | Wachovia Center | 10 | | Air Canada Centre | 12 | +-----------------------+--------------+

若要使用不區分大小寫的比對邏輯來尋找字串 FOX 第一次出現的開始位置,請使用下列範例。

SELECT REGEXP_INSTR('the fox', 'FOX', 1, 1, 0, 'i'); +--------------+ | regexp_instr | +--------------+ | 5 | +--------------+

若要使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞,請使用下列範例。它使用 ?= 運算子,該運算子在 PCRE 中具有特定的前瞻內涵。此範例會尋找第二個此類字詞的開始位置。

SELECT REGEXP_INSTR('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 0, 'p'); +--------------+ | regexp_instr | +--------------+ | 21 | +--------------+

若要使用 PCRE 方言撰寫的模式來尋找至少包含一個數字和一個小寫字母的字詞,請使用下列範例。它使用 ?= 運算子,該運算子在 PCRE 中具有特定的前瞻內涵。此範例會尋找第二個這類字詞的開始位置,但與前一個範例不同,因為它使用不區分大小寫的比對。

SELECT REGEXP_INSTR('passwd7 plain A1234 a1234', '(?=[^ ]*[a-z])(?=[^ ]*[0-9])[^ ]+', 1, 2, 0, 'ip'); +--------------+ | regexp_instr | +--------------+ | 15 | +--------------+