本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
MURMUR3_32_HASH 函數
MURMUR3_32_HASH 函數會運算所有常見資料類型的 32 位元 Murmur3A 非加密雜湊,包括數值和字串類型。
語法
MURMUR3_32_HASH(value [, seed])
引數
- 值
-
要雜湊的輸入值。 AWS Clean Rooms 雜湊輸入值的二進位表示法。此行為類似於 FNV_HASH,但值會轉換為 Apache Iceberg 32 位元 Murmur3 雜湊規格
指定的二進位表示法。 - seed
-
雜湊函數的INT種子。此為選用引數。如果未提供, AWS Clean Rooms 會使用預設種子 0。這會允許組合多個欄位的雜湊,而無須進行轉換或串連。
傳回類型
函數會傳回 INT。
範例
下列範例會傳回數字的 Murmur3 雜湊、字串 'AWS Clean Rooms' 和兩者的串連。
select MURMUR3_32_HASH(1); MURMUR3_32_HASH ---------------------- -5968735742475085980 (1 row)
select MURMUR3_32_HASH('AWS Clean Rooms'); MURMUR3_32_HASH ---------------------- 7783490368944507294 (1 row)
select MURMUR3_32_HASH('AWS Clean Rooms', MURMUR3_32_HASH(1)); MURMUR3_32_HASH ---------------------- -2202602717770968555 (1 row)
使用須知
如要運算包含多個欄位資料表的雜湊,您可以運算第一個欄位的 Murmur3 雜湊,然後將其做為種子傳遞給第二個欄位的雜湊。然後,其會將第二個欄位的 Murmur3 雜湊做為種子傳遞至第三個欄位的雜湊。
以下範例會建立種子來雜湊包含多個欄位的資料表。
select MURMUR3_32_HASH(column_3, MURMUR3_32_HASH(column_2, MURMUR3_32_HASH(column_1))) from sample_table;
相同屬性可以用來運算字串串連的雜湊。
select MURMUR3_32_HASH('abcd'); MURMUR3_32_HASH --------------------- -281581062704388899 (1 row)
select MURMUR3_32_HASH('cd', MURMUR3_32_HASH('ab')); MURMUR3_32_HASH --------------------- -281581062704388899 (1 row)
雜湊函數會使用輸入的類型來判斷要雜湊的位元組數。如有必要,其會使用轉換來強制使用特定類型。
以下範例使用不同的輸入類型來產生不同結果。
select MURMUR3_32_HASH(1::smallint); MURMUR3_32_HASH -------------------- 589727492704079044 (1 row)
select MURMUR3_32_HASH(1); MURMUR3_32_HASH ---------------------- -5968735742475085980 (1 row)
select MURMUR3_32_HASH(1::bigint); MURMUR3_32_HASH ---------------------- -8517097267634966620 (1 row)