本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
PERCENTILE_CONT 函數
PERCENTILE_CONT 是採用連續分佈模型的反向分佈函數。它採用百分位數值和排序規格,且會傳回插入值,該值將根據排序規格落入給定的百分位數值。
PERCENTILE_CONT 在值排序後計算值之間的線性插值。此函數在列根據排序規格來排序後,使用彙總群組中的百分位數值 (P)
和非 Null 列數 (N)
來計算列號。此列號 (RN)
是根據公式 RN = (1+ (P*(N-1))
來計算。彙總函數的最終結果是以列號 CRN = CEILING(RN)
到 FRN = FLOOR(RN)
各列的值之間的線性插值來計算。
最終結果如下。
如果 (CRN = FRN = RN)
,則結果為 (value of expression from row at
RN)
否則結果如下:
(CRN - RN) * (value of expression for row at FRN) + (RN - FRN) * (value of expression
for row at CRN)
.
PERCENTILE_CONT 是僅限於運算節點的函數。如果查詢未參考使用者定義的資料表或 AWS Clean Rooms 系統資料表,則函數會傳回錯誤。
語法
PERCENTILE_CONT ( percentile ) WITHIN GROUP (ORDER BY expr)
引數
- percentile
-
介於 0 和 1 之間的數值常數。計算時會忽略 Null。
- WITHIN GROUP ( ORDER BY expr)
-
指定要排序和計算百分位數的數值或日期/時間值。
傳回值
傳回類型取決於 WITHIN GROUP 子句中 ORDER BY 表達式的資料類型。下表顯示每一個 ORDER BY 表達式資料類型的傳回類型。
輸入類型 | 傳回類型 |
---|---|
SMALLINT、整數、 BIGINT、數值、小數 | DECIMAL |
FLOAT、DOUBLE | DOUBLE |
DATE | DATE |
TIMESTAMP | TIMESTAMP |
TIMESTAMPTZ | TIMESTAMPTZ |
使用須知
如果 ORDER BY 表達式是以最大精確度 38 位數定義的 DECIMAL 資料類型,PERCENTILE_CONT 可能會傳回不準確的結果或錯誤。如果 PERCENTILE_CONT 函數的傳回值超過 38 位數,結果會截斷為適合長度,導致精確度降低。在插補期間,如果中間結果超過最大精確度,則會發生數值溢位,且函數會傳回錯誤。為了避免這些情況,建議使用精確度較低的資料類型,或將 ORDER BY 表達式轉換為較低精確度。
如果陳述式中多次呼叫會排序的彙總函數 (LISTAGG、PERCENTILE_CONT 或 MEDIAN),則所有呼叫必須使用相同的 ORDER BY 值。請注意,MEDIAN 會對表達式值套用隱含的 order by。
例如,下列陳述式會傳回錯誤。
select top 10 salesid, sum(pricepaid), percentile_cont(0.6) within group (order by salesid), median (pricepaid) from sales group by salesid, pricepaid; An error occurred when executing the SQL command: select top 10 salesid, sum(pricepaid), percentile_cont(0.6) within group (order by salesid), median (pricepaid) from sales group by salesid, pricepai... ERROR: within group ORDER BY clauses for aggregate functions must be the same
下列陳述式會成功執行。
select top 10 salesid, sum(pricepaid), percentile_cont(0.6) within group (order by salesid), median (salesid) from sales group by salesid, pricepaid;
範例
下列範例顯示 MEDIAN 產生與 PERCENTILE_CONT(0.5) 相同的結果。
select top 10 distinct sellerid, qtysold, percentile_cont(0.5) within group (order by qtysold), median (qtysold) from sales group by sellerid, qtysold; sellerid | qtysold | percentile_cont | median ---------+---------+-----------------+------- 1 | 1 | 1.0 | 1.0 2 | 3 | 3.0 | 3.0 5 | 2 | 2.0 | 2.0 9 | 4 | 4.0 | 4.0 12 | 1 | 1.0 | 1.0 16 | 1 | 1.0 | 1.0 19 | 2 | 2.0 | 2.0 19 | 3 | 3.0 | 3.0 22 | 2 | 2.0 | 2.0 25 | 2 | 2.0 | 2.0