演算子と関数
Amazon Redshift では、SUPER データを使用して、演算子と関数を駆使して大規模なデータセットに対して高度な分析を実行できます。SUPER データの演算子と関数は、Amazon Redshift テーブルに保存されている半構造化データの複雑な分析と操作を可能にする SQL コンストラクトです。
以下のセクションでは、Amazon Redshift で SUPER データに演算子と関数を使用して、半構造化データの可能性を最大限に引き出すための構文、例、ベストプラクティスについて説明します。
算術演算子
SUPER 値は、動的型付けを使用して、すべての基本的な算術演算子 +、-、*、/、% をサポートしています。結果として得られるオペレーションのタイプは SUPER のままです。バイナリ演算子 + を除くすべての演算子について、入力オペランドは数値でなければなりません。それ以外の場合、Amazon Redshift は null を返します。小数点値と浮動小数点値の区別は、Amazon Redshift がこれらの演算子を実行し、動的型が変更されない場合でも保持されます。ただし、乗算と除算を使用すると、小数点以下の縮尺が変わります。算術オーバーフローは依然としてクエリエラーを引き起こしますが、null に変更されません。バイナリ演算子 + 入力が数字の場合は加算を行い、入力が文字列の場合は連結を行います。一方のオペランドが文字列で、もう一方のオペランドが数値の場合、結果は null になります。次の例に示すように、SUPER 値が数値でない場合、単項接頭演算子 + および - は null を返します。
SELECT (c_orders[0]. o_orderkey + 0.5) * c_orders[0]. o_orderkey / 10 AS math FROM customer_orders_lineitem; math ---------------------------- 1757958232200.1500 (1 row)
動的型付けにより、SUPER の小数値が異なるスケールを変えることができます。Amazon Redshift では、10 進数値が異なる静的型であるかのように扱われ、すべての数学演算が許可されます。Amazon Redshift は、オペランドのスケールに基づいて、結果のスケールを動的に計算します。オペランドの 1 つが浮動小数点数の場合、Amazon Redshift はもう 1 つのオペランドを浮動小数点数に昇格し、結果を浮動小数点数として生成します。
算術関数
Amazon Redshift は、SUPER 列に対して次の算術関数をサポートしています。入力が数値でない場合、null を返します。
FLOOR。詳細については、「FLOOR 関数」を参照してください。
CEIL および CEILING。詳細については、「CEILING (または CEIL)関数」を参照してください。
ROUND。詳細については、「ROUND 関数」を参照してください。
TRUNC。詳細については、「TRUNC 関数」を参照してください。
ABS。詳細については、「ABS 関数」を参照してください。
次の例では、算術関数を使用してデータをクエリします。
SELECT x, FLOOR(x), CEIL(x), ROUND(x) FROM ( SELECT (c_orders[0]. o_orderkey + 0.5) * c_orders[0].o_orderkey / 10 AS x FROM customer_orders_lineitem ); x | floor | ceil | round --------------------+---------------+---------------+--------------- 1389636795898.0500 | 1389636795898 | 1389636795899 | 1389636795898
ABS 関数は、FLOOR、CEIL が実行される間、入力小数のスケールを保持します。ROUND は、入力小数点のスケールを削除します。
配列関数
Amazon Redshift は、次の配列構成とユーティリティ関数の配列、array_concat、subarray。array_flatten、get_array_length、および split_to_array をサポートしています。
他の SUPER 値を含む ARRAY 関数を使用して、Amazon Redshift データ型の値から SUPER 配列を構築できます。次の例では、可変関数 ARRAY を使用しています。
SELECT ARRAY(1, c.c_custkey, NULL, c.c_name, 'abc') FROM customer_orders_lineitem c; array ------------------------------------------------------- [1,8401,null,""Customer#000008401"",""abc""] [1,9452,null,""Customer#000009452"",""abc""] [1,9451,null,""Customer#000009451"",""abc""] [1,8251,null,""Customer#000008251"",""abc""] [1,5851,null,""Customer#000005851"",""abc""] (5 rows)
次の例では、ARRAY_CONCAT 関数で配列の連結を使用しています。
SELECT ARRAY_CONCAT(JSON_PARSE('[10001,10002]'),JSON_PARSE('[10003,10004]')); array_concat ------------------------------------ [10001,10002,10003,10004] (1 row)
次の例では、入力配列のサブセットを返す SUBARRAY 関数で配列操作を使用しています。
SELECT SUBARRAY(ARRAY('a', 'b', 'c', 'd', 'e', 'f'), 2, 3); subarray --------------- ["c","d","e"] (1 row))
次の例では、ARRAY_FLATTEN を使用して、複数のレベルの配列を単一の配列にマージします。
SELECT x, ARRAY_FLATTEN(x) FROM (SELECT ARRAY(1, ARRAY(2, ARRAY(3, ARRAY()))) AS x); x | array_flatten ----------------+--------------- [1,[2,[3,[]]]] | [1,2,3] (1 row)
配列関数 ARRAY_CONCAT および ARRAY_FLATTEN は、動的型付けのルールを使用します。入力が配列でない場合、エラーの代わりに null を返します。GET_ARRAY_LENGTH 関数は、オブジェクトまたは配列パスが与えられた SUPER 配列の長さを返します。
SELECT c_name FROM customer_orders_lineitem WHERE GET_ARRAY_LENGTH(c_orders) = ( SELECT MAX(GET_ARRAY_LENGTH(c_orders)) FROM customer_orders_lineitem );
次の例では、SPLIT_TO_ARRAY を使用して、文字列を文字列の配列に分割します。この関数は、任意のパラメータとして区切り文字を使用します。区切り文字がない場合、デフォルトはコンマです。
SELECT SPLIT_TO_ARRAY('12|345|6789', '|'); split_to_array --------------------- ["12","345","6789"] (1 row)