Amazon Managed Service for Apache Flink (Amazon MSF) は、以前は Amazon Kinesis Data Analytics for Apache Flink と呼ばれていました。
翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Managed Service for Apache Flink 1.19
Managed Service for Apache Flink が Apache Flink バージョン 1.19.1 をサポートするようになりました。このセクションでは、Apache Flink 1.19.1 の Managed Service for Apache Flink サポートで導入された主な新機能と変更点について説明します。
注記
以前にサポートされているバージョンの Apache Flink を使用していて、既存のアプリケーションを Apache Flink 1.19.1 にアップグレードする場合は、インプレース Apache Flink バージョンアップグレードを使用してアップグレードできます。詳細については、「Apache Flink のインプレースバージョンアップグレードを使用する」を参照してください。インプレースバージョンアップグレードでは、スナップショット、ログ、メトリクス、タグ、Flink 設定など、Apache Flink バージョン全体で単一の ARN に対するアプリケーションのトレーサビリティを維持します。
サポートされている機能
Apache Flink 1.19.1 では、名前付きパラメータ、カスタムソース並列処理、さまざまな Flink 演算子のさまざまな状態 TTLs など、SQL API の改善が導入されています。
サポートされている機能 | 説明 | Apache Flink ドキュメントリファレンス |
---|---|---|
SQL API: SQL Hint を使用した異なるステート TTLsの設定をサポート | ユーザーは、ストリームの通常の結合とグループ集計で状態 TTL を設定できるようになりました。 | FLIP-373: SQL Hint を使用した異なる状態 TTLsの設定 |
SQL API: 関数と呼び出しプロシージャの名前付きパラメータのサポート | ユーザーは、パラメータの順序に依存するのではなく、名前付きパラメータを関数で使用できるようになりました。 | FLIP-378: 関数と呼び出しプロシージャの名前付きパラメータのサポート |
SQL API: SQL ソースの並列処理の設定 | ユーザーは SQL ソースの並列処理を指定できるようになりました。 | FLIP-367: Table/SQL ソースの並列処理の設定をサポート |
SQL API: セッションウィンドウ TVF のサポート | ユーザーはセッションウィンドウ Table-Valued 関数を使用できるようになりました。 | FLINK-24024: セッションウィンドウ TVF のサポート |
SQL API: ウィンドウ TVF 集約が変更ログ入力をサポート | ユーザーは、変更ログ入力でウィンドウ集約を実行できるようになりました。 | FLINK-20281: ウィンドウ集約が変更ログストリーム入力をサポート |
Python 3.11 のサポート |
Flink は Python 3.11 をサポートするようになりました。Python 3.10 と比較して 10~60% 高速です。詳細については、「Python 3.11 の最新情報 |
FLINK-33030: Python 3.11 サポートの追加 |
TwoPhaseCommitting シンクのメトリクスを提供する | ユーザーは、2 つのフェーズのコミットシンクでコミッターのステータスに関する統計を表示できます。 | FLIP-371: TwoPhaseCommittingSink でのコミット作成の初期化コンテキストを提供する |
ジョブの再起動とチェックポイントのためのトレースレポーター |
ユーザーはチェックポイントの期間と勇敢な傾向に関するトレースをモニタリングできるようになりました。Amazon Managed Service for Apache Flink では、デフォルトで Slf4j トレースレポーターが有効になっているため、ユーザーはアプリケーションの CloudWatch Logs を通じてチェックポイントとジョブのトレースをモニタリングできます。 | FLIP-384: TraceReporter を導入し、それを使用してチェックポイントトレースと復旧トレースを作成する |
注記
サポートケース
オプトイン機能 | 説明 | Apache Flink ドキュメントリファレンス |
---|---|---|
ソースがバックログを処理しているときにチェックポイント間隔を大きくするサポート | ユーザーは特定のジョブ要件に合わせて設定を調整する必要があるため、これはオプトイン機能です。 | FLIP-309: ソースがバックログを処理しているときにチェックポイント間隔を大きくするサポート |
System.out と System.err を Java ログにリダイレクトする | これはオプトイン機能です。Amazon Managed Service for Apache Flink では、本番環境でのベストプラクティスはネイティブ Java ロガーを使用することであるため、デフォルトの動作は System.out および System.err からの出力を無視することです。 | FLIP-390: システム出力とエラーをサポートして LOG にリダイレクトするか、破棄する |
Apache Flink 1.19.1 リリースドキュメントについては、「Apache Flink ドキュメント v1.19.1
Amazon Managed Service for Apache Flink 1.19.1 の変更点
デフォルトで有効になっている Trace Reporter のログ記録
Apache Flink 1.19.1 では、チェックポイントとリカバリのトレースが導入され、ユーザーはチェックポイントとジョブのリカバリの問題をより適切にデバッグできるようになりました。Amazon Managed Service for Apache Flink では、これらのトレースは CloudWatch ログストリームにログインされるため、ユーザーはジョブの初期化に費やされた時間を分割し、チェックポイントの履歴サイズを記録できます。
デフォルトの再起動戦略が指数遅延になりました
Apache Flink 1.19.1 では、指数遅延再起動戦略が大幅に改善されています。Flink 1.19.1 以降の Amazon Managed Service for Apache Flink では、Flink ジョブはデフォルトで指数遅延再起動戦略を使用します。つまり、ユーザージョブは一時的なエラーから迅速に回復しますが、ジョブの再起動が続く場合、外部システムを過負荷にすることはありません。
バックポートされたバグ修正
Amazon Managed Service for Apache Flink バックポートは、Flink コミュニティからの重大な問題を修正します。つまり、ランタイムは Apache Flink 1.19.1 リリースとは異なります。以下は、バックポートしたバグ修正のリストです。
Apache Flink JIRA リンク | 説明 |
---|---|
FLINK-35531 |
この修正は、HDFS への書き込みが遅くなる 1.17.0 で導入されたパフォーマンスの低下に対処します。 |
FLINK-35157 |
この修正は、ウォーターマーク整列のソースがサブタスクを終了した場合に Flink ジョブがスタックする問題に対処します。 |
FLINK-34252 |
この修正は、誤った IDLE ウォーターマーク状態になるウォーターマーク生成の問題に対処します。 |
FLINK-34252 |
この修正は、システム呼び出しを減らすことで、ウォーターマークの生成中のパフォーマンスの低下に対処します。 |
FLINK-33936 |
この修正により、テーブル API でのミニバッチ集約中にレコードが重複する問題が解決されます。 |
FLINK-35498 |
この修正は、テーブル API UDFs。 |
FLINK-33192 |
この修正は、タイマーの不適切なクリーンアップによるウィンドウオペレーターの状態メモリリークの問題に対処します。 |
FLINK-35069 |
この修正は、Flink ジョブがウィンドウの最後にタイマーをトリガーして停止した場合の問題に対処します。 |
FLINK-35832 |
この修正は、IFNULL が誤った結果を返す場合の問題に対処します。 |
FLINK-35886 |
この修正は、バックプレッシャーされたタスクがアイドル状態と見なされる場合の問題に対処します。 |
コンポーネント
コンポーネント | バージョン |
---|---|
Java | 11 (推奨) |
Python |
3.11 |
Kinesis Data Analytics Flink Runtime (aws-kinesisanalytics-runtime) | 1.2.0 |
Connector | 使用可能なコネクタの詳細については、「Apache Flink コネクタ」を参照してください。 |
「Apache Beam (Beamアプリケーションのみ) |
バージョン 2.61.0 から。詳細については、「Flink バージョンの互換性 |
既知の問題
Amazon Managed Service for Apache Flink Studio
Studio は Apache Zeppelin ノートブックを使用して、Apache Flink ストリーム処理アプリケーションの開発、デバッグ、実行のための単一インターフェイスの開発エクスペリエンスを提供します。Flink 1.19 のサポートを有効にするには、Zeppelin の Flink インタープリタのアップグレードが必要です。この作業は Zeppelin コミュニティでスケジュールされており、完了したらこれらのメモを更新します。Amazon Managed Service for Apache Flink Studio で Flink 1.15 を引き続き使用できます。詳細については、「Studio ノートブックの作成」を参照してください。