統計のスキーマ (statistics.json ファイル) - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

統計のスキーマ (statistics.json ファイル)

statistics.json ファイルに定義されているスキーマは、ベースラインに対して計算される統計パラメータと、取得されるデータを指定します。また、遅延圧縮スキームを使用した非常にコンパクトな分位数スケッチKLLである が使用するバケットも設定します。

{ "version": 0, # dataset level stats "dataset": { "item_count": number }, # feature level stats "features": [ { "name": "feature-name", "inferred_type": "Fractional" | "Integral", "numerical_statistics": { "common": { "num_present": number, "num_missing": number }, "mean": number, "sum": number, "std_dev": number, "min": number, "max": number, "distribution": { "kll": { "buckets": [ { "lower_bound": number, "upper_bound": number, "count": number } ], "sketch": { "parameters": { "c": number, "k": number }, "data": [ [ num, num, num, num ], [ num, num ][ num, num ] ] }#sketch }#KLL }#distribution }#num_stats }, { "name": "feature-name", "inferred_type": "String", "string_statistics": { "common": { "num_present": number, "num_missing": number }, "distinct_count": number, "distribution": { "categorical": { "buckets": [ { "value": "string", "count": number } ] } } }, #provision for custom stats } ] }
メモ
  • 指定されたメトリクスは、後の視覚化の変更 SageMaker で によって認識されます。必要に応じて、コンテナはより多くのメトリクスを出力できます。

  • KLL スケッチは認識されるスケッチです。カスタムコンテナは独自の表現を記述できますが、視覚化 SageMaker では によって認識されません。

  • デフォルトでは、ディストリビューションは 10 個のバケットでマテリアライズされます。これを変更することはできません。