本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Scala 中進行 AWS Glue ETL 指令碼程式設計
您可以在 GitHub 網站上的 AWS Glue 範例儲存庫
AWS Glue 支援 PySpark Scala 方言的延伸模組,適用於編寫擷取、轉換和載入 (ETL) 任務的指令碼。以下部分說明如何使用 ETL 指令碼的 AWS Glue Scala 程式庫和 AWS Glue API,並提供該程式庫的參考文件。
內容
- 使用 Scala
- Scala 指令碼範例
- Scala API 清單
- com.amazonaws.services.glue
- com.amazonaws.services.glue.ml
- com.amazonaws.services.glue.dq
- com.amazonaws.services.glue.types
- com.amazonaws.services.glue.util
- ChoiceOption
- DataSink
- DataSource 特徵
- DynamicFrame
- DynamicFrame 類別
- errorsCount
- applyMapping
- assertErrorThreshold
- 計數
- dropField
- dropFields
- dropNulls
- errorsAsDynamic框架
- 篩選條件
- getName
- getNumPartitions
- getSchemaIf计算
- isSchemaComputed
- javaToPython
- Join
- Map
- mergeDynamicFrames
- printSchema
- recomputeSchema
- Relationalize
- renameField
- Repartition
- resolveChoice
- 結構描述
- selectField
- selectFields
- Show
- 簡化
- Spigot
- splitFields
- Def splitRows
- stageErrorsCount
- toDF
- Unbox
- Unnest
- unnestDDBJson
- withFrameSchema
- Def withName
- withTransformationContext
- DynamicFrame 物件
- DynamicFrame 類別
- DynamicRecord
- GlueContext
- MappingSpec
- ResolveSpec
- ArrayNode
- BinaryNode
- BooleanNode
- ByteNode
- DateNode
- DecimalNode
- DoubleNode
- DynamicNode
- EvaluateDataQuality
- FloatNode
- FillMissingValues
- FindMatches
- FindIncrementalMatches
- IntegerNode
- LongNode
- MapLikeNode
- MapNode
- NullNode
- ObjectNode
- ScalarNode
- ShortNode
- StringNode
- TimestampNode
- GlueArgParser
- 任務