本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 Scala 中编写 AWS Glue ETL 脚本
您可以在 GitHub 网站的示例存储库AWS Glue
AWSGlue 支持 S PySpark cala 方言的扩展,用于脚本提取、转换和加载 (ETL) 作业。下面几节介绍如何在 ETL 脚本中使用 AWS Glue Scala 库和 AWS Glue API,并提供了用于库的参考文档。
目录
- 使用 Scala
- Scala 脚本示例
- Scala API 列表
- com.amazonaws.services.glue
- com.amazonaws.services.glue.ml
- com.amazonaws.services.glue.dq
- com.amazonaws.services.glue.types
- com.amazonaws.services.glue.util
- ChoiceOption
- DataSink
- DataSource 特征
- DynamicFrame
- DynamicFrame 班级
- errorsCount
- applyMapping
- assertErrorThreshold
- 计数
- dropField
- dropFields
- dropNulls
- errorsAsDynamic框架
- 筛选条件
- getName
- getNumPartitions
- getSchemaIf已计算
- isSchemaComputed
- javaToPython
- Join
- 映射
- mergeDynamicFrames
- printSchema
- recomputeSchema
- Relationalize
- renameField
- Repartition
- resolveChoice
- 架构
- selectField
- selectFields
- Show
- Spigot
- splitFields
- Def splitRows
- stageErrorsCount
- toDF
- Unbox
- Unnest
- unnestDDBJson
- withFrameSchema
- Def withName
- withTransformationContext
- DynamicFrame 对象
- DynamicFrame 班级
- DynamicRecord
- GlueContext
- MappingSpec
- ResolveSpec
- ArrayNode
- BinaryNode
- BooleanNode
- ByteNode
- DateNode
- DecimalNode
- DoubleNode
- DynamicNode
- EvaluateDataQuality
- FloatNode
- FillMissingValues
- FindMatches
- FindIncrementalMatches
- IntegerNode
- LongNode
- MapLikeNode
- MapNode
- NullNode
- ObjectNode
- ScalarNode
- ShortNode
- StringNode
- TimestampNode
- GlueArgParser
- 任务