创建蓝图 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建蓝图

如何为自定义输出创建蓝图

Amazon Bedrock 数据自动化 (BDA) 允许您为 BDA 可以提取的任何文件类型创建自定义蓝图。您可以使用蓝图为输入文件定义所需的输出格式和提取逻辑。通过创建自定义蓝图,您可以定制 BDA 的输出以满足您的特定要求。

在一个项目中,你可以申请:

  • 多个文档蓝图,最多 40 个。这允许您在同一个项目中处理不同类型的文档,每个文档都有自己的自定义提取逻辑。

  • 一张图像蓝图。这样可以确保项目中图像处理的一致性。

  • 一个音频蓝图。

  • 一个视频蓝图。

创建蓝图

在 BDA 中创建蓝图的方法有两种:

  • 使用蓝图提示符

  • 手动创建蓝图

注意

您不能使用蓝图提示生成音频蓝图

使用蓝图提示符

蓝图提示符为创建蓝图提供了一个基于自然语言的引导式界面。要使用提示创建蓝图,请执行以下操作:

  1. 在 BDA 控制台中导航到 “蓝图” 部分。

  2. 单击 “创建蓝图”,然后选择 “使用蓝图提示”。

  3. 为蓝图选择数据类型(文档、图像、音频或视频)。

  4. 用自然语言描述要提取的字段和数据。例如:“从发票中提取发票编号、总金额和供应商名称。”

  5. 提示将根据您的描述生成蓝图。

  6. 查看生成的蓝图并进行必要的调整。蓝图提示基于单回合,这意味着您必须重新输入所有信息才能更改提示,而不仅仅是新信息。

  7. 保存并命名您的蓝图。

手动创建蓝图

对于更高级的用户或需要精细控制的用户,您可以手动创建蓝图:

  1. 在 BDA 控制台中导航到 “蓝图” 部分。

  2. 单击 “创建蓝图”,然后选择 “手动创建”。

  3. 为蓝图选择数据类型(文档、图像、音频或视频)。

  4. 定义要提取的字段,指定数据类型、格式和任何验证规则。

  5. 配置其他设置,例如文档分割或布局处理。

  6. 保存并命名您的蓝图。

您也可以使用蓝图 JSON 编辑器来创建或修改蓝图。这允许您直接通过文本编辑器调整蓝图的 JSON。

向项目添加蓝图

项目充当多模态内容处理工作流程的容器,而蓝图则为这些工作流程定义提取逻辑。您可以将蓝图添加到项目中,以便将蓝图应用于您使用该项目处理的文件。

要向项目添加蓝图,请执行以下操作:

  1. 导航到 BDA 控制台中的 “项目” 部分。

  2. 选择要向其添加蓝图的项目。

  3. 单击 “添加蓝图” 或 “管理蓝图”。

  4. 从可用蓝图列表中选择要添加的蓝图。

  5. 为蓝图配置任何项目特定的设置。

  6. 将更改保存到您的项目。

定义字段

首先,您可以创建一个字段来标识要提取或生成的信息,例如 product_type。对于每个字段,您需要提供描述、数据类型和推理类型。

要定义字段,您需要指定以下参数:

  • 描述:以自然语言解释该字段所代表的内容。此描述有助于了解该领域的背景和目的,有助于准确提取数据。

  • 类型:指定字段值的数据类型。BDA 支持以下类型:

    • 字符串:用于基于文本的值

    • 数字:用于数值

    • 布尔值:对于真值或假值

    • array:适用于可以具有相同类型的多个值的字段(例如,字符串数组或数字数组)

  • 推断类型:指示 BDA 如何处理字段值的响应生成。对于图像,BDA 仅支持推断的推理类型。这意味着 BDA 根据图像中显示的信息推断字段值。

对于视频,字段还包含粒度作为选项。有关此特征的更多信息,请参阅为视频创建蓝图。

下图显示了 Amazon Bedrock 控制台中的 “添加字段” 模块,其中包含以下示例字段和值:

  • 字段名称:产品类型

  • 类型:字符串

  • 说明:宣传的主要产品或服务是什么,例如服装、电子产品、食品和饮料等?

  • 提取类型:推断。

Amazon Bedrock 用户界面显示下拉菜单和用于指定图像字段的文本字段。

以下是 API 中相同字段定义在 JSON 架构中的样子的示例:

"product_type":{ "type": "string", "inferenceType": "inferred", "description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?" }

在本示例中:

  • 类型设置为字符串,指示 product_type 字段的值应基于文本。

  • InferenceType 设置为推断,指示 BDA 根据图像中显示的信息推断出该值。

  • 描述提供了其他背景信息,明确了该字段应标识图片中的商品类型。商品类型字段的示例值有:服装、电子产品以及食品或饮料。

通过为每个字段指定这些参数,您可以为 BDA 提供必要的信息,以便准确地从图像中提取和生成见解。

创建项目版本

处理项目时,您可以创建蓝图的版本。版本是蓝图的不可变快照,它保留了蓝图的当前配置和提取逻辑。可以在请求中传递此蓝图版本以开始处理数据,从而确保 BDA 根据创建版本时蓝图中指定的逻辑处理文档。

您可以使用CreateBlueprintVersion操作创建版本。

Amazon Bedrock 控制台还允许您创建和保存蓝图。保存蓝图时,会为该蓝图分配一个 ID。然后,您可以发布蓝图,该蓝图将创建无法编辑的该蓝图的快照版本。例如,如果与您的项目关联的蓝图为 “DocBlueprint”,则创建的项目版本将为 “DocBlueprint_1”。您将无法再对 “DocBlueprint_1” 进行任何更改,但您仍然可以编辑基础蓝图。如果您更改蓝图并再次发布,则会创建一个新版本,例如 “DocBlueprint_2”。蓝图版本可以复制并用作新蓝图的基础。