Conexión a Salesforce para la base de conocimientos de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conexión a Salesforce para la base de conocimientos de Amazon Bedrock

Salesforce es una herramienta de gestión de relaciones con los clientes (CRM) para gestionar los equipos de soporte, ventas y marketing. Puede conectarse a su instancia de Salesforce para su base de conocimientos de Amazon Bedrock mediante la consola de AWS administración de Amazon Bedrock o la (CreateDataSourceAPIconsulte Amazon Bedrock compatible y). SDKs AWS CLI

nota

El conector del origen de datos de Salesforce está en versión preliminar y sujeta a cambios.

Las fuentes de datos de Salesforce no admiten datos multimodales, como tablas, gráficos, diagramas u otras imágenes.

Actualmente, solo el almacén vectorial Amazon OpenSearch Serverless está disponible para su uso con esta fuente de datos.

Existen límites en cuanto al número de archivos y MB por archivo que pueden rastrearse. Consulte Cuotas de las bases de conocimientos.

Características admitidas

  • Detección automática de los campos principales del documento

  • Filtros de inclusión o exclusión de contenido

  • El contenido incremental se sincroniza para añadir, actualizar o eliminar contenido

  • OAuthAutenticación 2.0

Requisitos previos

En Salesforce, asegúrese de:

  • Toma nota de tu instancia URL de Salesforce. Por ejemplo, https://company.salesforce.com/. La instancia debe ejecutar una aplicación conectada de Salesforce.

  • Crear una aplicación conectada de Salesforce y configurar las credenciales del cliente. A continuación, para la aplicación seleccionada, copia la clave de consumidor (ID de cliente) y el secreto de consumidor (secreto de cliente) de la OAuth configuración. Para obtener más información, consulte la documentación de Salesforce sobre cómo crear una aplicación conectada y configurar una aplicación conectada para las credenciales de los clientes OAuth 2.0.

    nota

    En el caso de las aplicaciones conectadas de Salesforce, en Flujo de credenciales de cliente, asegúrese de buscar y seleccionar el nombre de usuario o el alias para las credenciales de sus clientes en el campo Ejecutar como.

En su AWS cuenta, asegúrese de:

  • Guarde sus credenciales de autenticación en AWS Secrets Manager secreto y anote el nombre del recurso de Amazon (ARN) del secreto. Siga las instrucciones de la sección Configuración de la conexión que aparecen en esta página para incluir los pares clave-valor que deben incluirse en el secreto.

  • Incluir los permisos necesarios para conectarse al origen de datos en la política de roles y permisos de AWS Identity and Access Management (IAM) de su base de conocimientos. Para obtener información sobre los permisos necesarios para que esta fuente de datos se añada a su IAM función de base de conocimientos, consulte Permisos para acceder a las fuentes de datos.

nota

Si usa la consola, puede ir AWS Secrets Manager a para agregar su secreto o usar uno existente como parte del paso de configuración de la fuente de datos. El IAM rol con todos los permisos necesarios se puede crear automáticamente como parte de los pasos de la consola para crear una base de conocimientos. Una vez que haya configurado la fuente de datos y otras configuraciones, el IAM rol con todos los permisos necesarios se aplicará a su base de conocimientos específica.

Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No recomendamos reutilizar las credenciales y los secretos en distintos orígenes de datos.

Configuración de la conexión

Para conectarse a la instancia de Salesforce, debe proporcionar la información de configuración necesaria para que Amazon Bedrock pueda acceder a sus datos y rastrearlos. También debe seguir los Requisitos previos.

En esta sección se incluye un ejemplo de configuración para este origen de datos.

Para obtener más información sobre la detección de campos de documento, los filtros de inclusión o exclusión, la sincronización incremental, las credenciales de autenticación secretas y su funcionamiento, seleccione lo siguiente:

El conector del origen de datos detecta y rastrea automáticamente todos los campos de metadatos principales de sus documentos o del contenido. Por ejemplo, el conector del origen de datos puede rastrear el equivalente del cuerpo del documento de sus documentos, el título del documento, la fecha de creación o modificación del documento u otros campos principales que puedan aplicarse a los documentos.

importante

Si su contenido incluye información confidencial, Amazon Bedrock podría responder utilizando información confidencial.

Puede aplicar operadores de filtrado a los campos de metadatos para mejorar aún más la relevancia de las respuestas. Por ejemplo, documente “epoch_modification_time” o el número de segundos transcurridos desde el 1 de enero de 1970 hasta que se actualizó el documento por última vez. Puede filtrar por los datos más recientes, donde “epoch_modification_time” es mayor que un número determinado. Para obtener más información sobre los operadores de filtrado que puede aplicar a los campos de metadatos, consulte Metadatos y filtrado.

Puede incluir o excluir el rastreo de determinado contenido. Por ejemplo, puede especificar un patrón de prefix/regular expression pattern to skip crawling any file that contains “private” in the file name. You could also specify an inclusion prefix/regular expresión de exclusión para incluir determinadas entidades o tipos de contenido. Si especifica un filtro de inclusión y exclusión y ambos coinciden con un documento, el filtro de exclusión tiene prioridad y el documento no se rastrea.

Un ejemplo de patrón de expresiones regulares para excluir o filtrar campañas que contienen la palabra “privado” en el nombre del archivo: “.*privado.*”.

Puede aplicar filtros de inclusión o exclusión a los siguientes tipos de contenido:

  • Account: número o identificador de la cuenta

  • Attachment: nombre del archivo asociado con su extensión

  • Campaign: nombre de la campaña e identificadores asociados

  • ContentVersion: versión del documento e identificadores asociados

  • Partner: campos de información sobre los socios, incluidos los identificadores asociados

  • Pricebook2: nombre de la lista de productos o precios

  • Case: número de consulta o problema del cliente y otros campos de información, incluidos los identificadores asociados (tenga en cuenta que pueden contener información personal y que puede optar por excluirla o filtrarla)

  • Contact: campos de información del cliente (tenga en cuenta que pueden contener información personal y que puede optar por excluirla o filtrarla)

  • Contract: nombre del contrato e identificadores asociados

  • Document: nombre del archivo con su extensión

  • Idea: campos de información de la idea e identificadores asociados

  • Lead: campos de información del nuevo cliente potencial (tenga en cuenta que pueden contener información personal y que puede optar por excluirla o filtrarla)

  • Opportunity: campos de información de la idea o venta pendientes e identificadores asociados

  • Product2: campos de información del producto e identificadores asociados

  • Solution: nombre de la solución para una consulta o problema de un cliente e identificadores asociados

  • Task: campos de información de la tarea e identificadores asociados

  • FeedItem: identificador de la publicación del feed de conversación

  • FeedComment: identificador de la publicación del feed de chat a la que pertenecen los comentarios

  • Knowledge__kav: versión del artículo de conocimiento e identificadores asociados

  • User: alias de usuario dentro de su organización

  • CollaborationGroup: nombre del grupo de chat (único)

El conector de la fuente de datos rastrea el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincroniza con la base de conocimientos. Amazon Bedrock puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido y rastrear el contenido que ha cambiado desde la última sincronización. Al sincronizar el origen de datos con la base de conocimientos por primera vez, todo el contenido se rastrea de forma predeterminada.

Para sincronizar la fuente de datos con la base de conocimientos, usa StartIngestionJobAPIo selecciona tu base de conocimientos en la consola y selecciona Sincronizar en la sección de información general de la fuente de datos.

importante

Todos los datos que sincronice desde el origen de datos estarán disponibles para cualquier persona que tenga permisos bedrock:Retrieve para obtenerlos. Esto también puede incluir los datos con permisos de orígenes de datos controlados. Para obtener más información, consulte Permisos de la base de conocimientos.

(Para la autenticación OAuth 2.0) Sus credenciales de autenticación secretas AWS Secrets Manager deben incluir estos pares clave-valor:

  • consumerKey: app client ID

  • consumerSecret: app client secret

  • authenticationUrl: Salesforce instance URL or the URL to request the authentication token from

nota

Su clave secreta AWS Secrets Manager debe usar la misma región de su base de conocimientos.

Console
Conecta una instancia de Salesforce a tu base de conocimientos
  1. Siga los pasos que se indican en Cree una base de conocimientos en Amazon Bedrock Knowledge Bases y elija Salesforce como fuente de datos.

  2. Proporcione un nombre y una descripción opcional para la fuente de datos.

  3. Proporcione su instancia URL de Salesforce. Por ejemplo, https://company.salesforce.com/. La instancia debe ejecutar una aplicación conectada de Salesforce.

  4. En la sección Configuración avanzada, si lo desea, puede configurar lo siguiente:

    • KMSclave para el almacenamiento de datos transitorios. — Puede cifrar los datos transitorios y, al mismo tiempo, convertirlos en incrustaciones con la clave predeterminada o con su propia clave. Clave administrada de AWS KMS Para obtener más información, consulte Cifrado del almacenamiento de datos transitorios durante la ingesta de datos.

    • Política de eliminación de datos: puede eliminar las incrustaciones vectoriales de su fuente de datos que están almacenadas en el almacén de vectores de forma predeterminada o optar por conservar los datos del almacén de vectores.

  5. Proporcione la información de autenticación para conectarse a la instancia de Salesforce:

    1. Para la autenticación OAuth 2.0, vaya AWS Secrets Manager a para añadir sus credenciales de autenticación secretas o utilice un nombre de recurso de Amazon (ARN) existente para el secreto que ha creado. Su secreto debe contener la clave de consumidor de la aplicación Salesforce Connected App (ID de cliente), el secreto de consumidor (secreto de cliente) y la instancia de Salesforce URL o la instancia desde la URL que se solicita el token de autenticación. Para obtener más información, consulte la documentación de Salesforce sobre la creación de una aplicación conectada y la configuración de una aplicación conectada para las credenciales del cliente OAuth 2.0.

  6. (Opcional) En la sección Análisis y fragmentación del contenido, puede personalizar cómo analizar y fragmentar sus datos. Consulta los siguientes recursos para obtener más información sobre estas personalizaciones:

  7. Elija usar patrones de filtros o expresiones regulares para incluir o excluir determinado contenido. De lo contrario, se rastreará todo el contenido estándar.

  8. Siga eligiendo un modelo de incrustaciones y un almacén de vectores. Para ver los pasos restantes, regrese al paso Cree una base de conocimientos en Amazon Bedrock Knowledge Bases y continúe desde allí después de conectar la fuente de datos.

API

El siguiente es un ejemplo de una configuración para conectarse a Salesforce para la base de conocimientos de Amazon Bedrock. La fuente de datos se configura API con AWS CLI o con soporteSDK, como Python. Después de llamar CreateKnowledgeBase, llama CreateDataSourcepara crear su fuente de datos con la información de conexióndataSourceConfiguration.

Para obtener más información sobre las personalizaciones que puede aplicar a la ingestión mediante la inclusión del vectorIngestionConfiguration campo opcional, consulte. Personalice la ingesta de una fuente de datos

AWS Command Line Interface

aws bedrock create-data-source \ --name "Salesforce connector" \ --description "Salesforce data source connector for Amazon Bedrock to use content in Salesforce" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://salesforce-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE" \ --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}' salesforce-bedrock-connector-configuration.json { "salesforceConfiguration": { "sourceConfiguration": { "hostUrl": "https://company.salesforce.com/", "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Salesforce" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "Campaign", "inclusionFilters": [ ".*public.*" ], "exclusionFilters": [ ".*private.*" ] } ] } } } }, "type": "SALESFORCE" }