Conéctese a Salesforce para su base de conocimientos de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Conéctese a Salesforce para su base de conocimientos de Amazon Bedrock

Salesforce es una herramienta de gestión de las relaciones con los clientes (CRM) para gestionar los equipos de soporte, ventas y marketing. Puede conectarse a su instancia de Salesforce para su base de conocimiento de Amazon Bedrock mediante el AWS Consola de administración para Amazon Bedrock o CreateDataSourceAPI(consulte Amazon Bedrock compatible y SDKs AWS CLI).

nota

El conector de fuente de datos de Salesforce se encuentra en versión preliminar y está sujeto a cambios.

Actualmente, solo el almacén vectorial Amazon OpenSearch Serverless está disponible para su uso con esta fuente de datos.

Hay límites en cuanto al número de archivos y MB por archivo que se pueden rastrear. Consulte Cuotas para ver las bases de conocimiento.

Características admitidas

  • Detección automática de los campos principales del documento

  • Filtros de inclusión/exclusión de contenido

  • El contenido incremental se sincroniza para añadir, actualizar o eliminar contenido

  • OAuthAutenticación 2.0

Requisitos previos

En Salesforce, asegúrese de:

  • Tome nota de su instancia de Salesforce. URL Por ejemplo: https://company.salesforce.com/. La instancia debe ejecutar una aplicación Salesforce Connected.

  • Cree una aplicación conectada a Salesforce y configure las credenciales del cliente. A continuación, para la aplicación seleccionada, copie la clave de consumidor (ID de cliente) y el secreto de consumidor (secreto de cliente) de la OAuth configuración. Para obtener más información, consulte la documentación de Salesforce sobre la creación de una aplicación conectada y la configuración de una aplicación conectada para las credenciales de los clientes OAuth 2.0.

    nota

    En el caso de las aplicaciones conectadas de Salesforce, en Flujo de credenciales de cliente, asegúrese de buscar y seleccionar el nombre de usuario o el alias para las credenciales de sus clientes en el campo «Ejecutar como».

En tu AWS cuenta, asegúrate de:

  • Guarde sus credenciales de autenticación en un AWS Secrets Manager secreto y anote el nombre de recurso de Amazon (ARN) del secreto. Siga las instrucciones de configuración de la conexión que aparecen en esta página para incluir los pares clave-valor que deben incluirse en su secreto.

  • Incluya los permisos necesarios para conectarse a su fuente de datos en su AWS Identity and Access Management (IAM) política de roles y permisos para su base de conocimientos. Para obtener información sobre los permisos necesarios para esta fuente de datos para añadirla a su base de conocimientos IAM rol, consulte Permisos para acceder a las fuentes de datos.

nota

Si utilizas la consola, puedes ir a AWS Secrets Manager para añadir su secreto o utilizar uno existente como parte del paso de configuración de la fuente de datos. La IAM Puede crear un rol con todos los permisos necesarios como parte de los pasos de la consola para crear una base de conocimientos. Una vez que haya configurado la fuente de datos y otras configuraciones, el IAM el rol con todos los permisos necesarios se aplica a su base de conocimientos específica.

Le recomendamos que actualice o modifique con regularidad las credenciales y el secreto. Por su propia seguridad, proporcione solo el nivel de acceso necesario. No se recomienda reutilizar las credenciales y los secretos de todas las fuentes de datos.

Configuración de conexión

Para conectarse a su instancia de Salesforce, debe proporcionar la información de configuración necesaria para que Amazon Bedrock pueda acceder a sus datos y rastrearlos. También debe seguir las. Requisitos previos

En esta sección se incluye un ejemplo de configuración para esta fuente de datos.

Para obtener más información sobre la detección automática de campos de documentos, los filtros de inclusión/exclusión, la sincronización incremental, las credenciales de autenticación secretas y su funcionamiento, seleccione lo siguiente:

El conector de fuentes de datos detecta y rastrea automáticamente todos los campos de metadatos principales de sus documentos o contenido. Por ejemplo, el conector de fuentes de datos puede rastrear el cuerpo del documento equivalente al de los documentos, el título del documento, la fecha de creación o modificación del documento u otros campos principales que puedan aplicarse a los documentos.

importante

Si el contenido incluye información confidencial, Amazon Bedrock podría responder utilizando información confidencial.

Puede aplicar operadores de filtrado a los campos de metadatos para mejorar aún más la relevancia de las respuestas. Por ejemplo, documente «epoch_modification_time» o el número de segundos transcurridos desde el 1 de enero de 1970 hasta que se actualizó el documento por última vez. Puede filtrar por los datos más recientes, donde «epoch_modification_time» es mayor que un número determinado. Para obtener más información sobre los operadores de filtrado que puede aplicar a sus campos de metadatos, consulte Metadatos y filtrado.

Puedes incluir o excluir el rastreo de cierto contenido. Por ejemplo, puedes especificar un patrón de prefijo o expresión regular de exclusión para evitar el rastreo de cualquier archivo que contenga la palabra «privado» en el nombre del archivo. También puede especificar un patrón de prefijo o expresión regular de inclusión para incluir determinadas entidades o tipos de contenido. Si especificas un filtro de inclusión y exclusión y ambos coinciden con un documento, el filtro de exclusión tendrá prioridad y el documento no se rastreará.

Un ejemplo de patrón de expresiones regulares para excluir o filtrar campañas que contienen la palabra «privado» en el nombre de la campaña:». *privado.

Puede aplicar filtros de inclusión/exclusión a los siguientes tipos de contenido:

  • Account: Número/identificador de cuenta

  • Attachment: nombre del archivo adjunto con su extensión

  • Campaign: Nombre de la campaña e identificadores asociados

  • ContentVersion: Versión del documento e identificadores asociados

  • Partner: Campos de información sobre los socios, incluidos los identificadores asociados

  • Pricebook2: Nombre de la lista de productos/precios

  • Case: número de consulta o problema del cliente y otros campos de información, incluidos los identificadores asociados (tenga en cuenta que pueden contener información personal, que puede optar por excluirla o filtrarla)

  • Contact: Campos de información del cliente (tenga en cuenta que pueden contener información personal, que puede optar por excluirla o filtrarla)

  • Contract: Nombre del contrato e identificadores asociados

  • Document: nombre del archivo con su extensión

  • Idea: Campos de información de la idea e identificadores asociados

  • Lead: Posibles campos de información para nuevos clientes (tenga en cuenta que pueden contener información personal, que puede optar por excluirla o filtrarla)

  • Opportunity: Campos de información de venta/oferta pendientes e identificadores asociados

  • Product2: Campos de información del producto e identificadores asociados

  • Solution: nombre de la solución para una consulta o problema de un cliente e identificadores asociados

  • Task: Campos de información de tareas e identificadores asociados

  • FeedItem: Identificador de la publicación del feed de conversación

  • FeedComment: identificador de la publicación del feed de chat a la que pertenecen los comentarios

  • Knowledge__kav: Versión del artículo informativo e identificadores asociados

  • User: alias de usuario dentro de su organización

  • CollaborationGroup: nombre del grupo de Chatter (único)

El conector de fuentes de datos rastrea el contenido nuevo, modificado y eliminado cada vez que la fuente de datos se sincroniza con la base de conocimientos. Amazon Bedrock puede usar el mecanismo de la fuente de datos para realizar un seguimiento de los cambios en el contenido y rastrear el contenido que ha cambiado desde la última sincronización. Al sincronizar la fuente de datos con la base de conocimientos por primera vez, todo el contenido se rastrea de forma predeterminada.

Para sincronizar la fuente de datos con la base de conocimientos, usa StartIngestionJobAPIo selecciona tu base de conocimientos en la consola y selecciona Sincronizar en la sección de descripción general de la fuente de datos.

importante

Todos los datos que sincronice desde su fuente de datos estarán disponibles para cualquier persona que tenga bedrock:Retrieve permisos para recuperarlos. Esto también puede incluir cualquier dato con permisos de fuente de datos controlados. Para obtener más información, consulte Permisos de la base de conocimientos.

(Para la autenticación OAuth 2.0) Sus credenciales de autenticación secretas en AWS Secrets Manager debe incluir estos pares clave-valor:

  • consumerKey: app client ID

  • consumerSecret: app client secret

  • authenticationUrl: Salesforce instance URL or the URL to request the authentication token from

nota

Tu secreto en AWS Secrets Manager debe usar la misma región de su base de conocimientos.

Console

El siguiente es un ejemplo de una configuración para conectarse a Salesforce para su base de conocimientos de Amazon Bedrock. La fuente de datos se configura como parte de los pasos de creación de la base de conocimientos en la consola.

  1. Inicie sesión en el AWS Management Console utilice un IAMrol con permisos de Amazon Bedrock y abra la consola de Amazon Bedrock en. https://console.aws.amazon.com/bedrock/

  2. En el panel de navegación izquierdo, seleccione Bases de conocimiento.

  3. En la sección Bases de conocimiento, selecciona Crear base de conocimiento.

  4. Proporcione los detalles de la base de conocimientos.

    1. Proporcione el nombre de la base de conocimientos y la descripción opcional.

    2. Proporcione el AWS Identity and Access Management rol para los permisos de acceso necesarios para crear una base de conocimientos.

      nota

      La IAM Se puede crear un rol con todos los permisos necesarios como parte de los pasos de la consola para crear una base de conocimientos. Una vez que haya completado los pasos para crear una base de conocimientos, el IAM el rol con todos los permisos necesarios se aplica a su base de conocimientos específica.

    3. Cree las etiquetas que desee asignar a su base de conocimientos.

    Vaya a la siguiente sección para configurar su fuente de datos.

  5. Elija Salesforce como fuente de datos y proporcione los detalles de configuración de la conexión.

    1. Proporcione el nombre de la fuente de datos y la descripción opcional.

    2. Proporcione su instancia URL de Salesforce. Por ejemplo: https://company.salesforce.com/. La instancia debe ejecutar una aplicación Salesforce Connected.

    Compruebe la configuración avanzada. Si lo desea, puede cambiar la configuración seleccionada por defecto.

  6. Establezca su clave de cifrado de datos transitorios y su política de eliminación de datos en la configuración avanzada.

    En KMS key En su configuración, puede elegir una clave personalizada o utilizar la clave de cifrado de datos proporcionada por defecto.

    Al convertir sus datos en incrustaciones, Amazon Bedrock cifra sus datos transitorios con una clave que AWS posee y administra, de forma predeterminada. Puedes usar tu propia KMS clave. Para obtener más información, consulte Cifrado del almacenamiento de datos transitorios durante la ingesta de datos.

    Para configurar la política de eliminación de datos, puede elegir entre las siguientes opciones:

    • Eliminar: elimina todos los datos de la fuente de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de fuente de datos. Tenga en cuenta que el almacén de vectores en sí no se elimina, solo se eliminan los datos. Este indicador se ignora si un AWS se elimina la cuenta.

    • Conservar: conserva todos los datos de la fuente de datos que se convierten en incrustaciones vectoriales al eliminar una base de conocimientos o un recurso de fuente de datos. Tenga en cuenta que el almacén de vectores en sí no se elimina si elimina una base de conocimientos o un recurso de fuente de datos.

    Siga configurando la fuente de datos.

  7. Proporcione la información de autenticación para conectarse a su instancia de Salesforce:

    1. Para la autenticación OAuth 2.0, vaya a AWS Secrets Manager para añadir tus credenciales de autenticación secretas o utilizar un nombre de recurso de Amazon (ARN) existente para el secreto que has creado. Su secreto debe contener la clave de consumidor de la aplicación Salesforce Connected (ID de cliente), el secreto de consumidor (secreto de cliente) y la instancia URL de Salesforce URL a la que va a solicitar el token de autenticación. Para obtener más información, consulte la documentación de Salesforce sobre la creación de una aplicación conectada y la configuración de una aplicación conectada para las credenciales del cliente OAuth 2.0.

    Continúe configurando su fuente de datos.

  8. Elija utilizar patrones de filtros/expresiones regulares para incluir o excluir cierto contenido. De lo contrario, todo el contenido estándar se rastrea.

    Siga configurando la fuente de datos.

  9. Elija las configuraciones de fragmentación y análisis predeterminadas o personalizadas.

    1. Si elige una configuración personalizada, seleccione una de las siguientes opciones de fragmentación:

      • Fragmentación de tamaño fijo: el contenido se divide en fragmentos de texto del tamaño aproximado que hayas establecido. Puedes establecer el número máximo de fichas que no debe superar un fragmento y el porcentaje de superposición entre fragmentos consecutivos.

      • Fragmentación predeterminada: el contenido se divide en fragmentos de texto de hasta 300 fichas. Si un solo documento o contenido contiene menos de 300 fichas, el documento no se divide más.

      • Fragmentación jerárquica: contenido organizado en estructuras anidadas de fragmentos principales e secundarios. Usted establece el tamaño máximo del token del fragmento principal y el tamaño máximo del token del fragmento secundario. También ha establecido el número absoluto de fichas superpuestas entre los fragmentos principales consecutivos y los fragmentos secundarios consecutivos.

      • Fragmentación semántica: contenido organizado en fragmentos de texto o grupos de oraciones semánticamente similares. Establece el número máximo de oraciones que rodean a la oración objetiva/actual para agruparlas (tamaño del búfer). También estableces el umbral del percentil del punto de interrupción para dividir el texto en fragmentos significativos. La fragmentación semántica utiliza un modelo básico. Vista de Amazon Bedrock precios para obtener información sobre el costo de los modelos básicos.

      • Sin fragmentación: cada documento se trata como un único fragmento de texto. Es posible que desee preprocesar los documentos dividiéndolos en archivos separados.

      nota

      No puede cambiar la estrategia de fragmentación después de haber creado la fuente de datos.

    2. Puede optar por utilizar Amazon Bedrock es el modelo básico para analizar documentos con el fin de analizar más que el texto estándar. Puede analizar los datos tabulares de los documentos con su estructura intacta, por ejemplo. Vista de Amazon Bedrock precios para obtener información sobre el costo de los modelos básicos.

    3. Puede optar por utilizar un AWS Lambda función para personalizar su estrategia de fragmentación y la forma en que se tratan e ingieren los atributos/campos de los metadatos del documento. Proporcione el Amazon S3 ubicación del depósito para la entrada y salida de la función Lambda.

    Vaya a la siguiente sección para configurar su almacén de vectores.

  10. Elige un modelo para convertir tus datos en incrustaciones vectoriales.

    Cree un almacén de vectores para permitir Amazon Bedrock para almacenar, actualizar y gestionar las incrustaciones. Puede crear rápidamente un nuevo almacén de vectores o seleccionar uno de los almacenes de vectores compatibles que haya creado. Actualmente, solo el almacén vectorial Amazon OpenSearch Serverless está disponible para su uso con esta fuente de datos. Si crea un nuevo almacén de vectores, se configurará automáticamente una colección e índice de búsqueda vectorial de Amazon OpenSearch Serverless con los campos obligatorios. Si selecciona uno de los almacenes vectoriales compatibles, debe mapear los nombres de los campos vectoriales y los nombres de los campos de metadatos.

    Vaya a la siguiente sección para revisar las configuraciones de la base de conocimientos.

  11. Compruebe los detalles de su base de conocimientos. Puede editar cualquier sección antes de continuar con la creación de su base de conocimientos.

    nota

    El tiempo que se tarda en crear la base de conocimientos depende de las configuraciones específicas. Una vez finalizada la creación de la base de conocimientos, el estado de la base de conocimientos cambia al estado de lista o disponible.

    Cuando la base de conocimientos esté lista y disponible, sincronice la fuente de datos por primera vez y siempre que desee mantener el contenido actualizado. Selecciona tu base de conocimientos en la consola y selecciona Sincronizar en la sección de información general sobre la fuente de datos.

API

El siguiente es un ejemplo de una configuración para conectarse a Salesforce para su base de conocimientos de Amazon Bedrock. Puede configurar su fuente de datos mediante el API AWS CLI o compatiblesSDK, como Python. Después de llamar CreateKnowledgeBase, llama CreateDataSourcepara crear la fuente de datos con la información de conexióndataSourceConfiguration. Recuerde especificar también su estrategia o enfoque de fragmentación vectorIngestionConfiguration y su política de eliminación de datos en dataDeletionPolicy

AWS Command Line Interface

aws bedrock create-data-source \ --name "Salesforce connector" \ --description "Salesforce data source connector for Amazon Bedrock to use content in Salesforce" \ --knowledge-base-id "your-knowledge-base-id" \ --data-source-configuration file://salesforce-bedrock-connector-configuration.json \ --data-deletion-policy "DELETE" \ --vector-ingestion-configuration '{"chunkingConfiguration":[{"chunkingStrategy":"FIXED_SIZE","fixedSizeChunkingConfiguration":[{"maxTokens":"100","overlapPercentage":"10"}]}]}' salesforce-bedrock-connector-configuration.json { "salesforceConfiguration": { "sourceConfiguration": { "hostUrl": "https://company.salesforce.com/", "authType": "OAUTH2_CLIENT_CREDENTIALS", "credentialsSecretArn": "arn:aws::secretsmanager:your-region:secret:AmazonBedrock-Salesforce" }, "crawlerConfiguration": { "filterConfiguration": { "type": "PATTERN", "patternObjectFilter": { "filters": [ { "objectType": "Campaign", "inclusionFilters": [ ".*public.*" ], "exclusionFilters": [ ".*private.*" ] } ] } } } }, "type": "SALESFORCE" }