Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Búsqueda tabular de HTML
La característica de búsqueda tabular de Amazon Kendra permite buscar y extraer respuestas de tablas incrustadas en documentos HTML. Cuando busques en tu índice, Amazon Kendra incluye un extracto de una tabla si es relevante para la consulta y proporciona información útil.
Amazon Kendra examina toda la información del cuerpo del texto de un documento, incluida la información útil de las tablas. Por ejemplo, un índice contiene informes empresariales con tablas sobre los costes de operación, los ingresos y otra información financiera. Para la consulta, «¿cuál es el costo operativo anual de 2020 a 2022?» , Amazon Kendra puede devolver un extracto de una tabla que contenga las columnas pertinentes de la tabla «Operaciones (millones de USD)» y «Ejercicio financiero», y filas de la tabla que contengan los valores de ingresos de 2020, 2021 y 2022. El extracto de la tabla se incluye en el resultado, junto con el título del documento, un enlace al documento completo y cualquier otro campo del documento que desee incluir.
Los extractos de tablas se pueden mostrar en los resultados de búsqueda tanto si la información se encuentra en una celda de la tabla como en varias celdas. Por ejemplo, Amazon Kendra puede mostrar un extracto de una tabla adaptado a cada uno de estos tipos de consultas:
-
“tarjeta de crédito con la tasa de interés más alta de 2020”
-
“tarjeta de crédito con la tasa de interés más alta de 2020 a 2022”
-
“las 3 tarjetas de crédito con la tasa de interés más alta de 2020 a 2022”
-
“tarjetas de crédito con tasas de interés inferiores al 10 %”
-
“todas las tarjetas de crédito con intereses bajos disponibles”
Amazon Kendra resalta la celda o celdas de la tabla que son más relevantes para la consulta. En el resultado de búsqueda se muestran las celdas más relevantes con sus filas, columnas y nombres de columnas correspondientes. El extracto de la tabla muestra hasta cinco columnas y tres filas, en función del número de celdas de la tabla que sean relevantes para la consulta y del número de columnas disponibles en la tabla original. La celda más relevante se muestra en el extracto de la tabla, junto con las siguientes celdas más relevantes.
La respuesta incluye el bucket de confianza (MEDIUM
, HIGH
y VERY_HIGH
) para mostrar la relevancia de la respuesta de la tabla para la consulta. Si el valor de una celda de la tabla tiene una confianza VERY_HIGH
, se convierte en la “respuesta principal” y se resalta. En el caso de los valores de las celdas de la tabla con una confianza HIGH
, aparecen resaltados. En el caso de los valores de las celdas de la tabla con una confianza MEDIUM
, no aparecen resaltados. La confianza general para la respuesta de la tabla se devuelve en la respuesta. Por ejemplo, si una tabla contiene principalmente celdas de la tabla con confianza HIGH
, la confianza general que se devuelve en la respuesta de la tabla es de confianza HIGH
.
De forma predeterminada, a las tablas no se les asigna un mayor nivel de importancia ni más peso que a otros componentes de un documento. Dentro de un documento, si una tabla es solo ligeramente relevante para una consulta, pero hay un párrafo muy relevante, Amazon Kendra devuelve un extracto del párrafo. Los resultados de búsqueda muestran el contenido que proporciona la mejor respuesta posible y la información más útil, en el mismo documento o en otros documentos. Si la confianza de una tabla es inferior a MEDIUM
, el extracto de la tabla no se devuelve en la respuesta.
Para utilizar la búsqueda tabular en un índice existente, debe volver a indexar el contenido.
Amazon Kendra La búsqueda tabular admite sinónimos (incluidos los personalizados). Amazon Kendra solo admite documentos en inglés con tablas HTML que estén dentro de la etiqueta de tabla.
El siguiente ejemplo muestra un extracto de tabla incluido en el resultado de una consulta. Para ver un ejemplo de JSON con respuestas a consultas, incluidos extractos de tablas, consulte Respuestas a las consultas y tipos de respuestas.