SeedUrlConfiguration - Amazon Kendra

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SeedUrlConfiguration

Proporciona la información de configuración de las URL iniciales o del punto de partida que se van a rastrear.

Al seleccionar sitios web para indexar, debe adherirse a laPolítica de uso aceptable de Amazony todos los demás términos de Amazon. Recuerde que solo debe utilizar Amazon Kendra Web Crawler para indexar sus propias páginas web o páginas web que tenga autorización para indexar.

Contenido

SeedUrls

La lista de URL iniciales o de punto de partida de los sitios web que desea rastrear.

La lista puede incluir un máximo de 100 URL iniciales.

Type: Matriz de cadenas

Miembros de matriz: El número mínimo es 0 elementos. Número máximo de 100 elementos.

Restricciones de longitud: Longitud mínima de 1. La longitud máxima es de 2048 caracteres.

Patrón: ^(https?):\/\/([^\s]*)

Obligatorio: Sí

WebCrawlerMode

Puede elegir una de las siguientes opciones:

  • HOST_ONLY— rastrear solo los nombres de host del sitio web. Por ejemplo, si la URL inicial es «abc.ejemplo.com», solo se rastrean las URL con el nombre de host «abc.example.com».

  • SUBDOMAINS— rastrear los nombres de host del sitio web con subdominios. Por ejemplo, si la URL inicial es «abc.ejemplo.com», también se rastrean «a.abc.ejemplo.com» y «b.abc.ejemplo.com».

  • EVERYTHING— rastrear los nombres de host del sitio web con subdominios y otros dominios a los que se vinculan las páginas web.

El modo predeterminado se establece enHOST_ONLY.

Type: Cadena

Valores válidos: HOST_ONLY | SUBDOMAINS | EVERYTHING

Obligatorio: No

Véase también

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte: