Risoluzione dei problemi Amazon CloudSearch - Amazon CloudSearch

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Risoluzione dei problemi Amazon CloudSearch

I seguenti argomenti descrivono le soluzioni ai problemi che potresti riscontrare durante l'utilizzo di Amazon CloudSearch.

Caricamento di documenti

Se i dati dei documenti non sono formattati correttamente o contengono dei valori non validi, quando tenti di caricarli o di utilizzarli per configurare i campi del tuo dominio ti verranno restituiti degli errori. Di seguito sono elencati alcuni problemi comuni e le loro soluzioni:

  • JSON non valido: se utilizzi JSON, la prima cosa da fare è assicurarti che non vi siano errori di sintassi JSON nel batch di documenti. A tale scopo, eseguilo tramite uno strumento di convalida come il convalidatore JSON. Verranno rilevati eventuali problemi fondamentali dei dati.

  • XML non valido: i batch di documenti devono essere XML ben formati. È molto probabile che si verificheranno problemi se i campi contengono dati XML (i dati devono essere codificati in XML o racchiusi in sezioni CDATA). Per individuare eventuali problemi, esegui il batch di documenti tramite uno strumento di convalida come il Markup Validation Service di W3C.

  • Non riconosciuto come batch di documenti: se Amazon CloudSearch non riconosce i tuoi dati come batch di documenti valido quando carichi i dati utilizzando la console, Amazon CloudSearch genera un batch valido che contiene un singolo campo di contenuto e campi di metadati generici come content_encodingcontent_type, e. resourcename Poiché non si tratta dei campi normalmente configurati per il dominio, verranno restituiti degli errori che indicano che i campi non esistono. Allo stesso modo, se tenti di configurare un dominio da un batch non valido, Amazon CloudSearch risponde con i campi contenuto e metadati anziché con i campi del batch.

    In primo luogo, accertati che il batch sia nei formati XML o JSON validi. Se lo sono, verifica che non vi siano ID di documenti non validi e assicurati di avere specificato il tipo di operazione per ogni documento. Per le operazioni di aggiunta, accertati che il tipo, l'ID e almeno un campo siano specificati per ogni documento. Per le operazioni di eliminazione, è necessario specificare solo il tipo e l'ID. Per ulteriori informazioni sulla formattazione dei dati, vedi Creating Document Batches.

  • ID di documento con valori errati: un ID documento può contenere qualsiasi lettera o numero e i seguenti caratteri: _ - = #;:/? @ &. Gli ID dei documenti devono contenere almeno 1 e non più di 128 caratteri.

  • Campi multivalore senza valore: quando si specificano i dati del documento in JSON, non è possibile specificare una matrice vuota come valore di un campo. I campi multivalore devono contenere almeno un valore.

  • Caratteri errati: un problema che può essere difficile da rilevare se non si filtrano i dati durante la generazione del batch di documenti è che può contenere caratteri non validi in XML. Entrambi i batch JSON e XML possono contenere solo caratteri UTF-8 che sono validi in XML. Puoi utilizzare uno strumento di convalida come il convalidatore JSON o il Markup Validation Service di W3C per individuare i caratteri non validi.

Eliminazione di tutti i documenti in un dominio Amazon CloudSearch

CloudSearch Al momento Amazon non fornisce un meccanismo per eliminare tutti i documenti in un dominio.

CloudSearch Il dominio Amazon non si ridimensiona dopo l'eliminazione dei documenti

Se il dominio è stato ridimensionato per adattarsi alle dimensioni dell'indice e elimini un numero elevato di documenti, il dominio si ridimensiona alla successiva ricostruzione dell'indice completo. Sebbene l'indice venga ricostruito automaticamente e periodicamente, per ridurlo il più rapidamente possibile puoi eseguire esplicitamente l'indicizzazione al termine dell'eliminazione dei documenti.

Latenza di aggiornamento dei documenti

L'invio di un grande volume di batch di singoli documenti può comportare un aumento del tempo richiesto affinché ogni documento diventi ricercabile. Se disponi di una grande quantità di traffico di aggiornamento, dovrai raggruppare in batch gli aggiornamenti. Ti consigliamo di usare dimensioni di batch vicine al limite di 5 MB. Per ulteriori informazioni, consulta Creating Document Batches.

Puoi caricare un massimo di 10.000 batch di documenti al giorno (ogni 24 ore), ognuno con dimensioni massime di 5 MB. Caricare una quantità superiore di dati al giorno può aumentare notevolmente la latenza degli aggiornamenti dei documenti. Per ridurre tale rischio, è possibile aumentare la capacità di aggiornamento selezionando un tipo di istanza più grande. Per ulteriori informazioni, consulta Configurazione delle opzioni di scalabilità in Amazon CloudSearch.

Numero elevato di errori 5xx durante il caricamento di documenti su un dominio Amazon CloudSearch

Se parallelizzi i caricamenti e il tuo dominio si trova su un'istanza search.small, potresti riscontrare un tasso di errori inaccettabilmente elevato di 504 o 507. Impostando un tipo di istanza desiderata più grande potrai aumentare la capacità di aggiornamento e ridurre la percentuale di errori. Per ulteriori informazioni sulla gestione degli errori 5xx, consultare Gestione degli errori. Per informazioni sul pre-dimensionamento del dominio per aumentare la capacità di aggiornamento, consultare Configurazione delle opzioni di scalabilità in Amazon CloudSearch.

Latenza e timeout di ricerca in Amazon CloudSearch

Se si verificano rallentamenti dei tempi di risposta, frequenti errori interni del server (tipicamente 507 o 509) o un aumento del consumo di ore di istanze nel dominio di ricerca senza un sostanziale aumento del volume di dati ricercati, puoi ottimizzare le richieste di ricerca per contribuire a ridurre i costi di elaborazione. Per ulteriori informazioni, consulta Ottimizzazione delle prestazioni delle richieste di ricerca in Amazon CloudSearch. Anche aumentare il numero di repliche desiderate può velocizzare l'elaborazione delle richieste di ricerca. Per ulteriori informazioni, consulta Configurazione delle opzioni di scalabilità in Amazon CloudSearch.

Gli errori 507 e 509 indicano in genere che il servizio di ricerca è sovraccarico. Ciò può essere dovuto al volume o alla complessità delle richieste di ricerca inviate. Amazon CloudSearch normalmente si ridimensiona automaticamente per gestire il carico. Poiché la distribuzione di istanze di ricerca aggiuntive richiede del tempo, consigliamo di utilizzare una politica di backoff retry esponenziale per ridurre temporaneamente la frequenza delle richieste e ridurre al minimo gli errori. Per ulteriori informazioni, consulta Error Retries e Exponential Backoff.

Alcuni modelli di utilizzo, come l'invio di query di ricerca complesse a un'unica istanza di ricerca di piccole dimensioni, possono talvolta causare timeout senza attivare il ridimensionamento automatico. Se riscontri ripetutamente un tasso di errore elevato, puoi richiedere esplicitamente capacità aggiuntiva tramite il modulo Amazon CloudSearch Service Limit Request.

Latenza di ricerca per query sfaccettate in Amazon CloudSearch

Se stai eseguendo il bucketing delle informazioni sui facet con l'opzione buckets e le prestazioni delle query rallentano, prova a impostare il metodo di bucketing su interval. Per ulteriori informazioni, consulta Bucket delle informazioni sui facet.

Aumento improvviso degli errori 5xx durante la ricerca di un dominio Amazon CloudSearch

Se il tuo dominio di ricerca registra un improvviso picco di traffico, Amazon CloudSearch risponde aggiungendo istanze di ricerca al tuo dominio per gestire l'aumento del carico. Tuttavia, occorrono alcuni minuti per configurare le nuove istanze. È probabile che gli errori 5xx aumentino temporaneamente, finché le nuove istanze non sono pronte per iniziare a elaborare le richieste. Per ulteriori informazioni sulla gestione degli errori 5xx, consultare Gestione degli errori. Per informazioni sul pre-dimensionamento del dominio per gestire picchi inaspettati nelle richieste di ricerca, consultare Configurazione delle opzioni di scalabilità in Amazon CloudSearch.

Errori di indicizzazione dopo l'aggiornamento delle opzioni di indicizzazione in Amazon CloudSearch

Se modifichi la configurazione dell'indice di un dominio, in alcuni casi durante l'indicizzazione potresti riscontrare errori di convalida. Ciò significa che le opzioni dei campi dell'indice impostate non sono compatibili con i documenti già presenti nell'indice. Nello specifico, hai modificato il tipo di un campo dell'indice e sono presenti nell'indice dei documenti che contengono dati incompatibili con il tipo impostato. Questo può accadere, ad esempio, se cambi in int un campo literal e in quel campo alcuni dei documenti contengono dati alfanumerici. Quando ciò accade, Amazon CloudSearch imposta lo stato di TUTTI i campi in fase di FailedToValidate elaborazione. Il ripristino della modifica della configurazione incompatibile ti consente di rigenerare nuovamente il tuo indice. Se la modifica è necessaria, per utilizzare la nuova configurazione devi aggiornare o rimuovere i documenti incompatibili dal tuo indice. Se non sei in grado di individuare la modifica che ha causato l'errore o hai bisogno di aiuto per identificare i documenti incompatibili, contatta il supporto.

Dominio non trovato durante l'invio di richieste Amazon CloudSearch

Non puoi accedere a un dominio 2013-01-01 con gli strumenti a riga di comando o gli SDK del 01/02/2011. Allo stesso modo, non puoi accedere a un dominio 2011-02-01 con gli strumenti da riga di comando o gli SDK del 01/2013. Accertati di specificare la versione API corretta nella tua richiesta e di utilizzare l'SDK o gli strumenti a riga di comando appropriati.

Numero di documenti ricercabili non restituito con le informazioni sul dominio

aws cloudsearch describe-domains e DescribeDomains non restituiscono il numero di documenti ricercabili nel dominio. Per ottenere il numero di documenti ricercabili, utilizza la console oppure invia una richiesta matchall all'endpoint delle ricerche del tuo dominio.

q=matchall&q.parser=structured&size=0

Le politiche di accesso ai servizi di configurazione non funzionano in Amazon CloudSearch

Se disponi di entrambi i domini 2011 e 2013, hai configurato le policy IAM per l'accesso al servizio di configurazione e ricevi errori non autorizzati, tieni presente che l'Amazon CloudSearch ARN è diverso per l'API 2011-02-01 e l'API 2013-01-01. Per consentire agli utenti di accedere a entrambi i domini 2011 e 2013, devi consentire l'accesso a entrambi gli ARN nella policy IAM. Per esempio:

{ "Statement": [ { "Effect": "Allow", "Action": [ "cloudsearch:*", ], "Resource": "arn:aws:cloudsearch:*", "Resource": "arn:aws:cs:*" } ] }

Se la policy 2011 garantiva l'accesso a particolari domini o operazioni, devi includere tali restrizioni nella tua policy. Tieni presente che l'unica operazione supportata per i domini 2011 è cloudsearch:* e che potresti riscontrare altri errori quando tenti di configurare le autorizzazioni a livello di risorsa per i domini creati con l'API 2011-01-01.

Le politiche di accesso ai servizi di ricerca e documentazione non funzionano in Amazon CloudSearch

Se hai configurato delle policy di accesso per gli endpoint del servizio documenti e di ricerca del tuo dominio, ma ricevi l'errore 403 Request forbidden by administrative rules (403 Richiesta non consentita dalle regole amministrative), potrebbe essersi verificato uno dei seguenti problemi.

  • Accertati che nelle tue richieste siano specificati la versione API e il nome delle risorse. Ad esempio, per caricare i documenti con l'API di 2013-01-01, devi aggiungere /2013-01-01/documents/batch all'endpoint del servizio documenti del tuo dominio:

    doc-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/documents/batch

    Per inviare le richieste di ricerca utilizzando l'API 2013-01-01, devi aggiungere /2013-01-01/search all'endpoint di ricerca del tuo dominio:

    search-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/search?q=star+wars&return=title

    Per ottenere i suggerimenti utilizzando l'API 2013-01-01, devi aggiungere /2013-01-01/suggest all'endpoint di ricerca del tuo dominio:

    search-movies-123456789012.us-east-1.cloudsearch.amazonaws.com/2013-01-01/suggest?q=kat&suggester=mysuggester
  • Se stai effettuando la connessione da un'istanza EC2, assicurati che la policy di accesso specifichi l'indirizzo IP pubblico della tua istanza EC2.

  • Se la macchina da cui stai effettuando la connessione utilizza un router, accertati che la policy di accesso specifichi il tuo indirizzo IP pubblico.

Per ulteriori informazioni, consulta configure access policies.

Errori di autorizzazione CloudSearch della console Amazon

Per accedere alla console, devi disporre delle autorizzazione per l'operazione DescribeDomains. L'accesso a domini e azioni particolari potrebbe essere limitato dalle politiche di accesso IAM configurate. Inoltre, il caricamento di dati da un bucket Amazon S3 o da una tabella DynamoDB richiede l'accesso a tali servizi e risorse. Per ulteriori informazioni sulle politiche di CloudSearch accesso di Amazon, consultaconfigure access policies.

Utilizzo dei caratteri jolly per ricercare nei campi di testo non produce i risultati previsti

Quando si invia una richiesta di ricerca, il testo cercato subisce lo stesso processo di elaborazione del testo in modo che possa essere confrontato con i termini visualizzati nell'indice. Tuttavia, quando si esegue una ricerca di prefissi, on viene eseguita alcuna analisi del testo sul termine di ricerca. Ciò significa che la ricerca di un prefisso che termina con s solitamente non restituirà la versione al singolare del termine se è attivato lo stemming. Questo può accadere per qualsiasi termine che finisca con s, non soltanto per i plurali. Ad esempio, se ricerchi Anders nel campo actor nei dati di esempio dei film, saranno restituiti tre film. Se ricerchi Ander*, otterrai quei film e molti altri. Se invece ricerchi ricerchi Anders* non otterrai alcuna corrispondenza, in quanto il termine è archiviato nell'indice come ander (anders non appare nell'indice).

Se lo stemming impedisce che le ricerche con caratteri jolly restituiscano tutte le corrispondenze pertinenti, puoi eliminare lo stemming per il campo di testo impostando l'opzione AlgorithmicStemming su none oppure puoi mappare i dati a un campo literal invece che a un campo text.

Per ulteriori informazioni su come Amazon CloudSearch elabora il testo, consultaElaborazione di testo in Amazon CloudSearch.

Risultati inconsistenti durante l'uso dei cursori per la paginazione profonda

È possibile che, utilizzando un cursore per scorrere un set di risultati ordinato in base al punteggio dei documenti (_score), si ottengano risultati non coerenti se tra una richiesta e l'altra l'indice è stato aggiornato. Questo può accadere anche se il conteggio delle repliche del dominio è maggiore di uno, in quanto gli aggiornamenti vengono applicati in modo consistente finale tra le istanze del dominio. Se questo è un problema, evita di ordinare i risultati in base al punteggio. Puoi utilizzare l'opzione sort per ordinare i risultati in base a un campo specifico oppure puoi utilizzare fq anziché q per specificare criteri di ricerca personalizzati. (I punteggi dei documenti non vengono calcolati per filtrare le query).

Errori di certificato quando si utilizza un SDK

Poiché gli SDK AWS utilizzano i certificati CA del computer, le modifiche ai certificati sui server AWS possono causare errori di connessione quando si tenta di utilizzare un SDK. I messaggi di errore variano, ma in genere contengono il testo seguente:

SSL3_GET_SERVER_CERTIFICATE:certificate verify failed

Puoi prevenire questi errori conservando i certificati CA e il sistema up-to-date operativo del tuo computer. Se si riscontra questo problema in un ambiente aziendale e non si gestisce il computer in uso, potrebbe essere necessario richiedere all'amministratore assistenza con il processo di aggiornamento.

Nell'elenco seguente vengono riportati i requisiti minimi del sistema operativo e delle versioni di Java:

  • Le versioni di Microsoft Windows con aggiornamenti installati da gennaio 2005 in poi contengono nell'elenco di certificati attendibili almeno uno dei CA richiesti.

  • Mac OS X 10.4 con Java per Mac OS X 10.4 release 5 (febbraio 2007), Mac OS X 10.5 (ottobre 2007) e versioni successive contengono nell'elenco di certificati attendibili almeno uno dei CA richiesti.

  • Red Hat Enterprise Linux 5 (marzo 2007), 6 e 7 e CentOS 5, 6 e 7 contengono nell'elenco di certificati attendibili almeno uno dei CA richiesti.

  • Java 1.4.2_12 (maggio 2006), 5 aggiornamento 2 (marzo 2005) e tutte le versioni successive, incluso Java 6 (dicembre 2006), 7 e 8, contengono nell'elenco di certificati attendibili almeno uno dei CA richiesti.

Le tre autorità di certificazione sono:

  • Autorità di certificazione root Amazon 1

  • Autorità di certificazione root dei servizi Starfield - G2

  • Autorità di certificazione Starfield classe 2

I certificati root delle prime due autorità sono disponibili presso Amazon Trust Services, ma mantenere il computer up-to-date è la soluzione più semplice. Per ulteriori informazioni sui certificati forniti da ACM, consulta le Domande frequenti su AWS Certificate Manager.

Nota

Questi certificati non erano ancora obbligatori, ma sono stati distribuiti nei server AWS nel novembre 2017.