Workflows für Analysen, die auf maschinellem Lernen basieren - Amazon Chime SDK

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Workflows für Analysen, die auf maschinellem Lernen basieren

In den folgenden Abschnitten wird beschrieben, wie Sie die Analysefunktionen für maschinelles Lernen verwenden, die von Amazon Chime SDK Call Analytics bereitgestellt werden.

Anmerkung

Wenn Sie planen, mehrere Machine-Learning-Analysen auf demselben Kinesis Video Stream auszuführen, müssen Sie möglicherweise das Verbindungslimit für GetMedia und GetMediaForFragmentList für den Videostream erhöhen. Weitere Informationen finden Sie unter Kinesis Video Streams-Grenzwerte im Kinesis Video Streams Developer Guide.

Verwenden Sie diesen Workflow, wenn:

  • Sie möchten ein konsolengesteuertes Setup.

  • Sie verwenden bereits einen Voice Connector oder planen, ihn zu verwenden, um SIP-Medien in die Anrufanalyse einzubeziehen. Voice Connectors unterstützen sowohl SIP als auch SIPREC. Weitere Informationen zur Konfiguration von Voice Connectors finden Sie unter Amazon Chime SDK Voice Connector verwalten.

  • Sie möchten dieselbe Media Insights-Konfiguration auf jeden Voice Connector-Anruf anwenden.

  • Sie müssen Amazon Chime SDK Voice Analytics verwenden, wofür ein Voice Connector oder eine Media Insights-Pipeline erforderlich ist.

Um diesen Workflow in der Amazon Chime SDK-Konsole zu aktivieren, folgen Sie den Schritten zum Erstellen einer Aufzeichnungskonfiguration unter Voice Connectors zur Verwendung von Anrufanalysen konfigurieren.

Um diesen Workflow programmgesteuert zu aktivieren, verwenden Sie die folgenden APIs: CreateMediaInsightsPipelineConfigurationAPI, um eine Konfiguration für Anrufanalysen zu erstellen und die Konfiguration dann mithilfe der API einem Voice Connector zuzuordnen. PutVoiceConnectorStreamingConfiguration Weitere Informationen finden Sie unter Konfiguration von Voice Connectors für die Verwendung von Sprachanalysen im Amazon Chime SDK-Administratorhandbuch.

Das folgende Diagramm zeigt den Datenfluss, wenn ein Voice Connector eine Anrufanalysesitzung einleitet. Die Zahlen im Diagramm entsprechen dem nummerierten Text unten.

Image showing the flow of data when a Voice Connector initiates a call.

Im Diagramm:

  1. Sie verwenden die Amazon Chime SDK-Konsole oder die CreateMediaInsightsPipelineConfigurationAPI, um eine Media Insights-Pipeline-Konfiguration zu erstellen.

  2. Sie verwenden die Amazon Chime SDK-Konsole oder die PutVoiceConnectorStreamingConfigurationAPI, um die Konfiguration einem Voice Connector zuzuordnen. Informationen zum Zuordnen einer vorhandenen Konfiguration zu einem Voice Connector finden Sie unter Konfiguration von Voice Connectors für die Verwendung von Anrufanalysen im Amazon Chime SDK-Administratorhandbuch.

  3. Während eines ausgehenden Anrufs empfängt der Voice Connector das Audio jedes Gesprächsteilnehmers.

  4. Aufgrund der integrierten Integration mit der Anrufanalyse initiiert der Voice Connector-Dienst eine Anrufanalysesitzung mithilfe des Media Pipeline-Dienstes, wenn eine Anrufanalysekonfiguration an einen Voice Connector angehängt ist.

  5. Der Media Pipeline-Dienst ruft einen oder mehrere Medienprozessoren auf, wie in der Konfiguration angegeben.

  6. Der Medien-Pipeline-Dienst sendet die Ausgabedaten je nach Konfiguration an ein oder mehrere Ziele. Sie können beispielsweise Echtzeitanalysen über einen Amazon Kinesis Data Stream senden, und wenn konfiguriert, können Sie die Anruf-Metadaten und Analysen an ein Amazon S3 S3-Data Warehouse senden.

  7. Der Media Pipeline-Service sendet die Pipeline-Status-Ereignisse an das Standard-Amazon EventBridge. Wenn Sie Regeln konfiguriert haben, werden die Benachrichtigungen dafür EventBridge auch an Amazon gesendet. Weitere Informationen finden Sie unter EventBridge Benachrichtigungen verwenden.

Anmerkung

Sie können Voice Connector-Anrufdaten für unterschiedliche Zeiträume, von Stunden bis hin zu Jahren, in Kinesis Video Streams speichern. Wenn Sie sich für keine Datenspeicherung entscheiden, wird die Verwendbarkeit der Anrufdaten für den sofortigen Zugriff eingeschränkt. Die Kosten für Kinesis Video Streams werden auf der Grundlage der verwendeten Bandbreite und des insgesamt genutzten Speichers bestimmt. Sie können die Datenaufbewahrungsdauer jederzeit anpassen, indem Sie die Streaming-Konfiguration Ihres Voice Connectors bearbeiten. Um die Aufzeichnung von Anrufanalysen zu aktivieren, müssen Sie sicherstellen, dass der Kinesis Video Stream Daten speichert, bis die Anrufanalyse abgeschlossen ist. Dazu geben Sie einen geeigneten Aufbewahrungszeitraum für Daten an.

Sie können eine Media Insights-Pipeline-Konfiguration beliebig vielen Voice Connectors zuordnen. Sie können auch für jeden Voice Connector eine andere Konfiguration erstellen. Voice Connectors verwenden die AWSServiceRoleForAmazonChimeVoiceConnector , um die CreateMediaInsightsPipelineAPI in Ihrem Namen einmal pro Transaktions-ID aufzurufen. Informationen zur Rolle finden Sie unter Verwenden der serviceverknüpften Amazon Chime SDK-Rolle für Amazon Chime SDK Voice Connectors im Amazon Chime SDK-Administratorhandbuch.

Verwenden Sie diesen Workflow, wenn Sie einen Voice Connector verwenden, aber kontrollieren müssen, wann Sie eine Anrufanalyse-Konfiguration anwenden und auf welchen Anruf die Konfiguration angewendet werden soll.

Um diese Methode zu verwenden, müssen Sie ein EventBridge Ziel für Ereignisse erstellen, die der Voice Connector veröffentlicht, und dann die Ereignisse verwenden, um die APIs für die Anrufanalyse-Pipeline auszulösen. Weitere Informationen finden Sie unter Automatisieren des Amazon Chime SDK mit EventBridge im Amazon Chime SDK-Administratorhandbuch.

Das folgende Diagramm zeigt, wie Sie bei der Verwendung von Anrufanalysen mit Voice Connector eine detailliertere Steuerung implementieren können. Die Zahlen im Diagramm entsprechen den Zahlen im Text unten.

Das Bild zeigt den Datenfluss bei der Verwendung von API-Aufrufen mit Voice Connectors.

Im Diagramm:

  1. Sie verwenden die Amazon Chime SDK-Konsole oder die CreateMediaInsightsPipelineConfigurationAPI, um eine Media Insights-Pipeline-Konfiguration zu erstellen.

  2. Während eines ausgehenden Anrufs empfängt der Voice Connector Audio von Teilnehmern.

  3. Der Voice Connector sendet Anruf-Audio an Kinesis Video Stream und entsprechende Ereignisse an den EventBridge. Diese Ereignisse verfügen über Stream- und Anrufmetadaten.

  4. Ihre Anwendung wurde EventBridge über ein EventBridge Target abonniert.

  5. Ihre Anwendung ruft die Amazon Chime CreateMediaInsightsPipelineSDK-API auf.

  6. Der Media Pipeline-Service ruft einen oder mehrere Medienprozessoren auf der Grundlage der Prozessorelemente in der Media Insights-Pipeline-Konfiguration auf.

  7. Der Media Pipeline-Dienst sendet die Ausgabedaten je nach Konfiguration an ein oder mehrere Ziele. Amazon Chime SDK Call Analytics bietet Echtzeitanalysen über Amazon Kinesis Data Stream und ruft, sofern konfiguriert, Metadatenanalysen für ein Amazon S3 S3-Data Warehouse auf.

  8. Der Media Pipeline-Service sendet die Ereignisse an Amazon EventBridge. Wenn Sie Regeln konfiguriert haben, werden die Benachrichtigungen dafür EventBridge auch an Amazon gesendet.

  9. Sie können die Anrufanalysesitzung anhalten oder fortsetzen, indem Sie die UpdateMediaInsightsPipelineStatusAPI aufrufen.

    Anmerkung

    Die Anrufaufzeichnung unterstützt das Anhalten und Wiederaufnehmen von Anrufen nicht. Außerdem werden Sprachanalyseaufgaben, die für den Anruf gestartet wurden, auch beendet, wenn Sie eine Sitzung unterbrechen. Um sie neu zu starten, müssen Sie die StartVoiceToneAnalyisTaskAPIs StartSpeakerSearchTaskoder aufrufen.

  10. Wenn Sie bei der Konfiguration die Sprachtonanalyse auswählen, starten Sie die Sprachanalyse, indem Sie die StartVoiceToneAnalyisTaskAPIs StartSpeakerSearchTaskoder aufrufen.

Um diese Option zu verwenden, müssen Sie Audiodaten in Kinesis Video Streams (KVS) veröffentlichen und dann die CreateMediaInsightsPipelineAPI mit den KVS-Stream-Kanalinformationen aufrufen.

Anmerkung

Die Anrufanalyse-APIs unterstützen maximal zwei Audiokanäle.

Beim Aufrufen der CreateMediaInsightsPipelineAPI können Sie Fragmentnummern für jede KVS-Stream-Kanaldefinition angeben. Wenn Sie eine Fragmentnummer angeben, beginnt Call Analytics mit der Verarbeitung des Streams an diesem Fragment. Andernfalls beginnt Call Analytics mit der Verarbeitung des Streams anhand des neuesten verfügbaren Fragments.

Die Anrufanalyse unterstützt PCM-Audio (nur signierte 16-Bit-Little-Endian-Audioformate, WAV nicht enthalten) mit einer Audio-Samplerate zwischen 8 kHz und 48 kHz. Audioqualität von geringer Qualität, z. B. Telefonieaudio, liegt in der Regel bei etwa 8.000 Hz. Hochwertige Audiosignale liegen in der Regel im Bereich von 16.000 Hz bis 48.000 Hz. Die von Ihnen angegebene Samplerate muss mit der Ihres Audios übereinstimmen. Weitere Informationen finden Sie KinesisVideoStreamSourceRuntimeConfigurationin der Amazon Chime SDK API-Referenz.

Das Kinesis Video Streams Producer SDK bietet eine Reihe von Bibliotheken, mit denen Sie Audiodaten in einen Kinesis Video Stream streamen können. Weitere Informationen finden Sie unter Kinesis Video Streams Producer Libraries im Amazon Kinesis Video Streams Developer Guide.

Das folgende Diagramm zeigt den Datenfluss bei der Verwendung von Anrufanalysen mit einem benutzerdefinierten Kinesis Video Stream-Producer. Die Zahlen im Diagramm entsprechen dem nummerierten Text unten.

Bild, das den Datenfluss bei der Verwendung von Anrufanalysen mit einem Kinesis Video Stream-Producer zeigt.
  1. Sie verwenden die AWS Konsole oder die CreateMediaInsightsPipelineConfigurationAPI, um eine Media Insights-Pipeline-Konfiguration zu erstellen.

  2. Sie verwenden einen Kinesis Video Stream Producer, um Audio in Kinesis Video Streams zu schreiben.

  3. Ihre Anwendung ruft die API auf. CreateMediaInsightsPipeline

  4. Der Media Pipeline-Service liest Audio aus den Kinesis Video Streams des Kunden.

  5. Der Media Pipeline-Service sendet die Ereignisse an Amazon EventBridge. Wenn Sie Regeln konfiguriert haben, werden die Benachrichtigungen dafür EventBridge auch an Amazon gesendet.

  6. Der Media Pipeline-Dienst ruft ein oder mehrere Prozessorelemente auf.

  7. Der Medien-Pipeline-Dienst sendet Ausgabedaten an ein oder mehrere Senkenelemente.

  8. Sie können die Anrufanalysesitzung anhalten oder fortsetzen, indem Sie die UpdateMediaInsightsPipelineStatusAPI aufrufen.

    Anmerkung

    Die Anrufaufzeichnung unterstützt das Anhalten und Fortsetzen nicht.

  9. Ihre Anwendung kann die EventBridge Amazon-Ereignisse verarbeiten, um benutzerdefinierte Geschäftsabläufe auszulösen.

  10. Wenn Sie bei der Erstellung einer Konfiguration Sprachanalyse auswählen, kann Ihre Anwendung Sprachanalysen starten, indem sie die StartVoiceToneAnalyisTaskAPIs StartSpeakerSearchTaskoder aufruft.