Allgemeines
F: Was ist Amazon Transcribe?
Amazon Transcribe ist ein AWS-Service für künstliche Intelligenz (KI), mit dem Sie ganz einfach Sprache in Text umwandeln können. Dank Automatic Speech Recognition(ASR)-Technologie (Technologie zur automatischen Spracherkennung) können Sie Amazon Transcribe in verschiedenen Bereichen ihres Unternehmens einsetzen, zum Beispiel für die Transkription sprachbasierter Kundenservice-Anrufe, die Erstellung von Untertiteln für Audio-/Videoinhalte in Echtzeit oder die textbasierte Durchführung von Inhaltsanalysen für Audio-/Videoinhalte.
F: Wie interagiert Amazon Transcribe mit anderen AWS-Produkten?
Amazon Transcribe wandelt Audioeingaben in Text um, was Ihnen neue Möglichkeiten bei Anwendungen zur Textanalyse mittels Spracheingabe ermöglicht. Wenn Sie beispielsweise Amazon Comprehend auf die konvertierten Textdaten von Amazon Transcribe ansetzen, können Sie eine Stimmungsanalyse durchführen oder Entitäten und Schlüsselphrasen extrahieren. Sie können Amazon Transcribe auch mit Amazon Translate und Amazon Polly integrieren, um Spracheingaben in einer Sprache zu ermöglichen, diese dann in eine andere Sprache zu übersetzen und als Sprachausgabe wiederzugeben, wodurch effektiv die Kommunikation in verschiedenen Sprachen möglich wird. Amazon Transcribe kann außerdem in Amazon Kendra oder Amazon OpenSearch integriert werden, um textbasierte Suchvorgänge in Audio-/Videobibliotheken zu indexieren und durchzuführen. Wenn Sie mehr erfahren möchten, sehen Sie sich die Lösungen Live-Anrufanalytik und Agentenunterstützung, Analyse nach dem Anruf, MediaSearch oder Inhaltsanalyse an.
F: Was sollte ich noch wissen, bevor ich Amazon Transcribe verwende?
Amazon Transcribe ist auf die Verarbeitung einer Vielfalt von Sprach- und akustischen Eigenschaften ausgelegt, darunter Variationen in Lautstärke, Tonhöhe und Sprechgeschwindigkeit. Die Qualität und der Inhalt des Audiosignals (u. a. Faktoren wie Hintergrundgeräusche, gleichzeitig sprechende Personen, Sprache mit Akzent oder Wechsel zwischen verschiedenen Sprachen innerhalb einer Audiodatei) können sich auf die Genauigkeit der Ausgabe auswirken. Der Service wird von uns ständig aktualisiert, damit er weitere akustische Variationen und Inhaltsarten besser verarbeiten kann.
Verwenden von Amazon Transcribe
F: Wie können Entwickler auf Amazon Transcribe zugreifen?
Für einen einfachen Einstieg senden Sie einen Auftrag über die Konsole, um eine Audiodatei zu transkribieren. Sie können den Service auch direkt über die AWS Command Line Interface aufrufen oder eines der unterstützten SDKs Ihrer Wahl verwenden, um ihn in Ihre Anwendungen zu integrieren. So oder so können Sie in Amazon Transcribe einsteigen, um automatisierte Transkripte für Ihre Audiodateien mit nur wenigen Zeilen Code zu erstellen.
F: Unterstützt Amazon Transcribe Echtzeittranskriptionen?
Ja. Amazon Transcribe ermöglicht Ihnen einen bidirektionalen Stream über HTTP2 zu eröffnen. Sie können einen Audiostream an den Service senden, während Sie in Echtzeit einen Textstream zurückerhalten. Weitere Informationen finden Sie auf der Dokumentationsseite.
F: Welche Enkodierung wird von der Echtzeittranskription unterstützt?
Die unterstützten Medientypen unterscheiden sich zwischen Batch-Transkriptionen und Streaming-Transkriptionen, wobei verlustfreie Formate für beide empfohlen werden. Weitere Informationen finden Sie auf der Dokumentationsseite.
F: Welche Sprachen unterstützt Amazon Transcribe?
Informationen zur Sprachunterstützung finden Sie auf dieser Dokumentationsseite.
F: Auf welchen Geräten funktioniert Amazon Transcribe?
Amazon Transcribe ist im Grunde plattformunabhängig. Es funktioniert generell mit allen Geräten, die über ein integriertes Mikrofon besitzen, wie Telefone, PCs, Tablets und IoT-Geräte (zum Beispiel Soundsysteme). Die Amazon Transcribe-API kann die Qualität der Audioeingabe (8 kHz oder 16 kHz) erkennen und wählt automatisch das richtige Akustikmodell zur Umwandlung von Sprache in Text aus. Entwickler können die Amazon-Transcribe-API ferner über ihre Anwendungen aufrufen, um die Sprache-zu-Text-Funktionen zu nutzen.
F: Gibt es Begrenzungen bei der Größe der Audioinhalte, die Amazon Transcribe verarbeiten kann?
In Amazon Transcribe sind Serviceaufrufe für unseren Batch-Service auf vier Stunden (oder 2 GB) pro API-Aufruf begrenzt. Der Streaming-Service kann bis zu vier Stunden lang offene Verbindungen unterstützen.
F: Welche Programmiersprachen unterstützt Amazon Transcribe?
Der Amazon Transcribe Batch Service unterstützt .NET, Go, Java, JavaScript, PHP, Python und Ruby. Amazon Transcribe Echtzeit-Service unterstützt Java SDK, Ruby SDK und C++ SDK. Weitere SDK-Unterstützung ist in Vorbereitung. Weitere Details finden Sie auf der Seite mit den Ressourcen und der Dokumentation.
F: Meine benutzerdefinierten Wörter des Vokabulars werden nicht erkannt! Was kann ich tun?
Die Spracherkennungsausgabe hängt neben benutzerdefinierten Vokabulareinträgen von einer Reihe von Faktoren ab, sodass keine Gewähr dafür besteht, dass ein Begriff korrekt erkannt wird, wenn er in das benutzerdefinierte Vokabular aufgenommen wurde. Einer der häufigsten Gründe dafür ist jedoch, dass die Wörter deutlich anders ausgesprochen werden als sie geschrieben sind.
In diesen Fällen wird empfohlen, in der benutzerdefinierten Vokabeldatei mehrere Phraseneinträge für dasselbe Wort zu erstellen, um mögliche Ausspracheunterschiede abzudecken. Sie können die DisplayAs-Spalte für die gewünschte Ausgabe für diese Phraseneinträge verwenden. In der benutzerdefinierten Vokabulardokumentation finden Sie weitere Informationen.
F: Warum sehe ich zu viele benutzerdefinierte Wörter in meiner Ausgabe?
Benutzerdefinierte Vokabulare sind für eine kleine Liste von Zielwörtern optimiert; größere Vokabulare können zu einer Übergenerierung von benutzerdefinierten Wörtern führen, insbesondere wenn sie Wörter enthalten, die in ähnlicher Weise ausgesprochen werden. Wenn Sie eine große Liste haben, versuchen Sie bitte, sie auf seltene Wörter und Wörter zu reduzieren, die tatsächlich in Ihren Audiodateien erwartet werden. Wenn Sie über ein großes Vokabular verfügen, das mehrere Anwendungsfälle abdeckt, teilen Sie es in separate Listen für verschiedene Anwendungsfälle auf. Die Wörter, die kurz sind und ähnlich wie viele andere Wörter klingen, können zu einer Übergenerierung führen (zu viele benutzerdefinierte Wörter, die in der Ausgabe angezeigt werden). Es ist vorzuziehen, diese Wörter mit umgebenden Wörtern zu kombinieren und sie als durch einen Bindestrich getrennte Phrasen aufzulisten. Beispielsweise könnte das benutzerdefinierte Wort „A.D.“ als Teil eines Ausdrucks wie „A.D.-Konverter“ aufgenommen werden.
F: Kann ich bei Verwendung von DisplayAs-Formularen Zeichensätze anzeigen, die nichts mit der zu transkribierenden Originalsprache zu tun haben (z. B. Ausgabe „Straße“ als „街道“)?.
Ja. Während Phrasen nur einen eingeschränkten Satz von Zeichen für die jeweilige Sprache verwenden dürfen, sind UTF-8-Zeichen, die sich von der Datei \t (TAB) unterscheiden, in der Spalte DisplayAs zulässig.
F: Ist die automatische Redaktion von Inhalten oder die Redaktion von personenbezogenen Daten (PII) sowohl mit Batch- als auch mit Streaming-APIs für Transcribe verfügbar?
Ja, Amazon Transcribe unterstützt die automatische Redaktion von Inhalten oder die Redaktion von PII sowohl für Batch- als auch für Streaming-APIs.
F: Welche Sprachen werden für die automatische Redaktion von Inhalten/Identifizierung und Redaktion von PII unterstützt?
Informationen zur Sprachverfügbarkeit der automatischen Redaktion von Inhalten/PII finden Sie in der Dokumentation von Amazon Transcribe.
F: Werden durch die automatische Inhaltsredaktion auch sensible persönliche Informationen aus dem Quellaudio herausgenommen?
Nein, diese Funktion entfernt keine sensiblen persönlichen Informationen aus dem Quellaudio. Amazon Transcribe Call Analytics entfernt jedoch sensible persönliche Informationen sowohl aus den Transkripten als auch aus den Audioquellen. Besuchen Sie diesen Link, um mehr darüber zu erfahren, wie die Anrufanalyse Audiodaten unkenntlich machen kann. Sie können außerdem persönliche Informationen aus dem Quellaudio selbst zensieren, indem Sie die Start- und Endzeitstempel verwenden, die in den zensierten Transkripten für jeden Fall einer identifizierten PII-Äußerung angegeben sind. Bitte beachten Sie diese Audio-Redaktionslösung für Standard-Transcribe-APIs.
Die spezialisierten Amazon-Transcribe-Call-Analytics-API entfernen jedoch sensible persönliche Informationen sowohl aus den Transkripten als auch aus den Audioquellen. Wenn Sie mehr erfahren möchten, lesen Sie die Dokumentation zur Audio-Redaktion von Call Analytics.
F: Kann ich die automatische Inhaltsredaktion zum Redigieren persönlicher Informationen aus den vorhandenen Texttranskripten verwenden?
Nein, die automatische Inhaltsredaktion funktioniert nur bei Audiodateien als Eingabe.
F: Was sollte ich noch wissen, bevor ich die automatische Inhaltsredaktion verwende?
Die automatische Inhaltsredaktion dient dazu, persönlich identifizierbare Informationen (PII) zu identifizieren und zu entfernen. Aufgrund der vorausschauenden Natur von Machine Learning kann es jedoch vorkommen, dass nicht alle Fälle von PII in einem vom Dienst erstellten Transkript identifiziert und entfernt werden. Sie sollten jede Ausgabe, die von der automatischen Inhaltsredaktion bereitgestellt wird, überprüfen, um sicherzustellen, dass sie Ihren Bedürfnissen entspricht.
F: Gibt es Unterschiede zwischen der automatischen Inhaltsredaktion für Streaming- und Batch-APIs?
Ja, es gibt zwei zusätzliche Funktionen, die von der automatischen Inhaltsredaktion für die Streaming-API unterstützt werden, die von der Batch-API nicht unterstützt werden. Wenn Sie die Inhaltsredaktion mit der Streaming-API benutzen, können Sie beschließen, nur PII zu identifizieren und nicht zu redigieren. Außerdem haben Sie die Möglichkeit, bestimmte PII-Typen mit der Streaming-API zu identifizieren oder zu redigieren. Sie können z.B. nur die Sozialversicherungsnummer und die Kreditkarteninformationen redigieren und andere PII wie Namen und E-Mail-Adressen behalten.
F: In welchen AWS-Regionen ist automatische Inhaltsredaktion oder PII-Redaktion verfügbar?
Informationen über die Verfügbarkeit der automatischen Inhaltsredaktion und der PII-Redaktion für Batch- und Streaming-APIs in den AWS-Regionen finden Sie in der Amazon-Transcribe-Dokumentation.
F: Welche APIs unterstützen die automatische Spracherkennung?
Die automatische Spracherkennung wird derzeit für Batch- und Streaming-APIs unterstützt.
F: Welche Sprachen kann Amazon Transcribe automatisch erkennen?
Amazon Transcribe kann alle Sprachen erkennen, die von den Batch- und Streaming-APIs unterstützt werden. Details zu den unterstützten Sprachen und sprachspezifischen Funktionen finden Sie hier.
F: Erkennt Amazon Transcribe mehrere Sprachen innerhalb einer Audiodatei?
Amazon Transcribe unterstützt mehrsprachige IDs für Batches. Unter diesem Link finden Sie weitere Details.
F: Gibt es eine Möglichkeit, die Liste der Sprachen, die für die automatische Spracherkennung ausgewählt werden können, einzuschränken?
Ja, Sie haben die Möglichkeit, eine Liste mit den Sprachen festzulegen, die in Ihrer Medienbibliothek vorkommen können. Wenn Sie eine Liste mit Sprachen festlegen, werden die erkannten Sprachen auf Basis dieser Liste ausgewählt. Werden keine Sprachen festgelegt, gleicht das System die Audiodatei mit allen von Amazon Transcribe unterstützten Sprachen ab und wählt die wahrscheinlichste Sprache aus. Die Genauigkeit der Spracherkennung erhöht sich, wenn eine Auswahlliste von Sprachen zur Verfügung gestellt wird. Unter diesem Link finden Sie weitere Details.
Preise und Verfügbarkeit
F: Was sind die Kosten dafür?
Auf der Seite Amazon Transcribe – Preise erfahren Sie mehr.
F: In welchen AWS-Regionen ist Amazon Transcribe verfügbar?
Diese Informationen finden Sie in der Tabelle für globale Infrastrukturregionen von AWS. Hier finden Sie weitere Details zu Amazon-Transcribe-Endpunkten und -Quoten.
Datenschutz
F: Werden durch Amazon Transcribe verarbeitete Eingaben gespeichert und wie werden sie von AWS verwendet?
Amazon Transcribe speichert und verwendet von dem Service verarbeitete Eingaben ausschließlich, um den Service bereitzustellen und zu pflegen und die Qualität von Amazon Transcribe und anderen Machine-Learning-Technologien / Technologien künstlicher Intelligenz von Amazon zu verbessern und weiterzuentwickeln. Die Nutzung Ihrer Inhalte ist für die kontinuierliche Verbesserung Ihrer Amazon Transcribe-Kundenerfahrung wichtig, einschließlich der Entwicklung und der Schulung entsprechender Technologien. Wir verwenden keine personenbezogenen Informationen, die in Ihren Inhalten enthalten sein können, um Produkte, Services oder Marketingmaterialien auf Sie oder Ihre Endbenutzer abzuzielen. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/. Mit einer der Opt-Out-Mechanismen von AWS Organizations können Sie die Nutzung Ihrer Inhalte zur Verbesserung und Weiterentwicklung der Qualität von Amazon Transcribe und anderen Machine-Learning-Technologien / Technologien künstlicher Intelligenz von Amazon ablehnen. Informationen zu Ihren Opt-Out-Möglichkeiten finden Sie unter Opt-out-Richtlinie für KI-Services.
F: Kann ich Daten und Artefakte im Zusammenhang mit Transkriptionsaufgaben löschen, die von Amazon Transcribe gespeichert wurden?
Ja. Sie können verfügbare Delete-APIs verwenden, um Daten und sonstige Artefakte im Zusammenhang mit Transkriptionsaufgaben zu löschen. Wenn Probleme auftreten, wenden Sie sich an den AWS Support.
F: Wer hat Zugriff auf meine Inhalte, die von Amazon Transcribe verarbeitet und gespeichert werden?
Nur autorisierte Mitarbeiter haben Zugriff auf Ihre Inhalte, die von Amazon Transcribe verarbeitet werden. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.
F: Bin ich immer noch der Eigentümer der Inhalte, die durch Amazon Transcribe verarbeitet und gespeichert werden?
Sie behalten immer die Eigentümerschaft an den Inhalten und wir verwenden Ihre Inhalte nur mit Ihrer Zustimmung.
F: Was geschieht mit meinen Daten, die beim Training benutzerdefinierter Sprachmodelle verwendet werden? Bleiben sie in meinem Besitz?
Bei der Übermittlung von Textdaten, die zum Trainieren eines dedizierten Modells verwendet werden, sind Sie Eigentümer der ursprünglichen Textdaten und des generierten benutzerdefinierten Modells. Die Textdaten werden weder gespeichert noch zur Verbesserung unseres allgemeinen Spracherkennungsmoduls verwendet. Modelle, die mit Hilfe von CLM erstellt wurden, sind in sich abgeschlossen und nur für Sie zugänglich.
F: Da der Dienst meine Trainingsdaten nicht aufbewahren wird, gibt es dabei irgendwelche Nachteile oder Beeinträchtigungen der Transkriptionsqualität oder des Gesamterlebnisses des Dienstes?
Es gibt keine Verschlechterung der Transkriptionsqualität, wenn unser Dienst Ihre Trainingsdaten nicht speichert. Sobald die Trainingsdaten tatsächlich zur Erstellung eines benutzerdefinierten Sprachmodells verwendet werden, steht das Modell selbst zur wiederholten Verwendung nach Ihrem Ermessen zur Verfügung. Der ursprüngliche Trainingssatz, den Sie hochgeladen haben, wird aus unseren Systemen gelöscht. Der einzige Nachteil ist, wenn Sie technischen Support benötigen. Da wir Ihre ursprünglichen Trainingsdaten nicht aufbewahren, hätten wir keinen bequemen Zugang zu diesen Vermögenswerten oder den damit verbundenen Zwischenartefakten, falls Sie ein Support-Team zur Untersuchung potenzieller Serviceprobleme benötigen. Support wäre immer noch verfügbar, aber nicht mehr so zeitnah, da wir Sie unter Umständen um zusätzliche Informationen bitten müssen.
F: Wie kann ich die Daten für zukünftige Modellaktualisierungen oder -verbesserungen wiederverwenden?
Da die Trainingsdaten nicht gespeichert werden, müssen derselbe Datensatz und alle zusätzlichen Daten erneut hochgeladen werden, um neue Modelle zu trainieren. Wenn es eine Aktualisierung des von Amazon Transcribe bereitgestellten Basismodells gibt, werden Sie benachrichtigt. Um die Vorteile des neuesten Basismodells zu nutzen, sollten Sie Ihre Daten einreichen, um ein neues Modell zu trainieren. Sie verfügen dann sowohl über das ursprüngliche benutzerdefinierte Modell, das Sie zuvor generiert haben, als auch über die neue Version, die Sie verwenden können.
F: Wie lösche ich ein Modell?
Sie können jedes Kunden-Sprachmodell, das Sie erstellt haben, nach eigenem Ermessen löschen.
F: Wird der von Amazon Transcribe verarbeitete Inhalt außerhalb der AWS-Region verschoben, in der ich Amazon Transcribe verwende?
Alle Inhalte, die von Amazon Transcribe verarbeitet werden, werden im Ruhezustand in der AWS-Region verschlüsselt und gespeichert, in der Sie Amazon Transcribe verwenden. Ein Teil der von Amazon Transcribe verarbeiteten Inhalte wird möglicherweise im Rahmen der fortlaufenden Verbesserung und Weiterentwicklung des Kundenerlebnisses von Amazon Transcribe und anderen Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz in einer anderen AWS-Region gespeichert. Wenn Sie die Option deaktivieren, dass Ihre Inhalte zur Weiterentwicklung von Amazon Transcribe und anderen Amazon-Technologien hinsichtlich Machine Learning/künstliche Intelligenz verwendet werden, indem Sie den AWS Support kontaktieren, dann werden Ihre Inhalte nicht in einer anderen AWS-Region gespeichert. Um Spracheingaben löschen zu lassen, die Ihrem Konto zugeordnet sind, wenden Sie sich bitte an den AWS-Support. Ihr Vertrauen, der Schutz Ihrer Daten und die Sicherheit Ihrer Inhalte sind unser größtes Anliegen, und wir setzen geeignete und innovative technische und physische Kontrollmethoden ein, einschließlich Verschlüsselung im Ruhezustand und während der Übertragung, um unerlaubten Zugriff oder die unerlaubte Veröffentlichung Ihrer Inhalte zu vermeiden und sicherzustellen, dass wir Ihre Daten nur in Übereinstimmung mit unseren Verpflichtungen Ihnen gegenüber verwenden. Weitere Informationen finden Sie unter https://aws.amazon.com/compliance/data-privacy-faq/.
F: Kann ich Amazon Transcribe zusammen mit Websites, Programmen oder anderen Anwendungen verwenden, die sich an Kinder unter 13 Jahren richten und dem Children’s Online Privacy Protection Act (COPPA) unterliegen?
Ja, entsprechend der Konformität mit den Amazon Transcribe-Nutzungsbedingungen, einschließlich Ihrer Verpflichtung, alle erforderlichen Hinweise bereitzustellen und alle erforderlichen überprüfbaren elterlichen Freigaben unter dem COPPA zu erhalten, können Sie Amazon Transcribe zusammen mit Websites, Programmen und anderen Anwendungen verwenden, die sich ganz oder teilweise an Kinder unter 13 Jahren richten.
F: Wie ermittle ich, ob meine Website, mein Programm oder meine Anwendung dem COPPA unterliegt?
Informationen zu den Anforderung des COPPA und Hinweise darauf, ob Ihre Website, Ihr Programm oder Ihre andere Anwendung dem COPPA unterliegt, finden Sie direkt in den von der United States Federal Trade Commission bereitgestellten und verwalteten Ressourcen. Diese Website enthält außerdem Informationen, um zu ermitteln, ob sich ein Service ganz oder teilweise an Kinder unter 13 Jahre richtet.
Amazon Transcribe Call Analytics
F: Was ist Amazon Transcribe Call Analytics?
Amazon Transcribe Call Analytics ist eine KI-unterstützte API, die reiche Anruf-Transkripte bietet und unangemessene Gesprächserkenntnisse enthüllt, die Sie in Anruf-Anwendungen hinzufügen können, um das Kundenerlebnis und die Agentenproduktivität zu verbessern. Die API umfasst leistungsfähige Sprache-zu-Text- und benutzerdefinierte NLP-Modelle (Natural Language Processing, natürliche Sprachverarbeitung), die speziell dazu trainiert wurden, Kundendienst- und ausgehende Vertriebsanrufe zu verstehen. Im Rahmen von AWS-Kontaktcenter-Intelligenz-Lösungen (CCI), dieser API Kontaktcenter-unabhängig und erleichtert den Kunden und ISVs das Hinzufügen von Anruf-Analyse-Fähigkeiten in ihre Anwendungen.
Was kann ich mit Amazon Transcribe Medical tun?
Amazon Transcribe Call Analytics kann sowohl Echtzeit- als auch Post-Call-Analytik durchführen. Mit Call Analytics können Entwickler wertvolle Intelligenz schnell hinzufügen, wie Kunden- und Kundendienstmitarbeiter-Stimmungspunktzahlen, Anruf-Treiber, Anrufkategorien, Anrufzusammenfassung als API-Eingabe zu einer eingehenden und ausgehenden Anruf-Anwendung. Zu den üblichen Anwendungsfällen gehören die Unterstützung von Kundendienstmitarbeitern, die Zusammenfassung, die Benachrichtigung von Vorgesetzten und die Analyse von Anrufen. Hier finden Sie zwei Open-Source-Beispiellösungen, die auf Transcribe Call Analytics basieren: Echtzeit-Anrufanalyse mit Kundendienstmitarbeiter-Unterstützung und Post Call Analytics.
F: Was sind die ersten Schritte mit Amazon Transcribe Medical?
Transcribe Call Analytics kann durch die APIs und AWS-Managementkonsole verwendet werden. Analyseaufträge können über die API oder die Konsole erstellt und überwacht werden. In der Konsole sehen Sie eine Liste von Analyse-Aufträgen und eine Auftragsinformationen-Seite mit Eingabe-Parameter und einer JSON-Ausgabe-Vorschau. Außerdem können Sie Kategorien durch die APIs oder die Konsole für die automatisierte Kontaktorganisation-Funktion erstellen und bearbeiten.
F. Welche Sprachen unterstützt Amazon Transcribe Medical?
Informationen zur Sprachverfügbarkeit der automatischen Redaktion von Inhalten/PII finden Sie in der Dokumentation von Amazon Transcribe.
F. In welchen AWS-Regionen ist Amazon Transcribe Call Analytics verfügbar?
Informationen zur AWS-Regionsabdeckung für Amazon Transcribe Call Analytics finden Sie in der Dokumentation zu den regionalen AWS-Services. Bitte beachten Sie, dass die generative Anrufzusammenfassung von Amazon Transcribe Call Analytics aktuell nur in den USA Ost (Nord-Virginia) und USA West (Oregon) verfügbar ist.
F. Ist die generative Anrufzusammenfassung sowohl mit der Transcribe-Call-Analytics-API nach dem Anruf als auch mit der Transcribe-Call-Analytics-API in Echtzeit verfügbar?
Derzeit ist die generative Anrufzusammenfassung nur mit der Transcribe-Call-Analytics-API für Analysen nach dem Anruf verfügbar.
F: Wie funktionieren die Preise für Amazon Transcribe Call Analytics?
Die Call-Analytics-API von Amazon Transcribe wird separat von den Standard-Amazon-Transcribe-APIs berechnet. Weitere Informationen finden Sie auf der Amazon-Transcribe-Seite mit den Preisangaben.
Amazon Transcribe Medical
F: Was ist Amazon Transcribe Medical?
Amazon Transcribe Medical ist ein automatischer Spracherkennungsservice (ASR), der es Entwicklern leicht macht, ihren Anwendungen die medizinischen Sprach-zu-Text-Funktionen hinzuzufügen Mit Amazon Transcribe Medical können Sie medizinische Diktate und Gesprächsreden schnell und genau in Text für eine Vielzahl von Zwecken transkribieren, z. B. die Aufzeichnung von Arztnotizen oder die Verarbeitung in nachgelagerten Textanalysen für sinnvolle Einblicke.
F: Was kann ich mit Amazon Transcribe Medical tun?
Amazon Transcribe Medical verwendet fortschrittliche Machine Learning-Modelle, um medizinische Sprache präzise in Text zu transkribieren. Transcribe Medical kann Texttranskripte generieren, die in einer Vielzahl von Anwendungsfällen verwendet werden können, wie z. B. beim Workflow für klinische Dokumentation, bei der Arzneimittelüberwachung (Pharmakovigilanz) und der Untertitelung der Telemedizin und sogar der Kontaktcenteranalyse in der Gesundheits- und Biowissenschaft-Bereiche.
F: Muss ich ein Experte für die automatische Spracherkennung (ASR) sein, um Amazon Transcribe Medical verwenden zu können?
Nein, Sie benötigen keine ASR- oder Machine Learning-Kompetenz, um Amazon Transcribe Medical verwenden zu können. Sie müssen nur die API von Transcribe Medical aufrufen und der Dienst verarbeitet das erforderliche Machine Learning im Backend, um medizinische Sprache in Text zu transkribieren.
F: Was sind die ersten Schritte mit Amazon Transcribe Medical?
Sie können mit Amazon Transcribe Medical über die AWS Management-Konsole oder über das SDK beginnen. Weitere Informationen finden Sie auf dieser Seite zur technischen Dokumentation.
Amazon Transcribe Medical bietet eine kostenlose Stufe, damit Sie den Service ausprobieren können. Weitere Informationen finden Sie auf der Preisseite.
F: Welche Sprachen unterstützt Amazon Transcribe Medical?
Amazon Transcribe Medical unterstützt derzeit die medizinische Transkription in US-Englisch.
F: Welche medizinischen Spezialitäten unterstützt Amazon Transcribe Medical?
Amazon Transcribe Medical unterstützt die Transkription für eine wachsende Liste von Grundversorgungs- und Facharztpraxen. Besuchen Sie unsere Dokumentation für eine vollständige Liste der unterstützten medizinischen Fachgebiete.
F: In welchen AWS-Regionen ist Amazon Transcribe Medical verfügbar?
Informationen zur AWS-Regionsabdeckung für Amazon Transcribe Medical finden Sie in der Dokumentation zu den regionalen AWS-Services.
F. Wie ist der Preis für Amazon Transcribe Medical?
Weitere Informationenzu den Preisangaben finden Sie auf der Preisseite von Amazon Transcribe Medical.
F: Ist Amazon Transcribe Medical HIPAA-berechtigt?
Ja.
F: Werden die von Amazon Transcribe Medical verarbeiteten Inhalte für andere Zwecke als die Erbringung des Dienstes verwendet?
Amazon Transcribe Medical verwendet keine vom Service verarbeiteten Inhalte aus anderen Gründen als zur Bereitstellung und Wartung des Service. Die vom Service verarbeiteten Inhalte werden nicht verwendet, um die Qualität für Amazon Transcribe Medical oder andere Amazon Technologien wie Machine Learning/Artificial Intelligence zu entwickeln oder zu verbessern.
F: Lernt Amazon Transcribe Medical im Laufe der Zeit?
Ja, Amazon Transcribe Medical nutzt Machine Learning und wird ständig geschult, um es für Ihre Anwendungsfälle effektiver zu machen. Amazon Transcribe Medical speichert oder verwendet keine Kundendaten, die mit dem Dienst verwendet werden, um die Modelle zu schulen.
F: Was sollte ich noch wissen, bevor ich den Amazon Transcribe Medical-Service in Anspruch nehme?
Amazon Transcribe Medical ist kein Ersatz für professionelle medizinische Beratung, Diagnose oder Behandlung. Sie und Ihre Endbenutzer sind dafür verantwortlich, dass Sie und ihre eigene Diskretion, Erfahrung und Urteilskraft bei der Bestimmung der Richtigkeit, Vollständigkeit, Aktualität und Eignung der von Amazon Transcribe Medical bereitgestellten Informationen ausüben. Sie und Ihre Endbenutzer sind allein verantwortlich für alle Entscheidungen, Ratschläge, Aktionen und/oder Unterlassungen, die auf der Nutzung von Amazon Transcribe Medical basieren.
Amazon Transcribe Medical kann geschützte Gesundheitsinformationen nicht unter allen Umständen genau identifizieren und erfüllt nicht die Anforderungen für die Deidentifizierung von geschützten Gesundheitsinformationen gemäß HIPAA. Sie sind dafür verantwortlich, alle von Amazon Transcribe Medical zur Verfügung gestellten Ergebnisse zu überprüfen, damit sie Ihren Bedürfnissen entsprechen.
Benutzerdefinierte Sprachmodelle
F: Welche Funktionalität bieten benutzerdefinierte Sprachmodelle heute?
Sie können benutzerdefinierte Sprachmodelle (CLM) verwenden, um domänenspezifische Sprachmodelle zu trainieren und zu entwickeln. CLM unterstützt derzeit die Batch-Transkriptionen von australischem Englisch, britischem Englisch, Hindi, US-Englisch und US-Spanisch und die Streaming-Transkriptionen von US-Englisch. CLM unterstützt die gleichzeitige Verwendung von benutzerdefiniertem Vokabular für Batch-Transkriptionen.
F: Wie viele und welche Art von Trainingsdaten benötige ich? Woher bekomme ich die Daten? Müssen die Daten ein bestimmtes Format haben?
Die Textdaten sollten für das Audio, das mit dem benutzerdefinierten Modell transkribiert wird, relevant sein; sie sollten möglichst viele der domänenspezifischen Wörter, Wortgruppen und Wortkombinationen enthalten. Wir empfehlen, mindestens 100 000 und höchstens 10 000 000 Wörter Fließtext zu verwenden. Textdatenressourcen können aus beliebigen internen oder öffentlichen Quellen bezogen werden (z. B. unter Verwendung von Texten von Kunden-Websites). Wir empfehlen, dass jede einfache Textdatei 200 000 Wörter oder mehr, aber nicht mehr als 1 GB in der Gesamtdateigröße enthält. Der Text sollte in UTF-8 sein und einen Satz pro Zeile verwenden. Jeder Satz sollte Interpunktion enthalten. Die Benutzer sind für die Rechtschreibprüfung, das Entfernen von Formatierungszeichen und die Validierung der Kodierung verantwortlich.
F: Wie verwende ich benutzerdefinierte Sprachmodelle (CLM)?
Um ein benutzerdefiniertes Sprachmodell zu trainieren, liefern Kunden die Textdaten einfach in einem Amazon S3-Bucket. Benutzer können dann die Amazon Transcribe-Servicekonsole verwenden, um die Daten zu laden und zu verarbeiten, um ein benutzerdefiniertes Sprachmodell zu trainieren. Das Training ist vollständig automatisiert und erfordert nur minimale Eingriffe seitens des Benutzers. Wenn das endgültige benutzerdefinierte Modell fertig ist, wird es im AWS-Konto des Kunden für die Transkription domänenspezifischer Audiodateien zur Verfügung gestellt. Darüber hinaus können Kunden mehrere benutzerdefinierte Modelle für die Verwendung in einer Vielzahl von unterschiedlichen Anwendungsfällen trainieren.
F: Sind Verbesserungen garantiert? Lohnt sich der Aufwand für das Sammeln von Textdaten?
Verbesserungen sind nicht garantiert – die Veränderung der Leistung hängt davon ab, wie gut die Textdaten mit dem Audio übereinstimmen und wie viele Daten bereitgestellt wurden. Mehr Daten sind im Allgemeinen besser, aber am wichtigsten ist, dass die Daten Wörter und Wortfolgen abdecken, die in den Audiodateien, die Sie transkribieren möchten, voraussichtlich vorkommen werden. Verbesserungen der Transkriptionsgenauigkeit hängen sowohl von der Qualität der Trainingsdaten als auch vom Anwendungsfall ab. In einigen Szenarien zeigt ein allgemeines Benchmarking eine Verbesserung der relativen Genauigkeit um 10 bis 15 % an.
F: Wie lange dauert das Modelltraining? Wann werde ich es nutzen können?
Das Modelltraining dauert in der Regel zwischen 6 und 10 Stunden. Die Länge der Trainingszeit hängt davon ab, wie groß das Dataset ist. Das benutzerdefinierte Modell wird direkt nach Abschluss des Trainings verfügbar sein.
F: Wie werde ich das Modell verwenden können? Wie erfahre ich, ob es besser funktioniert als das generische Modell von Amazon Transcribe?
Das Modell wird in Ihrem Konto unter einer Modell-ID zur Verfügung gestellt, die Sie vor dem Trainingsprozess zugewiesen hat. Um das Modell verwenden zu können, muss der Transkriptionsanfrage ein Kennzeichen mit der Modell-ID hinzugefügt werden. Sie sollten das Modell an Ihren Audiodateien testen und die Ausgabe mit den Ergebnissen des generischen Moduls vergleichen.
F: Wie viele benutzerdefinierte Sprachmodelle kann ich trainieren? Kann ich mehrere Modelle gleichzeitig für mein Konto aktivieren?
Sie können pro AWS-Konto bis zu 5 verschiedene Modelle gleichzeitig trainieren. Für jedes Konto können Sie standardmäßig maximal 10 Modelle speichern. Wenn mehr benötigt wird, können hier Servicelimiterhöhungen vorgenommen werden.
F: Werden benutzerdefinierte akustische Modelle unterstützt?
Nein. Benutzerdefinierte akustische Modelle werden nicht unterstützt. Benutzerdefinierte Sprachmodelle werden auf der Grundlage von Textdaten erstellt, die für Ihren Anwendungsfall oder Ihre Domäne relevant sind.
Weitere Informationen zu den Amazon Transcribe-Preisen