Questions fréquentes (FAQ) sur Amazon SageMaker Ground Truth
Généralités
Q : Qu’est-ce que l’humain dans la boucle et pourquoi est-ce important pour créer des applications basées sur l’IA ?
L’humain dans la boucle est le processus qui consiste à exploiter les données humaines tout au long du cycle de vie du ML afin d’améliorer la précision et la pertinence des modèles. Les humains peuvent effectuer diverses tâches, allant de la génération et de l’annotation de données à la révision, à la personnalisation et à l’évaluation des modèles. L’intervention humaine est particulièrement importante pour les applications d’IA générative, où les humains sont généralement à la fois le demandeur et le consommateur du contenu. Il est donc essentiel que les humains entraînent les modèles de fondation (FM) à répondre de manière précise, sûre et pertinente aux demandes des utilisateurs. Les commentaires humains peuvent être appliqués pour vous aider à accomplir plusieurs tâches. Tout d'abord, en créant des jeux de données d'entraînement labellisés de haute qualité pour des applications d'IA générative via un apprentissage supervisé (où un humain simule le style, la longueur et la précision de la manière dont un modèle doit répondre aux instructions de l'utilisateur) et un apprentissage de renforcement avec des commentaires humains (où un humain classe et classifie les réponses du modèle). Ensuite, en utilisant des données générées par l’homme pour personnaliser les FM en fonction de tâches spécifiques ou avec des données propres à votre entreprise et à votre domaine et pour rendre les résultats du modèle pertinents pour vous. Enfin, en utilisant l’évaluation et la comparaison humaines pour sélectionner le FM le mieux adapté à votre cas d’utilisation et aux exigences de votre projet.
Quelle est la différence entre les offres en libre-service d’Amazon SageMaker Ground Truth et les offres gérées par AWS ?
Amazon SageMaker Ground Truth propose l’ensemble le plus complet de fonctionnalités de l’humain dans la boucle. Il existe deux manières d'utiliser Amazon SageMaker Ground Truth : une offre en libre-service et une offre gérée par AWS. Dans le cadre de l'offre en libre-service, vos annotateurs de données, vos créateurs de contenu et vos ingénieurs de requête (en interne, gérés par le fournisseur ou tirant parti du public) peuvent utiliser notre interface utilisateur à faible code pour accélérer les tâches de l'humain dans la boucle, tout en ayant la flexibilité nécessaire pour créer et gérer vos propres flux de travail personnalisés. Dans le cadre de l'offre gérée par AWS (SageMaker Ground Truth Plus), nous nous chargeons du gros du travail à votre place, notamment en sélectionnant et en gérant la main-d'œuvre adaptée à votre cas d'utilisation. SageMaker Ground Truth Plus conçoit et personnalise un flux de travail de bout en bout (y compris l’entraînement détaillé du personnel et les étapes d’assurance qualité), fournit une équipe qualifiée gérée par AWS qui est formée aux tâches spécifiques et répond à vos exigences en matière de qualité, de sécurité et de conformité des données.
Q : Comment utiliser les fonctionnalités de l’humain dans la boucle pour les applications d’IA générative à technologie de FM ?
Les fonctionnalités de l’humain dans la boucle jouent un rôle important dans la création et l’amélioration des applications d’IA générative à technologie de FM. Une main-d'œuvre humaine hautement qualifiée formée selon les directives relatives aux tâches peut fournir des commentaires, des conseils, des contributions et des évaluations dans le cadre d'activités telles que la génération de données de démonstration pour entraîner les FM, la correction et l'amélioration des exemples de réponse, l'affinement d'un modèle basé sur les données de l'entreprise et de l'industrie, la protection contre la toxicité et les biais, etc. Les fonctionnalités de l’humain dans la boucle peuvent donc améliorer la précision et les performances des modèles.
Q : Comment démarrer avec Amazon SageMaker Ground Truth ?
Pour démarrer avec Amazon SageMaker Ground Truth Plus (offre gérée par AWS), remplissez le formulaire des exigences relatif au projet. Notre équipe vous contactera pour discuter de votre projet d’humain dans la boucle.
Pour démarrer avec Amazon SageMaker Ground Truth (offre en libre-service), connectez-vous à la Console de gestion AWS, puis accédez à la console SageMaker. À partir de là, sélectionnez tâches d’étiquetage sous Ground Truth. Vous pouvez créer une tâche d’étiquetage à cet endroit. Tout d'abord, dans le cadre du processus de création d'une tâche d'étiquetage, vous fournissez un pointeur vers le compartiment S3 qui contient votre jeu de données à étiqueter. Ground Truth propose des modèles pour les tâches d'étiquetage courantes dans lesquelles il vous suffit de cliquer sur quelques choix et de fournir des instructions minimales sur la manière d'étiqueter vos données. Vous pouvez également créer votre propre modèle personnalisé. Lors de la dernière étape de la création d'une tâche d'étiquetage, vous sélectionnez l'une des trois options de main-d'œuvre humaine : (1) une main-d'œuvre publique participative, (2) un ensemble de fournisseurs de services tiers d'étiquetage de données sélectionnés, ou (3) vos propres employés. Vous avez également la possibilité d’activer l’étiquetage des données automatisé.
Q : Comment Amazon SageMaker Ground Truth permet-il de protéger mes données ?
Par défaut, Amazon SageMaker Ground Truth chiffre les données stockées au repos ou en transit dans un compartiment Amazon S3. En outre, l’accès à vos données est contrôlé à l’aide d’AWS Identity and Access Management (IAM). SageMaker Ground Truth ne stocke ni ne copie vos données en dehors de votre environnement AWS (créé par vous ou par le biais d’un service géré par AWS) et vos données restent sous votre contrôle. En outre, Ground Truth prend en charge les normes de conformité telles que le règlement général sur la protection des données (RGPD), et procède à l’enregistrement et à l’audit de tous les accès à vos données à l’aide d’Amazon CloudWatch et d’Amazon CloudTrail. Reportez-vous à la documentation d’Amazon SageMaker Ground Truth pour plus d’informations.
Q : Comment Amazon SageMaker Ground Truth trouve-t-il la main-d’œuvre appropriée pour mon projet ?
Avec Amazon SageMaker Ground Truth Plus (offre gérée par AWS), vous pouvez accéder à une main-d’œuvre experte, à la demande, qui est formée à vos tâches spécifiques d’IA/de ML, peut augmenter ou réduire vos flux de travail de façon dynamique en fonction des exigences propres au projet et peut vous aider à répondre à vos exigences de qualité, de sécurité et de conformité des données. Notre équipe collaborera avec vous afin de cerner les compétences requises pour votre projet et le doter de la main-d’œuvre appropriée.
Q : Quel est le coût d’Amazon SageMaker Ground Truth et dans quelles Régions AWS est-il disponible ?
Veuillez vous reporter à la page de tarification de SageMaker Ground Truth pour obtenir les informations de tarification actuelles. Les projets SageMaker Ground Truth Plus sont facturés individuellement et notre équipe étudiera les options de tarification avec vous une fois que vous aurez transmis un formulaire d’exigences du projet.
Le tableau des Régions AWS répertorie toutes les Régions AWS où Amazon SageMaker Ground Truth est actuellement disponible.