Une étude récente a évalué et comparé les performances de ChatGPT-3.5, ChatGPT-4 Omni (4o), Google Bard et Microsoft Copilot dans la réponse à des questions à choix multiples en radiologie buccale. Cette analyse s’est basée sur les questions de l’examen d’admission en spécialité dentaire (DUS) en Turquie.
Méthodologie de l’étude
L’étude a utilisé 123 questions issues de la banque de données du DUS couvrant les années 2012 à 2021. Chaque question comportait cinq options avec une seule réponse correcte. Les performances des chatbots ont été comparées selon les critères suivants :
Précision des réponses (nombre de réponses correctes / total des questions posées)
Temps de réponse
Nombre de mots dans les réponses
Les analyses statistiques ont été menées à l’aide du test de Kruskal-Wallis, du test post hoc de Dunn et du test Q de Cochran pour évaluer les différences significatives entre les performances des modèles.
Résultats principaux
Les résultats ont montré des écarts significatifs entre les modèles évalués :
ChatGPT-4o a démontré la meilleure précision globale avec 86,1 % de réponses correctes, mettant en avant son raisonnement avancé.
Google Bard a obtenu 61,8 %, offrant des réponses plus détaillées mais avec un taux d’exactitude inférieur.
ChatGPT-3.5 a atteint 43,9 %, avec un temps de réponse plus rapide mais une précision réduite.
Microsoft Copilot a présenté la performance la plus basse avec 41,5 %.
Implications et perspectives
L’étude met en lumière le rôle croissant des modèles de langage dans l’éducation médicale, en particulier en radiologie dentaire, où la précision et la rapidité d’analyse sont essentielles. ChatGPT-4o, avec ses capacités de traitement améliorées, semble être un outil prometteur pour l’accompagnement des étudiants et professionnels de santé.
Toutefois, les chercheurs soulignent que, malgré les avancées, ces outils ne remplacent pas l’expertise humaine et doivent être utilisés avec prudence. Des études futures pourraient explorer leur utilisation pour l’analyse d’images radiologiques et l’élargissement des bases de données utilisées pour l’entraînement des modèles.
Conclusion
L’évaluation des modèles d’IA dans un cadre académique et médical montre un potentiel significatif pour l’éducation et la formation en radiologie buccale. ChatGPT-4o se démarque par sa précision accrue, tandis que Google Bard fournit des réponses détaillées mais moins exactes. À mesure que ces technologies évoluent, leur intégration dans l’enseignement et la pratique clinique devra être accompagnée de protocoles rigoureux garantissant leur fiabilité et leur pertinence.
Connectez-vous pour accéder à votre compte et retrouver tous vos avantages.
PREMIÈRE VISITE ?
Bonjour chèr(e) inconnu(e), on ne se connait pas encore… Aucun problème, inscrivez-vous sans plus attendre.
Bienvenue sur Dynamique Dentaire
Dynamique Dentaire est un site d’information et de services réservé aux professionnels de santé.
En poursuivant la navigation, vous acceptez que nos partenaires et nous-mêmes stockions et/ou accédions à des informations sur votre appareil par l’intermédiaire de cookies ou de technologies similaires. Ces informations personnelles peuvent être utilisées pour améliorer votre expérience sur le site, vous présenter des publicités et du contenu personnalisés, mesurer la performance publicitaire et du contenu, en savoir plus sur notre audience et développer des produits et services. Pour en savoir plus, consultez notre politique de confidentialité.
Vous avez la possibilité de :
- Accepter la politique de confidentialité de Dynamique Dentaire et ses partenaires en cliquant sur le bouton "Je certifie être un professionnel de santé et accepte la politique de confidentialité"
- Paramétrer vos choix pour accepter les cookies ou non en cliquant sur le bouton "Je souhaite Gérer mes préférences"
Le site de Dynamique Dentaire utilise des cookies pour améliorer votre expérience de navigation. Certains cookies considérés comme nécessaires seront stockés sur votre navigateur car ils sont indispensables pour faire fonctionner les fonctionnalités de base du site. D’autres cookies, considérés comme non nécessaires, nous aident à vous présenter des publicités et du contenu personnalisés, mesurer la performance du contenu et publicitaire, en savoir plus sur notre audience et à développer des produits et services.
Les cookies nécessaires sont absolument essentiels pour le fonctionnement du site. Cette catégorie contient des cookies qui assurent les fonctions de bases de site et tout ce qui concerne sa sécurité. Ces cookies ne stockent pas d’informations personnelles.
Les cookies de publicité sont utilisés pour diffuser des publicités pertinentes aux utilisateurs. Ces cookies pistent les utilisateurs sur le site et collecte des informations pour procurer des publicités ciblées.
Ces cookies sont utilisés pour comprendre et analyser la performance du site (vitesse d'affichage) et aider à livrer une meilleure expérience pour les utilisateurs.