< Volver al sumario
Volumen 33 - Número 2 - Abril-Junio 2025
Modelos de lenguaje multimodal: explorando el uso de la IA en oftalmología

R. Bouchikh-El Jarroudi1,2, FJ. Valentín-Bravo1,3, L. Broc-Iturralde1, T. Croitoru-Croitoru1, A. Ross Jenkinson-Macia1, X. Valldeperas1
1Servicio de Oftalmología. Hospital Universitari Germans Trias i Pujol. Badalona. Barcelona. España.
2Unidad de Oftalmología Basada en Evidencias (Oftalmoevidencia). Scientia Clinical and Epidemiological Research Institute. Trujillo. Perú.
3Institut Català de la Retina (ICR). Barcelona. España.

CORRESPONDENCIA
Rachid Bouchikh El Jarroudi
E-mail: rachid.bascara@gmail.com

RESUMEN
Introducción: La inteligencia artificial (IA) ha emergido como una herramienta crucial en diversas disciplinas médicas, incluyendo la oftalmología. Este avance se sustenta en la capacidad de las computadoras para realizar tareas tradicionalmente exclusivas del ser humano mediante sistemas de aprendizaje automático. Los modelos de lenguaje multimodal (LLM por su nombre en inglés Large Lenguage Model), como ChatGPT-4, destacan por su habilidad para responder a consultas de texto libre y, más recientemente, imágenes.
Caso clínico: Este estudio trata de evaluar potencial diagnóstico de un LLM desarrollado por Open AI, ChatGPT-4, para proporcionar un análisis interpretativo de imágenes oftalmológicas realizadas mediante biomicroscopía de polo anterior.
Conclusión: La IA y los LLM son herramientas prometedoras para mejorar la eficiencia y precisión en el diagnóstico y tratamiento en nuestra disciplina. Sin embargo, a pesar del conocimiento demostrado por esta herramienta, y la gran capacidad para definir diferentes estructuras oculares, la precisión y fiabilidad de los informes aportados actualmente son limitados.

RESUM
Introducció: La intel·ligència artificial (IA) ha emergit com una eina crucial en vàries especialitats mèdiques, inclosa l'oftalmologia. Aquest avanç es sustenta en la capacitat dels ordinadors per executar tasques tradicionalment exclusives del ésser humà mitjançant sistemes d’aprenentatge automàtic. Els models de llenguatge multimodal (LLM pel seu nom en anglès Large Lenguage Model), com ChatGPT-4, destaquen per la seva habilitat per respondre a consultes de text lliure i, més recentment, imatges.
Cas clínic: Aquest estudi tracta d’avaluar el potencial diagnòstic d’un LLM desenvolupat per OPEN AI, ChatGPT-4, per proporcionar una anàlisi interpretativa de les imatges oftalmològiques realitzades mitjançant biomicroscòpia de pol anterior.
Conclusió: La IA i els LLM són eines prometedores per millorar l’eficiència i precisió en el diagnòstic i tractament en la nostra disciplina. No obstant, tot i el coneixement demostrat per aquesta eina, i la gran capacitat per definir diferents estructures oculars, la precisió i fiabilitat dels informes aportats actualment són limitats.

ABSTRACT
Introduction: Artificial intelligence (AI) has emerged as a crucial tool in several medical disciplines, including ophthalmology. This advance is based on the ability of computers to perform tasks traditionally exclusive to humans using machine learning systems. Multimodal language models (LLMs), such as ChatGPT-4, are notable for their ability to respond to free-text queries and, more recently, images.
Clinical case: This study aims to evaluate the diagnostic potential of an Open AI-developed LLM, ChatGPT-4, to provide interpretive analysis of ophthalmological images performed by anterior pole biomicroscopy.
Conclusion: AI and LLMs are promising tools to improve the efficiency and accuracy of diagnosis and treatment in our discipline. However, despite the knowledge demonstrated by this tool, and the great capacity to define different ocular structures, the accuracy and reliability of the reports currently provided are limited.