MODELO DE MACHINE LEARNING (RANDOM FOREST) PARA LA DETECCIÓN AUTOMÁTICA DE LA ESCLEROSIS MÚLTIPLE MEDIANTE EL ANÁLISIS ACÚSTICO DE LA VOZ

  1. Delgado Hernández, J 1
  2. Hernández Pérez, M
  3. Abreu Rodríguez, R
  4. Betancort Montesinos, M. 1
  1. 1 Universidad de La Laguna
    info

    Universidad de La Laguna

    San Cristobal de La Laguna, España

    ROR https://ror.org/01r9z8p25

Proceedings:
LXXVI Reunión Anual de la Sociedad Española de Neurología (SEN)

Publisher: Eselvier ; Sociedad Española de Neurología

ISSN: 2667-0496

Year of publication: 2024

Pages: 1032

Type: Conference paper

Abstract

Objetivos: El objetivo de este trabajo es entrenar y probar un algoritmo de aprendizaje supervisadoque permita detectar la EM a través del análisis de los parámetros acústicos de la voz.Material y métodos: Participaron voluntariamente 110 personas con una media de edad de 50 años(DT = 10,3) sin alteraciones orgánicas de la voz, 75 diagnosticadas de EM (GEM), con una evoluciónmedia de la enfermedad de 10,8 años, y 35 neurológicamente sanas (GC). Un 54,6% del GEMpresenta un curso clínico RR, un 38,6% SP y un 6,6% PP. Se grabó a cada participante una vocalsostenida durante cuatro segundos con Praat.Resultados: Se aplicó un modelo random forest con validación cruzada. Se estableció como variablecriterio el grupo (GC y GEM) y como predictoras los parámetros acústicos: F0DS, Shimmer, HNR,CPPS y GNE. Se dividió la muestra aleatoriamente para la fase de entrenamiento del modelo (70%) ypara la fase de test (30%). Los resultados muestran un mtry = 2 con una precisión del 0,83,OBB = 16,83% y fiabilidad del 0,58 (kappa). El modelo fue probado en la fase test con unasensibilidad del 80% y una especificidad del 90% (AUC-ROC = 0,93). Se comparó la precisión en laclasificación de diferentes algoritmos de aprendizaje supervisado (Partial Least Squares, RandomForest, K-Nearest Neighbors algorithm y Decision Tree Classification) siendo el random forestutilizado en este estudio el que presenta una mayor precisión y fiabilidad.Conclusión: El modelo de machine learning propuesto es capaz de clasificar automáticamente apersonas con y sin EM con una alta sensibilidad y especificidad.