Song, D., Su, X., Li, W., Sun, Z., Ren, T., Liu, W., Liu, A., 2023: Spatial-temporal transformer network for multi-year ENSO prediction, Front. Mar. Sci., https://doi.org/10.3389/fmars.2023.1143499

Intérprete

Obregon Jose

Fecha de interpretación

16/01/2026

Revisor

Takahashi Guevara Ken

Resultados y conclusiones

La Red Transformer Espacio-Temporal (STTN, por sus siglas en inglés) demostró un aceptable rendimiento en la predicción multianual del ENSO, alcanzando un coeficiente de correlación de al menos 0.5 durante hasta 15 meses de anticipación en la temporada mayo-julio (MJJ), superando a los modelos SINTEX-F (4 meses), MS-CNN (10 meses) y CNN (11 meses). Mantuvo predicciones precisas del índice Niño 3.4 hasta con 18 meses de anticipación utilizando un solo modelo, a diferencia de los enfoques anteriores que requerían miles de modelos (p. ej., el conjunto CNN con 11040 modelos y ~2290 millones de parámetros). La STTN se entrenó con CMIP5 (1861-2004), se validó con SODA (1871-1973) y se testeó con GODAS (1982-2017), utilizando campos de anomalías de SST y contenido de calor. La precisión del modelo se vio respaldada por valores RMSE y MAE más bajos en comparación con las líneas base, y los estudios de ablación demostraron que cada componente, en especial la integración del índice mensual, la estrategia de predicción recurrente (RPS) y la atención espaciotemporal, fue crucial para mantener la precisión de los pronósticos a largo plazo. Además, las pruebas de sensibilidad del horizonte temporal de entrada revelaron un rendimiento óptimo utilizando datos de entrada de 3, 6, 9 y 12 meses para los pronósticos a corto, medio y largo plazo, respectivamente. Estos resultados destacan la eficacia y eficiencia de STTN para generar pronósticos precisos del ENSO a largo plazo.

Metodología y datos

La metodología del estudio se centra en una Red Transformer Espacio-Temporal (STTN, por sus siglas en inglés) entrenada y evaluada utilizando datos de anomalías de la temperatura superficial del mar (SSTA) y anomalías del contenido de calor (HCA) en una grilla de 5°×5° (180°O–180°E, 55°S–60°N). Las entradas comprendían mapas mensuales consecutivos de SSTA y HCA (procesados como cuadrículas enteras incrustadas en parches en vectores de 8×12), aumentados con incrustaciones espaciales aprendidas y codificaciones temporales sinusoidales (mes del calendario y posición de la secuencia). El codificador empleó seis capas de autoatención multicabezal: primero a lo largo del eje temporal (con parches en diferentes momentos de atención), luego espacialmente dentro de cada marco temporal, seguido de MLP (multilayer perceptron) y conexiones residuales. Para los pronósticos a largo plazo, el modelo adoptó una estrategia de predicción recurrente: tras generar el índice Niño3.4 de cada mes mediante un decodificador (seis capas de tipo transformer que utilizan autoatención y atención cruzada enmascaradas, y un token CLS a partir de características de SSTA promediadas), se empleó convolución temporal (tamaño de kernel k=4) para incorporar predicciones previas en los pasos subsiguientes. Los hiperparámetros del modelo incluyeron seis capas de codificador/decodificador, seis cabezas de atención, tamaño de parche 8×12, dimensión de atención D₁=384 (codificador), D₂=768 (decodificador), dropout 0.1 y control de semilla para la reproducibilidad. Los datos se dividieron entre CMIP5 (1861–2004) para entrenamiento, SODA (1871–1973) para validación y GODAS (1982–2017) para pruebas, con validación adicional en los conjuntos de datos CMIP6, SODA y GODAS, todos utilizando extracción SSTA/HCA idéntica y evaluación del índice Niño3.4 a través de correlación de anomalías temporales y RMSE.

Limitaciones de la investigación

El estudio reconoce varias limitaciones que pueden afectar la generalización y la aplicabilidad operativa del modelo STTN propuesto. En primer lugar, si bien el modelo se entrena con simulaciones históricas extensas del CMIP5 (1861-2004) y se valida con los conjuntos de datos de reanálisis SODA y GODAS, los datos de entrenamiento pueden contener sesgos inherentes a los resultados del CMIP5, lo que podría afectar la precisión de las predicciones en el mundo real. En segundo lugar, si bien el modelo logra pronósticos precisos hasta con 18-23 meses de anticipación, su rendimiento más allá de los 15 meses de anticipación se vuelve más incierto, y la capacidad predictiva varía según la estación y el tipo de evento ENSO. En tercer lugar, la resolución espacial de 5°×5° puede suavizar características importantes de mesoescala que podrían influir en la dinámica del ENSO, y el uso de SSTA y contenido de calor de grilla gruesa podría limitar la sensibilidad a las interacciones océano-atmósfera a escala más fina. Finalmente, a pesar de mostrar resultados superiores en experimentos controlados, no se evaluó la robustez del modelo en condiciones de pronóstico en tiempo real, incluida la latencia de los datos, el ruido o la deriva del modelo, lo que destaca la necesidad de realizar más pruebas en entornos completamente operativos.

Recomendaciones

Los autores recomiendan varias direcciones para mejorar el rendimiento y la aplicabilidad del modelo STTN. Sugieren explorar entradas de mayor resolución espacial, como datos de SST de 1°×1° y temperatura del subsuelo, para capturar mejor la variabilidad de mesoescala y las interacciones océano-atmósfera de grilla fina que influyen en ENSO. Además, proponen integrar variables físicas adicionales, como la tensión del viento, la profundidad de la termoclina y la presión a nivel del mar, para enriquecer el espacio de características y mejorar la capacidad de pronóstico a largo plazo. También se recomienda la inclusión de conjuntos de datos observacionales en tiempo real o casi en tiempo real para evaluar el modelo en condiciones operativas y evaluar su robustez en la práctica. Además, extender el modelo para soportar pronóstico probabilístico podría proporcionar cuantificación de la incertidumbre, lo cual es crucial para la toma de decisiones en sectores sensibles al clima. Finalmente, adaptar la arquitectura a otros modos climáticos (p. ej., IOD o AMO) y aplicar el aprendizaje por transferencia entre regiones y fenómenos podría generalizar el marco para tareas más amplias de pronóstico climático.

Adaptación: ---

Mitigación: ---

Escala: Global

Ámbito geográfico: regional

Palabras clave: ENSO

Cita de la interpretación

Obregon, Jose, 2026: Interpretación de Song et al. (2023, doi:10.3389/fmars.2023.1143499), Observatorio de Conocimiento Científico sobre Cambio Climático del Perú, IGP, https://cienciaclimatica.igp.gob.pe/entities/interpretation/9f2a6c88-0e05-4b80-8600-545edbd7d4d5