Entrevista | Ángel López Matemático e investigador de la Universidade da Coruña

“Con inteligencia artificial podemos ver a qué familia pertenece un virus recién descubierto”

“Mi algoritmo agrupó a las empresas por sectores sabiendo solo su valor en bolsa”

El investigador Ángel López, con un premio recibido en 2022.   | // L. O.

El investigador Ángel López, con un premio recibido en 2022. | // L. O. / Enrique Carballo

El matemático Ángel López (Cedeira, 1994) ha combinado su disciplina con la inteligencia artificial para crear algoritmos que agrupan series de datos y pueden discernir, por ejemplo, en qué familia se puede encajar un virus sin clasificar tras leer su genoma, qué empresas se comportan de manera similar en la Bolsa o en qué comunidades la gente se comportó de forma parecida durante el COVID. Acaba de defender con éxito su investigación con una tesis en la Universidade da Coruña (UDC) dirigida por José Antonio Vilar.

La investigación parte de estudiar series de tiempo.

Se trata series en las que tenemos un dato que va cambiando a lo largo del tiempo. Puede ser el valor de una acción a lo largo de los días o puede ser el tamaño de la población a lo largo de los años, o el número de bicicletas vendidas por un comercio semanalmente. Cogemos un conjunto grande de series en el ámbito que queremos estudiar y a través de los algoritmos, de la inteligencia artificial, hacemos clustering, esto es, formamos grupos que sean similares.

¿Similares en qué sentido?

Pueden serlo de muchas formas, pero nuestros algoritmos lo que asumen aquí es que las series son similares si tienen comportamientos parecidos. Por ejemplo, si estamos siguiendo el precio de acciones de varias empresas, el algoritmo agrupa automáticamente a las que bajan, suben o se mantienen estables de manera similar.

¿Pero el algoritmo no puede definir a qué se debe esto, no?

No, no, claro. O sea, es simplemente medir la similaridad. Pero suponemos que en estos grupos hay algo que llamamos procesos generadores. Si ponemos cuatro series dentro de un grupo, con comportamientos que, digamos, son similares, entendemos que estos han sido generados por el mismo proceso.

¿Y qué tipo de procesos se pueden identificar? Ha publicado ya algunos artículos académicos usando este sistema para la bolsa...

Esto tiene varias aplicaciones, pero hay tres que fueron recurrentes durante la tesis. La primera es en mercados financieros: vimos que los algoritmos funcionaban muy bien detectando patrones allí. Por ejemplo, medimos diariamente el volumen de acciones de las empresas en el mercado americano a lo largo de 17 años, y también su rendimiento, esto es, si la acción subió, bajó y cuánto. Y el algoritmo agrupó a las compañías, de manera bastante exacta, en los sectores económicos.

Es decir, lo averiguó porque tenían un comportamiento similar, porque el algoritmo no sabía a qué sector pertenecían, ¿no?

Obviamente, el algoritmo no sabe nada de a qué sector pertenece cada compañía, el algoritmo es ciego para eso. Los agrupó y vimos que el grupo 1 pertenecía al sector de la alimentación, el grupo 2 a la banca... Eso no es una aplicación en sí misma todavía, pero es útil, porque luego puedes usarla en otro grupo de series de las que no sabes nada.

¿Qué otros grupos han conseguido formar sus algoritmos?

En datos medioambientales, cogimos 17 centrales térmicas, eléctricas, de Galicia, y vimos diariamente cuánto ozono emitían. El algoritmo, algo mejorado en relación al anterior, hizo tres grupos: en centrales situadas en zonas rurales, en zonas urbanas y en afueras de ciudades.

Trabajó con datos del COVID.

Diría que con el algoritmo más completo de la tesis. Cogimos datos de movilidad durante la pandemia, la gente que se movía a tiendas, locales de ocio... Divididos por comunidades autónomas. Vimos que los grupos se formaban en base a las políticas que se aplicaban en cada comunidad, o en diferencias geográficas, según hiciera frío o calor, en el norte y sur de la Península.

¿Estos sistemas pueden ayudar a ver cambios en los grupos?

Los algoritmos son eficientes, calculan de manera muy rápida: se pueden ir ejecutando durante días, meses, años, y cuando vean un cambio muy grande, avisar al ser humano, para que lo analice.

¿Cómo se pueden aplicar de forma innovadora?

Los usamos también para estudiar series de ADN de decenas de miles de virus, tratándolas como si fuese series temporales. Los grupos nos daban virus de la misma familia. El sistema se podría aplicar al genoma de organismos recién descubiertos, que no se sabe aún de qué familia son, para ver a cuál pertenecen y emplearse como herramienta.

Sacó el grado de Matemáticas en Santiago pero vino a doctorarse a la UDC. ¿Es A Coruña un buen lugar para la inteligencia artificial?

Aquí había, y hay, más financiación, y también me gustó que estuviera el Centro de Investigación en TIC (Citic), y que hubiera mucha gente con proyectos de investigación en estadística e informática. La Universidade de A Coruña es la mejor de Galicia en financiación y colaboraciones externas, en esto.

Suscríbete para seguir leyendo