Inicio Entrevistas Carlos Jerez, UAI: “No tiene mayor impacto que un investigador con una...

Carlos Jerez, UAI: “No tiene mayor impacto que un investigador con una gran base de datos la guarde para sí”

Una plataforma de datos abierta buscará integrar la información territorial que han producido distintas instituciones y particulares en Chile a lo largo de los años, para permitir una evaluación más completa, con posibilidad de anticipar escenarios posibles y así derivar en una toma de decisiones más informada.

78

Como cualquier autoridad universitaria, los días del director ejecutivo del Data Observatory y decano de la Facultad de Ingeniería y Ciencias de la UAI, Carlos Jerez, son ajetreados. Pero en marzo su agenda prácticamente se duplicó en intensidad. Y es que se viene un trabajo titánico para su facultad – y para el país – en los siguientes meses.

A través de la Agencia de Investigación Australiana –CSIRO-, la Fundación Data Observatory, la Facultad de Ingeniería y Ciencias de la Universidad Adolfo Ibáñez y Amazon Web Services (AWS), Chile administrará una plataforma mundial única de datos satelitales bajo el modelo de Cubo de Datos Abiertos –en inglés Open Data Cube. Esto es gracias al apoyo de la Agencia de Administración Espacial e Investigación (NASA) en servicio de CEOS, el Comité de Observación Satelital Terrestre.

El proyecto desarrollará una plataforma llamada Earth Analysis Interoperability Lab (EAIL) en un plazo de 11 meses, y estará disponible con datos de avanzada durante el 2021. El proyecto reúne a 34 agencias relacionadas a temas satelitales entre ellas NASA, ESA y JAXA, de Estados Unidos, Europa y Japón, respectivamente. Este Data Observatory ha trabajado estrechamente con CSIRO Chile para construir el primer Data Cube de Chile, y el proyecto EAIL mejorará aún más estas capacidades.

¿Cuál es el rol de la Universidad Adolfo Ibáñez, ¿Cómo es que llegan a involucrarse en este proyecto?
Todo nace del proyecto de la Fundación Data Observatory, que es parte de la política de ciencia y tecnología del ministerio (chileno del ramo). Es un ideal que busca conectar la industria con la academia y el gobierno, en torno al tema de datos. Tiene el propósito, por una parte, de generar una plataforma de alto nivel con los mejores estándares para lo que es datos abiertos. Por otra, busca formar capital humano asociado a esto; y la tercera parte es poder democratizar de alguna forma ese acceso a datos. Son datos abiertos. El origen son los datos astronómicos (que Chile produce) como ‘cancha de entrenamiento’ para algoritmos de Inteligencia Artificial y Data Science, donde vimos que las mismas lógicas en la utilización de datos que hacen los observatorios se pueden aplicar también en observación terrestre. La fundación se creó a principios del 2020, luego un llamado público y está integrada, además de la UAI, por el Ministerio de Ciencias, el Ministerio de Economía, Amazon Web Services y pronto se van a integrar nuevos socios. Ya en 2019 ya estábamos conversando con el Ministerio de innovación australiano y otras agencias de ese país, que nos mostraron esta tecnología de manejo de información satelital. Ahí es donde aparece CSIRO y el Data Observatory. Hoy, lo que logramos fue lanzar un primer piloto de un data cubes que es una plataforma para procesar datos de satélites de forma de poder dejarlos en la nube y así facilitar el acceso a la información, porque son imágenes muy pesadas…

De ahí el rol de Amazon Web Services (AWS), que es proveedor de servicios en la nube…
Exactamente. Por una parte, con esto estamos rompiendo ciertos paradigmas como que había que comprar costosos equipos. Eso ya no es necesario, porque lo tenemos alojado en la nube. El otro paradigma es que no tengo por qué ser una institución, una universidad o un centro de investigación para tener acceso a esa información: cualquier persona desde su casa puede conectarse desde internet y ‘hacer preguntas’ a esta base de datos para ver por ejemplo índice de precipitación en la zona central, poder comparar imágenes satelitales en distintos momentos y ver, por ejemplo, si es que hay tala ilegal en los bosques o, por ejemplo, ver gestión de recursos naturales.

¿Será solo con fines académicos?
Hay una cantidad de utilizaciones que uno puede hacer tanto desde el punto de vista público como desde el punto de vista privado también; público en general que quiere entender su zona y por ejemplo el comportamiento de un humedal. El concepto detrás es poner a disposición la información en plataformas de fácil acceso, utilizando esta idea de datos abiertos, donde la fundación no es dueña de los datos, porque los datos son de quienes los originan. Lo que pasa es que, utilizando un sistema de licenciamiento de estándares Internacionales, los usuarios pueden construir nuevos productos y servicios que no tienen por qué ser necesariamente remunerados, pero que sí agregan valor. Y aquí está el concepto detrás de la fundación Data Observatory, el concepto de data abierta y así agregar valor a los datos, gracias hay que podemos compartirlos en formatos que son interoperables.

Es como un Google Maps, entonces, pero con muchísimas más capas de información
Exactamente. Tiene no sólo las fotos de los satélites, también en distintas escalas y longitudes de onda, para sí por ejemplo ver ciertos comportamientos de glaciares que no los puedo ver con el ojo con las fotos de longitud de onda visible.

Lo que hacen los lídar…
Lo que hace un lidar es un poco distinto, porque tiene que ver con la utilización de láser para poder mapear como si fuera un radar en vez de ser una orden de radio es básicamente luz de láser. Esto te permite, por ejemplo, poder mapear una superficie a pesar de que haya nubes, o llegar al fondo del mar mapear, y eso es porque están mirando distintas frecuencias distintas longitudes de onda. Así que sí, es como un Google Maps efectivamente, pero uno muy sofisticado. Pero ahora la pregunta es cómo yo junto distintas fotos y las alineo en tres dimensiones y en una superficie curva, como la Tierra. Todo ese procesamiento de imágenes es súper costoso, pero gracias a infraestructura de software que utiliza IA dentro del Data Cube nos permite hacer esto en forma mucho más sencilla y de fácil acceso, por lo tanto, ya no me debo concentrar en procesar la imagen, si no que en cómo utilizar esta información para los fines que yo estime convenientes

¿Pero esta plataforma no me va a dejar ver cosas en tiempo real como, por ejemplo, quién está desforestando en este momento un terreno?
Por supuesto (que no), porque estamos hablando de datos abiertos; las imágenes satelitales que estamos recibiendo no tienen la precisión de 10 metros, no es el propósito del proyecto. Sí existen, por supuesto, satélites de uso comercial y militar que a lo mejor tienen esa resolución, pero para efectos de lo que estamos conversando acá, que son datos para entender para entender gestión territorial y no solamente territorio, sino que también del mar. Puede ser un área de utilización muy interesante para, por ejemplo, cuando uno está haciendo un EIA, incluso para la ciudadanía.

¿Cuál sería entonces la invitación a distintas instituciones para que colaboren con sus datos y se pongan en contacto con la UAI?
El concepto de datos abiertos pasa- justamente- por ser lo más abierto posible, valga la redundancia. (Por eso buscamos) incorporar distintas fuentes, nuevas agencias, empresas públicas, empresas privadas, organizaciones sin fines de lucro, universidades… en fin, que quieren contribuir a que sus bases de datos se potencien al interconectarse con otras fuentes de datos. Es una economía de trillones de dólares, sólo porque el Estado, la academia, los privados y la población en general sean más abierta a compartir datos. Porque eso sirve para tomar mejores decisiones que afectan a todos.
Un colega lo ejemplificó así. ‘No tiene mayor impacto que un investigador con una gran base de datos la guarde para sí’. En ciencia, si lo vemos incluso en el tema de las vacunas contra el covid-19 ha sido gracias a que se han abierto los obstáculos para que la información fluya de un país a otro y hoy, a pesar de que estamos en una situación súper complicada, en menos de un año, ya tenemos vacunas.

Me imagino lo que describe es básicamente lo que hacía Ciren, que debe ser una institución que les ha aportado o que les aportaría muchos datos
Sin duda. Ahora, lo que pasa es que la institucionalidad en Chile hoy es muy débil en lo que se refiere a interoperabilidad datos. Lo increíble de este proyecto – y esto es un llamado de atención a la comunidad – es que hoy Chile tiene localmente las capacidades para poder hacer este pilotaje de protocolos y un desarrollo de capital humano para interoperabilidad de datos (al nivel) de las potencias mundiales en exploración espacial y en imágenes satelitales). Pero internamente no le podemos sacar mucho provecho porque hoy no hay protocolos claros, no hay un estándar nacional, no hay una conversación entre los distintos agentes lo suficientemente informada y de consenso respecto a cómo una agencia ministerial o una universidad entrega los datos a otro ente. Y eso bloquea muchísimo el diálogo y justamente es el obstáculo número uno para poder generar plataformas de datos abiertos. (El desafío) es cómo podemos alimentar este flujo, porque además esto maximiza el valor de inversiones que están pagadas o en gran parte subsidiadas por el Estado. Las inversiones que se hacen en administración de datos e información y sensorización rentabilizan mucho más cuando soy capaz de colocarlas en un estándar de interoperabilidad nacional que, obviamente, debiese alinearse además con el estándar internacional.

Se habla de 11 meses de trabajo, ¿qué va a pasar durante esos meses y que viene tras esa fecha?
Este es un proyecto piloto donde estamos haciendo, gracias al auspicio de todas estas agencias, el framework de interoperabilidad de datos, y la idea es que una vez que esté probado y que se hayan limado todas las asperezas – porque los datos vendrán desde una cadena de distintas agencias que generan los datos – y se haya uniformado todo, sea utilizado por la comunidad internacional, de la cual por supuesto somos parte.
Lo estamos haciendo, con apoyo de CSIRO y de Data Observatorio en estos 11 meses no es para que haya un proyecto de acceso a la comunidad nacional, porque al proyecto no le corresponde esta discusión sobre cómo nos ponemos de acuerdo, a nivel nacional, para realmente sacarle provecho a esta base de interoperabilidad. Pero sí este proyecto vendría a gatillar o acelerar aún más las conversaciones en torno a ese propósito, porque van a haber aprendizajes que van a quedar en Chile. Entonces, una vez que ya tengamos más clara la parte técnica queremos llevar esto hacia los distintos actores del ecosistema nacional de datos satelitales para que se pueda sacar el mayor provecho- Y luego eventualmente se combinaría con todo lo que hemos conversado sobre datos de monitoreo.

¿Cuál es la invitación para todos los interesados en este proyecto y cuál es la promesa también, para todos quienes van a querer usar esta información?
La invitación es un poco a abrirse a la utilización de datos de esta naturaleza para mejores decisiones, por una parte. Hay un estimado de US$ 5.000 millones solo para Chile, al poder utilizar información de observaciones terrestres y marítimas para el país y para las empresas. Eso fue estudiado por el Ministerio de innovación dentro del contexto de las economías Asia-Pacífico y por eso Asia-Pacífico nos ayudó a lanzar este primer proyecto del Data Cube. En segundo lugar, desde la fundación Data Observatory estamos trabajando en generar módulos de educación, información y de acceso para poder utilizar estas tecnologías. Estaremos lanzando durante abril el primer piloto de formación en torno a Data Cube y otros, con la participación de investigadores de muchas otras universidades. Una vez que eso resulte, la idea es ir escalando y generando una masa crítica lo suficientemente fuerte dentro de todas las organizaciones como para que podamos tener discusiones mucho más informadas, compartir experiencias, bases de datos. Pero sobre todo donde podamos sacarle provecho con creatividad. Esa es la invitación, que teniendo toda la información disponible usemos la creatividad, seamos innovadores y tratemos de abrirnos a una colaboración mucho más virtuosa que la que estamos acostumbrados históricamente.

¿De qué forma se puede tomar contacto con ustedes para saber más, para colaborar, ir a los talleres, etc.?
Podrían escribirnos al correo institucional, que es: contacto@dataobservatory.net

Foto portada: Unsplash Fabio