# OBSERVATORIO AMBIENTAL DE VACA MUERTA. Monitoreo de parámetros ambientales e industriales
reuniones:
https://meet.jit.si/sismicidad.inducida
## Resumen

* Un elemento de análisis que se puede incorporar a este esquema es el de vertederos/residuos sólidos.
## Objetivo
Base de datos cartográfica (geolocalizada) actualizada y ~~dinámica~~ automátizada de comunicación de conflictos (socio-)ambientales (¿económicos?) de VM que integra:
- informes de la comunidad
- bases de datos públicas
- nuestro conocimiento
Las informaciones se vinculan, entrelazan, contrastan y checkean entre sí formando un único conjunto de datos fácilmente interpretable (más o menos automatizado según las posibilidades y tipo de dato). BBDD actualizada en tiempo real y recursivamente (retrospectivamente).
**Ejes de trabajo primarios: Sismos, agua, emisiones(+ venteos o viceversa).**
**Ejes de trabajo secundarios: pozos, bocatomas, eventos ambientales, variables económicas, etc**
Lo anterior puede cambiar. Depende de cómo definamos y enfoquemos. P. ej.: **volúmenes** tratados (de petróleo, gas, agua, emisiones, arenas, químicos, etc. puede ser un eje principal. U otros.)
## Método
### General
1) No perder nunca de vista el objetivo:
El objetivo no es desarrollar una aplicación, sino ofrecer información de modo accesible.
La programación tiene que ser lo más eficaz posible para conseguir el objetivo. No entrar en desarrollos complejos innecesarios.
2) Pregunta: ¿Qué es más importante? ¿Base de datos o comunicación de la información? ¿Son ambas igual de importantes?
Quizás ambas son igual de importantes. Eso nos obliga a tener dos estrategias: A) Construcción de base de datos. B) Construcción de herramientas de visualización (y consulta y descarga quizás también).
[Franco] Creo que ambos puntos están conectados: primero tenemos que generar nuestra base de datos combinando todas las fuentes y depués tenemos armar un página donde comuniar lo que pasa (me imagino un storytelling).
**En función de los puntos 1 y 2 tenemos que definir nuestra línea de trabajo y las herramientas necesarias.**
Creo que es determinante que el proyecto sea **MODULAR** y **ESCALABLE**
Esto nos permite empezar despacio siendo muy ambiciosos. Podemos empezar primero con un solo tema, por ejemplo "sismos" que es el que tenemos más aceitado, conservando la visión a futuro de ampliar (agua, emisiones....) con las mismas herramientos y métodos. Complementando el trabajo sin pisar lo anterior (modular). Además en caso de surgir novedades (por ejemplo la instalación de un sismógrafo), podemos ampliar el trabajo previo hecho (escalable).
Con los principios previos, determinar herramientas de programación: html, php, python, psql... Por jemplo:
* Cartografía: OpenStreeetMaps, postgreSQL, QGIS, MapServer...
* BBDD: postgreSQL...
* Web: html, php, gestor de contenidos (Drupal), ourworldindata...
* Apliacación/formulario: Android/java, Mapeo, kobotoolbox,
* Etc.
[Franco] :arrow_up: Creo que no tenemos que preocuparnos ahora por las técnologias en particular, enfoquemosnos en terminar de definir la idea y despues vemos las tec. Lucas y yo somos desarrolladores python así que supongo que eso sería lo más comodo para el análisis de los datos y poder generar un MVP rápido
**¿Como se vinculan y complementan entre sí estas distintas plataformas/lenguajes/webs sin entrar en conflicto?**
¿Vamos a traducir todos los datos a un formato nativo nuestro par aluego representarlos o simplemente vamos a linkar sitios externos? ¿O ambas cosas? ¿Es posible hacer lo que queremos?
[Franco] En general vamos a tener procesos que van a leer las fuentes externas (csv, img sat, etc) con distintas frecuencias (supongo que las ddjj de las empresas 1 vez al mes, las img diariamente) y las guardamos de una forma unificada:
- Los csv y datos tabulares a una db. Posiblemente un postgres con el plugin de gis
- Las img las recortamos al poligono de VM y las guardamos en netCDF para hacer series temporales
### Posibles productos
#### - *Mapa general de Vaca Muerta* con capas/tablas (algunas columnas fijas: fuente de datos, etc.). Las distintas entradas se pueden visualizar por categorías de magnitud jugando con tamaño/color:
Vectorial:
- Sismos (por fecha, magnitud...)
- Pozos convencionales (activos o no, declarado o no, por volumen de producción, fecha de inicio/fin)
- Pozos no convencionales (ídem anterior, cantidad de fracturas, potencia de equipos, profundidad, longitud de rama horizontal, etc)
- Sumideros (íedm anterior)
- Antorchas de venteo (ídem anterior)
- Bocatomas/bombas de agua (ídem anterior)
- Vertederos/residuos (ídem anterior)
- Incidentes ambientales (ídem anterior)
Raster (dependiendo de la decisión final):
- Emisiones de metano (Tropomi)
- Deformación del suelo (Dinsar)
- [Franco] Venteos (SAR?)
#### - *Gráficos dinámicos* (líneas, tortas, cubos, "videos/gif" tendencia...):
Tendencias históricas de:
- Cada una de las capas cartográficas anteriores.
- Variables económicas (hidrocarburos per cápita comparado con otros países, inversión en infraestructura petrolera comparada con otras infraestructuras, etc.)
#### - *¿Otros productos?*
### Fuentes de datos
* Las oficiales son declaraciones juradas, por lo que pueden ser limitadas y están sujetas a duda y/o comprobación.
* Para todas las mencionadas hay además cuatro *fuentes alternativas*: 1) trabajo de campo, 2) comunicación ciudadana, 3) checkeo por distintas fuentes de sensores remotos (Google, Sentinel, Planet, Landsat, SAR), 4) informes escritos de secretarías.
* Salvo que se indique lo contrario, se refiere siempre a BBDD geolocalizadas de características más o menos similares (tablas vectoriales con coordenadas, o raster).
- Sismos:
- INPRES (web estática), RedGeoChile (comunicación personal, kml), agencias internacionales (fuente secundaria, USGS, etc.)
- sismicidadinducida.ar
- Pozos:
- Secretaría de energía de la Nación (xlxs, csv, shapefile). Tablas geolocalizadas con algunas inconsistencias de formateo:
- 1) https://datos.gob.ar/dataset/energia-produccion-petroleo-gas-por-pozo-capitulo-iv/archivo/energia_0abd7bf1-c184-4940-b8cf-5f37961a2ba8
- 2) https://sig.se.gob.ar/visor/visorsig.php?t=8
- Bombas de agua.
- Fuentes alternativas (¿es esta la única variable para la que no existen datos oficiales?)
- Venteos.
- Muchas fuentes satelitales solapadas y/o duplicadas). En lo inmediato quizás apuntar solo a la más sencilla (¿nación declarado y detectado?) y luego ir ampliando (escalar).
- Declaración jurada: https://datos.gob.ar/dataset/energia-produccion-hidrocarburos---puntos-venteo-declarados/archivo/energia_c3812323-0c38-43b7-8bc6-f05fb5113626
- Fuentes satelitales:
- http://datos.energia.gob.ar/dataset/deteccion-satelital-de-venteos
- https://sig.se.gob.ar/visor/visorsig.php?t=8
- https://www.argentina.gob.ar/economia/energia/informacion-geografica-energia/venteos-de-gas-proyecto
- https://www.worldbank.org/en/programs/gasflaringreduction/global-flaring-data
- https://firms.modaps.eosdis.nasa.gov/map/#d:2023-02-20..2023-02-21,2023-02-20;@-52.5,-31.2,5z
- https://payneinstitute.mines.edu/eog/
- https://skytruth.org/flaring/
- https://viirs.skytruth.org/apps/heatmap/flarevolume.html
- https://viirs.skytruth.org/apps/heatmap/flaringmap.html#lat=-39.4026&lon=-61.29422&zoom=6&offset=15
- Emisiones.
- Metano, CO2, etc. Volúmenes (baja resolución 25x25km). Tema muy complejo quizás para etapa más avanzada:
- Tropomi

- Otros satélites.
- Sensores prestados (USA/Opsur)
- Incendentes ambientales (vertidos, incendios, explosiones, escapes de gas, etc.).
- Tabla de Secretaría de energía (geolocalizada solo por área de explotación, no por coordenadas).
- Fuentes alternativas.
- Indicadores socioeconómicos (múltiples fuentes):
- INDEC: https://www.censo.gob.ar/index.php/mapa_poblacion1/
- (gráficos web dinámicos open source) https://ourworldindata.org/
Nota 1: Fuentes satelitales ópticas:
- Google/bing muy alta resolución espacial muy baja resolución temporal.
- Planet (bajo convenio) alta resolución espacial muy alta resolución temporal.
- Sentinel y Landsat medias resoluciones.
- SPOT muy alta resolución espacial, muy baja resolución temporal, hasta 2018 (en principio casi no sirve).
Nota 2) Algunos ejemplos de referencia de datos de monitoreo con actualización automática y/o otros, ambiental:
https://search.asf.alaska.edu/#/?searchType=Event%20Search
https://ejatlas.org/?translate=es
https://inducedearthquakes.org/
https://earthquake.usgs.gov/earthquakes/map/

Esta imagen es un ejemplo de un pozo fracturando con resoluciones de Google y Planet, la última de actualización diaria.

Dos imágenes de Planet de venteos quemando. Contrastadas contra el mapa de la NASA de focos de fuego se detectan perfectamente (el mapa de la NASA parece ser muy preciso) y/o también con las emisiones de gases. Los venteos pequeños (flecha) no se identifican con tanta facilidad como el grande, como resulta obio.
#### Algoritmos (etapas) - *A descartar*
- Detección automática de - ** Por ahora no veo viable ni necesario esto **
- Venteos: identificacion
- Pozos fracturando: (Guille: que se puede detectar?). *Se podría detectar, como en la imagen, pozos en proceso de fractura que no han sido declarados por las empresas. En caso de querer hacerlo, a esas alturas creo que es más eficaz manejarlo manualmente*
- Bombas: (Guille: que son?): *Las bocatomas/bombas que toman agua del río Neuquén o de los embalses para subministrar agual en cantidades exhorbitantes para los procesos de fractura (se ve un ejemplo en la imagen esquema resumen)*
- Derrames
- Estimaciones - ** Este es un tema muy complejo que requiere tiempo de estudio **
- Contaminación por venteo
- Metano de los pozos fracturando
- Visualizaciones - ** Aclarado en apartado "Posibles productos"
- Sismos: fácil de obtener
- Metano: posible
los algoritmos de deteccion se ejecutan con cierta frecuencia (meses? semanas?) **descartaría esta complejidad de momento**
- devuelven como esultado las coordenadas de lo que encontraron.
los algoritmos de estimacion toman las coordenadas (algoritmos de deteccion) y calculan los valores (por ej. venteo en tal lugar por tantos dias).
#### Visualizaciones - *No sé lo que és*
- generar story telling
## Objetivo a corto/medio plazo
1) Determinar usuario final (*público general/contenido riguroso*)
2) Determinar herramientas principales de trabajo (softwares, lenguajes de programación),
3) Apuntar a un primer nivel general de estructura de la web,
4) Apuntar a los primeros posibles productos a generar
## Primeros pasos. Módulo 1) Identificación de pozos de fractura dentro de ventana espacio/temporal de evento sísimico.
**Este es el procedmiento aplicado por mi, con mis herramientas y tras un aprendizaje. Obvio que puede cambiar/evolucionar.**
Artículo de referencia: Atkinson G. et al. 2016 *Seismological Research Letters*
https://www.researchgate.net/publication/299579291_Hydraulic_Fracturing_and_Seismicity_in_the_Western_Canada_Sedimentary_Basin
Objetivo del primer módulo del observatorio ambiental:
Identificación de pozos de fractura dentro de ventana espacio/teporal de evento sísimico. Para cada epicentro con coordenadas identificadas, identificar los pozos practicando fracturas en un radio de 15 km (ventana espacial) en un plazo (ventana temporal) que cubra desde 6 meses antes al evento y hasta 7 días después (esto último es por permitirnos un margen de error en la inclusión de los datos en las tablas oficiales).
El archivo de epicentros sísmicos **lo paso por Whatsapp**.
El archivo de pozos hay que crearlo. Propongo hacer unos testeos antes de generar el resultado final. Es decir, cuando queramos obtener el filtrado espaciotemporal final, habrá que hacer antes una supervisión detallada de que los datos de entrada estén bien creados. Eso lo haremos al final, ahora hacemos algunos testeos. Estas sonlas fuentes:
Archivo de **pozos-1** hidrocarburíferos de Secretaría de Energía de la nación:
https://datos.gob.ar/dataset/energia-produccion-petroleo-gas-por-pozo-capitulo-iv/archivo/energia_0abd7bf1-c184-4940-b8cf-5f37961a2ba8
**-> Capítulo IV - Pozos "Descargar"**
Archivo de **pozos-2** hidrocarburíferos de Secretaría de Hidrocarburos de la provincia de Nequén (deberían coincidir este y el anterior pero no siempre lo hacen):
http://hidrocarburos.energianeuquen.gov.ar/gis
**-> Pozos "Shapefile"**
Por ahora, para testear, creo que basta con trabajar solo con uno de ellos sin preocuparse de cruzar los datos.
Archivo de **fracturas** de la Secretaría de Energía de la Nación:
https://datos.gob.ar/dataset/energia-datos-fractura-pozos-hidrocarburos-adjunto-iv
**-> Datos de fractura de pozos de hidrocarburos (Adjunto IV) - Actualización diaria - Descargar**
Los datos se trabajan en el entorno que sea, para el procesado cartográfico vamos a usar QGIS. Los datos de fracturas no tienen geolocalización, por eso hay que vincularlos a los archivos de pozos mediante el campo "sigla".
Para lo anterior hacemos lo siguiente:
### Limpiar y uniformizar archivos
#### Sobre el archivo csv de pozos de Nación:
1) El .csv de pozos de Nación es desastre, hay que filtrarlo con buscar y reemplazar para limpiarlo. Les mando por Whatsapp el archivo *01_filtro.txt* con los comandos de consola que apliqué para eso (sirve para este archivo y otros de hidrocarburos que aún no tocamos). Entre otras cosas con esto eliminamos errores y carácteres extraños del campo sigla.
2) Pasamos el campo sigla a mayúscula (desde libreoffice o convirtiendo todo el archivo con el comando: tr a-z A-Z < *.csv > *_MAYUS.csv).
3) En libreoffice, chequeamos la consistencia del archivo recorriendo de la primera a última fila y columna viendo que no hay saltos.
4) eliminiamos los espacios del campo sigla.
5) vamos a las columnas Y, Z y cambiamos el título por Lon, Lat respectivamente.
6) la última columna AA.
Les paso el archivo capitulo-iv-pozos_filtrado.csv tal como me quedó a mi recién, para que vean.
#### Sobre el archivo shapefile de pozos de Neuqén:
Podemos hacer lo mismo con el campo sigla del archivo de la provincia. Ahora no es necesario. Pero podemos limpiar ese campo (sin ñ, sin espacios, todo mayúscula) para compararlo y complementarlo con el de Nación. Les paso la imagen en la que se ve que hay algunas diferencias. Más allá de que este archivo solo tiene los pozos de la provincia de Neuquén. Se aprecia como, puntos rojos, como el archivo de la provincia tiene más pozos.

#### Sobre el archivo csv de fracturas de Neuqén:
Limpiamos el archivo con un procedimiento similar al de csv pozos nación, con el mismo objetivo. Campo well_name (sigla) a mayúscula, sin espacios, sin ñ ni otros símbolos raros... Para esto hay que poner el archivo en edición y editarlo desde la tabla. Con la capa seleccionada en el panel de capas, apretar el icono de tabla , con la tabla abierta apretar icono edición  e ir a la opción calculadora de campos . Desde ahí tenemos la opcion de manipualr los campos sobre si mismos o creando uno nuevo. Les dejo la tarea de averiguar como hacer para limpiar el campo "well_name" para aplicar los criterios de uniformidad (ahora no tengo las notas a mano). Si no lo quieren hacer ahora, seguimos con el archivo .csv y listo.
### Cargar y unir/vincular (join) archivos en QGIS
1) En Qgis cargamos el shapfile de pozos de provincia de Neuqén desde el icono de carga de archivos vectoriales. 
2) Cargamos el csv de pozos de Nación desde el icono correspondiente . Además de los obvios, indicar los siguientes parámetros:
* El primer registro contiene los nombres de campo. Detectar tipos de campo.
* Coordenadas de punto. Campo X: Lon, Campo Y: Lat. SRC de la geometría: EPSG: 4326 - WGS84
3) Cargamos la tabla de datos de fractura de Nación.
* Definición de geometría: Ninguna geometría (tabla solo de atributos)

Ahora tenemos las capas cargadas, el archivo de fracturas es solo una tabla, no está geolocalizado.
1) Botón derecho sobre capa pozos (cualquiera de las dos por ahora):
-> propiedades -> uniones -> (+) -> Unir capa "datos de fractura..." -> campo: "sigla" (o well_name si es el shapefile) para ambos -> join fields (los que nos interesen, para empezar podemos arrancar solo con fecha_inicio_fractura/fecha_fin_fractura) -> Prefijo de nombre...: FR_
### Continuará
Hasta aquí vimos los primeros pasos para empezar a trabajar. Tenemos los archivos de sismos y pozos cargados y con los datos necesarios. Ahora tendríamos que filtrar solo pozos de fractura, por fechas y aplicar el rango espacial para cada evento. Iré complementado a medida que pueda. Hagan las preguntas que quieran.