# Propedéutico (aka Prope) de la Maestría en Ciencia de Datos (MCD) --- ## ¿Propedéutico a qué? * Temas que toda persona en ciencia de datos debe saber y entender. * Herramientas computacionales que ayudarán a aprovechar al máximo sus materias. Su objetivo además del que aparece en el [temario](https://drive.google.com/file/d/1A5FF9lOFYXb4CdbAQaOp79x1A-9-j36b/view?usp=sharing) es nivelar a los y las estudiantes de la MCD. --- ### ¿Ciencia de datos? Conjunto de metodologías, herramientas y técnicas que permiten extraer conocimiento útil a partir del análisis de información generada de distintas fuentes. ---- ### ¿Metodologías, herramientas y técnicas? En tres áreas del conocimiento: * Estadística. * Matemáticas. * Computación. ---- ### ¿Información? * Generada en las ciencias (matemáticas, biológicas, sociales, políticas...). * Condensada en múltiples formatos (imágenes, textos, audio, tablas...). ---- ### Científico/Científica de datos Su tarea es crear **producto de datos**. Un **producto de datos** es un sistema tecno-social que procesa datos sobre un sistema generador de los mismos para aumentar la inteligencia o capacidades de acción de un agente externo al sistema (Adolfo Javier De Unánue Tiscareño). ---- ### Ejemplos * Portal de acceso a imágenes satelitales Sentinel-1, Sentinel-2, Sentinel-3 and Sentinel-5P . Ver [liga](https://scihub.copernicus.eu/dhus/#/home) de la [ESA](http://www.esa.int/). * Portal de acceso a mapas de cobertura y cambio de cobertura de suelo. Ver [liga](http://geonode.conabio.gob.mx/) de [CONABIO](https://www.gob.mx/conabio) y [liga2](https://lcviewer.vito.be/) de la ESA. * Dahsboard interactivo para calcular la distancia mínima que deben recorrer personas en una microfinanciera para visitas a sus clientes. Ver [liga](https://tcp-dashboard.herokuapp.com/) de [estudiantes del ITAM en el curso de Optimización](https://github.com/lauragmz/proyecto-final-mno2020/blob/master/reports/reporte_rutas_optimas.pdf). --- ## ¿Herramientas de computación? La computadora es la herramienta que utiliza la científica de datos para trabajar -> debemos tener buenas herramientas de trabajo. ---- ### Ejemplos de herramientas * Lenguajes de programación. * Software. * Hardware. ---- #### ¿Lenguajes de programación? * En el prope revisamos [Python](https://www.python.org/doc/essays/blurb/) y [R](https://www.r-project.org/about.html) ¿Por qué 2 lenguajes? * Porque una pintura está hecha de muchos colores :) ---- ¿Por qué *Python* y *R*? * Porque son de alto nivel (sencillos para interactuar con la computadora). * Porque son lenguajes ampliamente utilizados por la comunidad de ciencia de datos. * Porque su documentación es buena, entendible y accesible. * Porque son de código abierto (*open source*). ---- Ejemplos **Python** ```python def mi_funcion(): variable = 1 print(variable) return 0 ``` **R** ```bash mi_funcion <- function(){ variable <- 1 print(variable) 0 } ``` ---- #### ¿Software? * [docker](https://www.docker.com/) en compañía de [dockerhub](https://hub.docker.com/). * [git](https://git-scm.com/) y en el prope nos enfocamos más en aprender sobre [github](https://github.com/). * [bash](https://en.wikipedia.org/wiki/Bash_(Unix_shell)) (lenguaje de comandos). Preferimos sistemas operativos basados en [GNU](https://en.wikipedia.org/wiki/GNU)/[Linux](https://en.wikipedia.org/wiki/Linux) como [Ubuntu](https://ubuntu.com/) que está basado en [Debian](https://www.debian.org/) pero sistemas OS X (Mac OS X) también funcionan muy bien (Windows da dolor de cabeza con varias herramientas). ---- #### ¿Hardware? * No tenemos un requisito específico para la MCD. Una laptop o computadora de escritorio multicore es una buena opción. Si tiene procesadores gráficos [GPU](https://en.wikipedia.org/wiki/Graphics_processing_unit) está súper pero no es esencial. * Estudiantes inscritos en la MCD tienen acceso a [Amazon Academy](https://aws.amazon.com/es/training/awsacademy/) vía su correo con dominio itam.mx ---- #### ¿Hardware? * El repo del prope está construído para que a través de botones tengan acceso a servidores de Google y otras compañías desde la comodidad de sus dispositivos electrónicos (computadoras, tabletas, teléfonos celulares...) pero **sí** es indispensable que tengan una computadora local en la que puedan ejecutar el material de su MCD. Ejemplo de botón: [![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/palmoreck/dockerfiles-for-binder/jupyterlab_prope_r_kernel_tidyerse?urlpath=lab/tree/Propedeutico) --- ## Información general del prope * Dinámica. * Trabajo. * Calificación. ---- ## Dinámica La clase es de lunes a miércoles\* de 18 a 21 y es **en línea** a través de Zoom. Hacemos *breaks* de 10 min cada hora. Terminamos el 18 de julio. \*únicamente esta primer semana es miércoles, jueves y viernes ---- ## Dinámica Los temas que estudiamos están descritos en el repositorio de github de nombre [Propedeutico](https://github.com/ITAM-DS/Propedeutico/tree/main) debajo de la organización del ITAM con nombre [ITAM-DS](https://github.com/ITAM-DS). En el repo de Propedeutico creé la rama [prope-2022](https://github.com/ITAM-DS/Propedeutico/tree/prope-2022#propedeutico) que contiene información en específico de este verano. Cada clase revisamos los temas del repo en el orden siguiente: 1. *Python*. 2. *R*. <!-- .slide: style="font-size: 36px;" --> ---- ## Dinámica de esta semana Esta semana es una semana de preparación en la que revisamos Github. Aunque durante todo el prope iremos incrementando nuestro conocimiento de Github. En la [liga](https://github.com/ITAM-DS/Propedeutico/tree/prope-2022#organizaci%C3%B3n-del-proped%C3%A9utico) encuentran la agenda. ---- ## Trabajo Conforme avancemos en el aprendizaje del lenguaje respectivo se **entregan prácticas semanales** de forma individual. Antes de terminar el lenguaje correspondiente se entrega una práctica de lo revisado. ---- Utilizaremos para las prácticas semanales la organización [prope-2022-gh-classroom](https://github.com/prope-2022-gh-classroom) que fue creada para alojar repositorios de [github classroom](https://classroom.github.com/) (véase [github education](https://github.com/education)). Esta organización será nuestro *playground* para el curso :) También habrá una práctica final con la que cerraremos el curso. ---- ## Calificación La calificación final del prope es Acreditado/No Acreditado pero internamente manejamos calificaciones en el intervalo [0,10]\*. \*La calificación interna se compone de las **prácticas semanales** (en conjunto forman el 70%), la práctica final (30%) y se acredita con calificación mayor o igual a 6. **Tienen oportunidad de no entregar o reprobar máximo dos prácticas. En cuanto lleguen a las tres que no entregan o reprueban tienen cero en el propedéutico y por tanto es no acreditado.** <!-- .slide: style="font-size: 36px;" --> ---- ## Sobre lo que nunca deben realizar **Copiar en un examen/tarea/trabajo/entrega pues se pondrá cero en el mismo. Si vuelve a repetirse la situación se le notificará a dirección escolar para realizar la anotación correspondiente en su expediente.** ---- ## Sobre lo que siempre deben realizar **Documentar sus referencias, fuentes, colaboraciones y material que utilizan para resolver sus exámenes, prácticas o proyectos.** --- ## ¿Preguntas? --- ## Tarea para la primer clase **Más importante: (lo que puedan hacer hoy, realícenlo)** * Crear *user* de [github](https://github.com/). ---- ## Tarea para la primer clase **Más importante: (lo que puedan hacer hoy, realícenlo)** * Unirse al chat de [gitter](https://gitter.im/) con su *user* de *github* dando click en [![Gitter](https://badges.gitter.im/prope-2022/community.svg)](https://gitter.im/prope-2022/community?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge) o en el repo en la [liga](https://github.com/ITAM-DS/Propedeutico#dar-click-en-el-siguiente-bot%C3%B3n-para-unirse-al-chat-del-verano-del-2022-en-gitter-). ---- ## Tarea para la primer clase **Menos importante: (realícenlo en esta semana)** * Instalar [docker](https://www.docker.com/) en sus máquinas. * Crear user de [dockerhub](https://hub.docker.com/). * En la [liga](https://github.com/ITAM-DS/Propedeutico/tree/main/herramientas/docker) encuentran información de docker. --- Esta presentación fue realizada con [reveal.js](https://revealjs.com/). Aquí la liga de su *github*: [reveal.js github](https://github.com/hakimel/reveal.js/). También me apoyé de [hackmd](https://hackmd.io/) para la creación de documentos de forma colaborativa (así como un google drive) y en particular para presentaciones de *reveal.js*. Ver [tutorial](https://hackmd.io/c/tutorials/%2Fs%2Fhow-to-create-slide-deck) para creación de presentaciones con *reveal.js*. Mi user de *github* es [palmoreck](https://github.com/palmoreck), el medio de contacto es por el chat de gitter como **primera opción** y como **segunda opción:** erick89.itam@gmail.com. En [liga](https://mcdatos.itam.mx/erick-palacios/) una breve descripción de mí :)
{"metaMigratedAt":"2023-06-15T11:18:21.420Z","metaMigratedFrom":"YAML","title":"Intro_a_prope","breaks":true,"slideOptions":"{\"theme\":\"solarized\",\"transition\":\"fade\",\"controls\":true,\"progress\":true}","contributors":"[{\"id\":\"8b24e736-2935-427d-8d66-2819293128a2\",\"add\":11136,\"del\":1735}]"}
    565 views