Clase 2: Introducción a herramientas de control de versiones Git y Github

Clase 2: Introducción a herramientas de control de versiones Git y Github#

Objetivos de hoy#

Entender qué son las herramientas de control de versiones.
Familiarizarse con Git y Github.
Implementar scripts de bash para el manejo de versiones.

1. Introducción: ¿Por qué necesitamos Git?#

Todo científico ha vivido esta pesadilla en su computadora: analisis_espectros.py analisis_espectros_final.py analisis_espectros_final_de_verdad.py analisis_espectros_final_v2_corregido_por_el_tutor.py

Este método de guardar versiones es propenso a errores, hace imposible saber qué cambió exactamente entre la versión 1 y la 4, y arruina la colaboración. La solución estándar en la industria y la academia es Git.

Git vs. GitHub: Aclarando la confusión#

Git: Es el motor. Es un programa de línea de comandos (como los que vimos la semana pasada) que vive localmente en tu computadora. Rastrea los cambios en tus archivos a lo largo del tiempo.
GitHub: Es la nube. Es una plataforma web de Microsoft que aloja repositorios de Git. Es el “Google Drive” del código. Permite respaldar tu trabajo y colaborar con astrofísicos en todo el mundo.

Funcionamiento de Git y Github

Imagen tomada de: Link

Las 3 “Zonas” de Git (El Modelo Mental)#

Para usar Git sin frustrarse, debes entender que tus archivos pasan por tres estados:

Directorio de Trabajo (Working Directory): Tu carpeta actual. Donde editas tu código.
Área de Preparación (Staging Area): Una “sala de espera”. Aquí pones los archivos modificados que quieres empaquetar en tu próxima versión.
Repositorio Local (.git): El historial permanente. Cuando guardas algo aquí, Git le toma una “fotografía” (snapshot) que vivirá para siempre.

2. La Caja de Herramientas: Comandos Esenciales#

Antes de empezar, debemos presentarnos ante Git por única vez en nuestra computadora:

git config --global user.name "Tu Nombre"
git config --global user.email "tu_correo@universidad.edu"

Comandos de Creación y Estado#

git init: Convierte una carpeta normal en un repositorio de Git. Crea una carpeta oculta .git.

git clone [URL]: Descarga un repositorio completo desde GitHub a tu computadora.

git status: Tu mejor amigo. Te dice en qué estado están tus archivos (modificados, en staging, o guardados). ¡Úsalo todo el tiempo!

Comandos de Guardado (El Flujo Diario)#

git add [archivo]: Mueve un archivo modificado al Área de Preparación (Staging). Si usas git add ., preparas todos los archivos modificados.

git commit -m “Mensaje descriptivo”: Toma la “fotografía” de los archivos en staging y la guarda en el historial con un mensaje que explica qué cambiaste y por qué.

Comandos de Sincronización (Conectando con GitHub)#

git push: “Empuja” tus commits locales hacia el repositorio en GitHub (Nube).

git pull: “Jala” los cambios más recientes de GitHub hacia tu computadora local.

Ejemplo de Flujo de Trabajo (Workflows)#

A continuación, veremos tres escenarios reales que vivirás como astrónomo y cómo resolverlos usando la consola.

El Investigador Solitario (Local)

Escenario: Estás empezando un nuevo proyecto para analizar la curva de luz de una estrella variable. Quieres tener control de versiones localmente, sin internet.

Paso a paso en la terminal:

# 1. Creas la carpeta de tu proyecto y entras en ella
mkdir curva_luz_proyecto
cd curva_luz_proyecto

# 2. Inicializas Git (enciendes el motor)
git init

# 3. Creas tu primer script de Python
echo "print('Iniciando analisis de curva de luz')" > analisis.py

# 4. Verificas el estado. Git te dirá que 'analisis.py' no está rastreado (untracked)
git status

# 5. Lo agregas al área de preparación (Staging)
git add analisis.py

# 6. Haces el commit (TOMAS LA FOTOGRAFÍA)
git commit -m "Commit inicial: creo el script base para curvas de luz"

# 7. Si modificas el archivo, repites el ciclo: add -> commit
echo "import numpy as np" >> analisis.py
git add analisis.py
git commit -m "Añado la libreria numpy para calculos matematicos"

El Respaldo Científico (Local hacia la Nube)

Llevas un mes trabajando en tu proyecto local (paso anterior). Si tu computadora se daña, pierdes tu tesis. Necesitas subir esto a GitHub.

Paso a paso:

Vas a la página web de GitHub, inicias sesión y haces clic en “New Repository”. Lo llamas curva_luz_proyecto. No le agregas ningún archivo extra.

GitHub te dará un enlace (URL) que termina en .git.

Vuelves a tu terminal y vinculas tu carpeta local con ese enlace en la nube:

# 1. Le decimos a Git dónde está el repositorio remoto y lo llamamos "origin"
git remote add origin [https://github.com/TU_USUARIO/curva_luz_proyecto.git](https://github.com/TU_USUARIO/curva_luz_proyecto.git)

# 2. Renombramos nuestra rama principal a "main" (estándar actual)
git branch -M main

# 3. Empujamos todo nuestro historial local hacia GitHub
git push -u origin main
A partir de ahora, cada vez que hagas un git commit local, solo tendrás que escribir git push para respaldarlo en la nube.

El Estudiante Colaborativo

El profesor de Minería de Datos ha subido un repositorio con los datos del catálogo de Gaia y un código incompleto. Tienes que descargarlo, hacer tu tarea y actualizar tu versión local si el profesor hace cambios.

Paso a paso en la terminal:

# 1. Clonas (descargas) el repositorio completo del profesor a tu computadora
git clone [https://github.com/ProfesorAstro/clase_gaia_dr3.git](https://github.com/ProfesorAstro/clase_gaia_dr3.git)

# 2. Entras a la carpeta que se acaba de descargar
cd clase_gaia_dr3

# 3. Empiezas a trabajar, editas el archivo de la tarea y lo guardas
git add tarea_estrellas.py
git commit -m "Completo el filtrado de estrellas por paralaje"

# 4. Antes de seguir, quieres asegurarte de que el profesor no haya
# modificado las instrucciones en la nube mientras tú trabajabas.
# Actualizas tu carpeta local con cualquier cambio remoto:
git pull origin main

Nota: El ciclo de vida del trabajo diario en equipo es siempre: git pull (al empezar el día) -> editar código -> git add -> git commit -> git push (al terminar el día).

Cheatsheet#

Muchas veces se encontrarán con que es difícil poder conocer todos los comandos que se necesitan para realizar alguna de las actividades que se desea construir.

Existen lo que se conoce como cheatsheet o como hojas de trampa. Son generalmente un resumen de las cosas más importantes que se deben conocer respecto a una herramienta específica.

Cheatsheet para Git y Github

Imagen tomada de: Link

Ejercicios#

En astronomía, el código es tan importante como el telescopio. Estos ejercicios están diseñados para simular el flujo de trabajo real que utilizarán durante sus proyectos mensuales y, eventualmente, en su vida profesional.

Abran su terminal y asegúrense de haber configurado su usuario y correo antes de empezar (git config --global user.name "Nombre", etc.).

Ejercicio 1: “El Diario de Observación” (Git Local)#

Vas a iniciar un nuevo proyecto para clasificar espectros estelares. Necesitas crear un espacio seguro en tu computadora donde Git rastree todos tus avances, evitando que pierdas tu trabajo si cometes un error en el código.

Crea una nueva carpeta llamada proyecto_espectros y entra en ella.
Inicializa un repositorio de Git vacío.
Crea un archivo de texto llamado README.md (un estándar en ciencia de datos) y escribe una breve descripción del proyecto dentro de él.
Añade el archivo al Área de Preparación (Staging).
Toma la “fotografía” (haz un commit) con un mensaje claro.

# Escribe tu código bash aquí

Ejercicio 2: “El Escudo contra Agujeros Negros” (El .gitignore)#

GitHub tiene un límite estricto: no puedes subir archivos mayores a 100 MB. En astronomía, un solo archivo de imagen .fits o un catálogo .csv puede pesar Gigabytes. Si intentas hacer commit de esos datos y subirlos, bloquearás tu repositorio. Debemos enseñarle a Git a ignorar los datos pesados y rastrear solo el código.

Siguiendo dentro de tu carpeta proyecto_espectros:

Crea una carpeta llamada datos/ (aquí irían tus catálogos pesados).
Crea un archivo especial llamado .gitignore.
Escribe dentro del .gitignore una regla para que Git ignore la carpeta datos/ y cualquier archivo que termine en .fits.
Haz un commit guardando tu nuevo “escudo protector” (.gitignore).

# Escribe tu código bash aquí

Ejercicio 3: “Lanzamiento Orbital” (Conectando con GitHub)#

Tu entorno local está configurado y protegido. Ahora necesitas respaldar este código en la nube (GitHub) para poder trabajar desde la computadora del laboratorio de la universidad sin llevar una memoria USB.

Ve a tu cuenta de GitHub en el navegador y crea un repositorio nuevo y vacío llamado proyecto_espectros. No marques la opción de añadir un README (porque ya creamos uno localmente).

Copia la URL que te proporciona GitHub (termina en .git).
En tu terminal, conecta tu repositorio local con el remoto (origin).
Asegúrate de estar en la rama main.
Empuja (push) tu historial a la nube.

# Escribe tu código bash aquí

Ejercicio 4: “Clonando el Observatorio Virtual” (Git Clone)#

Has encontrado un repositorio público en GitHub de un investigador que creó herramientas útiles para leer archivos de la misión Kepler. Quieres descargar ese código a tu computadora para probarlo.

Sal de tu carpeta actual para no crear un repositorio dentro de otro (muy importante).
Usa git clone para descargar un repositorio de prueba. Usaremos uno público de ejemplo: mwaskom/seaborn-data.git.
Entra a la nueva carpeta clonada y usa git log para ver el historial de commits que hizo el autor original.

# Escribe tu código bash aquí

Práctica en Parejas: Simulando un Sistema Binario en GitHub#

Objetivo: Simular un entorno real de investigación colaborativa. Aprenderán a clonar un repositorio compartido, aislar su trabajo en “Ramas” (Branches), solicitar revisiones (Pull Requests) y fusionar el código sin destruir el trabajo de su colega.

Instrucciones Previas: Hagan parejas. Decidan quién será el Astrónomo A (Investigador Principal) y quién será el Astrónomo B (Co-Investigador). En este proyecto, van a simular datos para un nuevo sistema planetario. El Astrónomo A simulará los datos de la estrella, y el Astrónomo B simulará los datos de los exoplanetas.

Paso 1: El Observatorio Compartido (Creación y Clonación)#

Para poder colaborar, necesitamos un punto central en internet al que ambos tengan acceso de escritura.