Este repositorio tiene el acceso a mi TP Integrador que formo parte de mi formación en Big Data como parte del programa de Codo a Codo 4.0. Puedes explorar mi proyecto en Deepnote a través de este enlace: Deepnote
El programa Codo a Codo del Ministerio de Educación de la Ciudad de Buenos Aires tiene como objetivo capacitar a jóvenes y adultos en programación para que puedan insertarse laboralmente en el sector IT.
Durante el curso, he explorado una amplia variedad de temas, incluyendo:
- Conceptos Generales, Lógica y Algoritmos.
- Bases de Datos, tanto relacionales como no relacionales, con un enfoque en SQL.
- Utilización de hojas de cálculo para análisis de datos.
- Introducción al Business Intelligence.
- Google Data Studio | Google Colab
- Creación de Informes y Dashboards.
- Programación en Python, incluyendo la interfaz gráfica e integración con bases de datos.
- Estadística descriptiva básica.
- Uso de librerías de Python orientadas a datos: Numpy, Pandas, Matplotlib, Seaborn.
Este proyecto representa un ejercicio práctico esencial para aplicar técnicas de análisis de Big Data, utilizando herramientas como Python, pandas y la plataforma Deepnote. A través de la integración y exploración de grandes volúmenes de datos, se buscó transformar información dispersa en conocimientos accionables que faciliten la toma de decisiones.
📊 1. Análisis de grandes volúmenes de datos:
Permite comprender cómo procesar, limpiar y analizar datasets complejos, una habilidad fundamental en entornos donde la información masiva es crucial para la estrategia empresaria.
🛠️ 2. Aplicación de herramientas y tecnologías:
Utilizando entornos interactivos como Deepnote y bibliotecas avanzadas en Python, el proyecto refleja la capacidad de emplear herramientas modernas en la resolución de problemas reales de análisis de datos.
📈 3. Generación de información para la toma de decisiones:
A través del análisis exploratorio, la identificación de patrones y la creación de visualizaciones, el proyecto facilita una interpretación clara de los datos, aportando valor en la optimización de procesos y la predicción de tendencias.
🔍 4. Desarrollo de habilidades analíticas y críticas:
El trabajo fomenta el pensamiento crítico y la capacidad de interpretar resultados, habilidades fundamentales para la toma de decisiones fundamentadas en evidencia cuantitativa.
Mi objetivo principal fue adquirir conocimientos básicos en bases de datos y aprender a utilizar herramientas como Python, SQL y Deepnote para analizar y gestionar grandes volúmenes de datos. Este curso marcó el inicio de mi formación en tecnología, fortaleciendo mi lógica de programación y sentando las bases para futuros aprendizajes en Power BI, Tableau, Python, Testing y Desarrollo de Software(proceso de aprendizaje).
Este proyecto corresponde al curso de Big Data del programa Codo a Codo 4.0 (primer cuatrimestre de 2022), donde se abordaron conceptos clave de bases de datos, análisis de datos y programación en Python. El trabajo final integra herramientas de programación y visualización para resolver un caso real de análisis de grandes volúmenes de información.
🎯 Objetivos del Proyecto: - Aplicar Python para manipular y analizar grandes conjuntos de datos. - Utilizar SQL para interactuar con bases de datos relacionales. - Implementar técnicas de estadística para extraer insights. - Desarrollar dashboards interactivos con Google Data Studio. - Resolver un caso práctico simulando un escenario real de Big Data
🛠️ Herramientas y Tecnologías: - Lenguaje: Python (pandas, matplotlib, seaborn). - Bases de Datos: MySQL (gestión y consultas). - Visualización: Google Data Studio, Excel/LibreOffice Calc. - Entorno de Trabajo: Deepnote (Notebooks interactivos).
📈 Resultados Principales: - Análisis exploratorio de datos utilizando Python y SQL. - Visualización de patrones con dashboards interactivos. - Conclusiones basadas en estadísticas descriptivas y gráficos.
Quiero agradecer al equipo de Codo a Codo 4.0 y al profesor José Luís González por el acompañamiento durante el curso y por brindarnos las herramientas necesarias para comprender los fundamentos del Big Data.
- Desarrollado por: Nancy Vargas
Este proyecto está bajo la licencia MIT – Podés utilizarlo y modificarlo libremente.
- Ampliar el análisis con más fuentes de datos.
- Automatizar procesos con scripts en Python.
- Integrar nuevas visualizaciones avanzadas.
💖💖💖💖💖