Descubre Data Wrangler en Microsoft Fabric y cómo se compara con Power Query, mientras transformamos una tabla para agilizar la preparación de datos con Python!
Adentrarse en el mundo de la preparación de datos puede parecer una travesía compleja, pero ¿qué pasaría si te dijéramos que existe una herramienta que no solo simplifica este proceso, sino que lo hace de una manera que los amantes de Python adorarán? Te presentamos Data Wrangler en Microsoft Fabric, el as bajo la manga que transforma datos crudamente desorganizados en información precisa y valiosa.
Aquí desvelamos el velo de esta herramienta formidable, comparándola con Power Query, el conocido transformador de datos de Microsoft. Pero, hay una vuelta de tuerca: mientras Power Query genera código en el Lenguaje M, Data Wrangler en Microsoft Fabric lo hace en Python, abriendo un nuevo universo de posibilidades. ¿Curioso? ¡Acompáñanos en este recorrido.
Ingeniería de Datos en Microsoft Fabric
Lo primero que debemos hacer es dirigirnos a Power BI para llegar a Microsoft Fabric, y una vez allí, ubicarnos en la parte inferior derecha para ajustar el workload hacia de Ingeniería de datos. Esta acción nos posiciona en el umbral de un viaje intrigante hacia el dominio de Data Wrangler. Con un clic sencillo, seleccionamos la opción de Data Engineer, preparándonos para embarcarnos en la creación de un Lake House, un paso esencial que promete una travesía enriquecedora en el análisis y manipulación de datos

Creación de un LakeHouse
En primer lugar, nos dirigimos a la esquina superior izquierda y hacemos clic en LakeHouse, asignándole el nombre Ventas y procedemos a crearlo.

Esto nos lleva al explorador de Lake House, que inicialmente está vacío. Para cargar datos, nos desplazamos a la parte superior y seleccionamos Obtener datos. Optamos por la Carga directa de un archivo y seleccionamos nuestro archivo de VentasAcotado desde nuestra computadora local.

Una vez cargado, simplemente cerramos el panel de Cargar archivos y estamos listos para explorar los datos cargados.
Crear Data Frame de Pandas
Data Wrangler opera sobre un Cuaderno o Notebook, un documento ejecutable con código. Para utilizar Data Wrangler, creamos un nuevo cuaderno desde la esquina superior derecha, desplegando Abrir cuaderno y luego clic en Nuevo cuaderno.

La meta es cargar nuestra tabla de Excel llamada VentasAcotada en un tipo de dato compatible, en este caso, utilizando la librería Pandas de Python. Desde el explorador de LakeHouse, seleccionamos Files, clic en los tres puntos al extremo derecho, y elegimos la opción Carga de datos seguido por Pandas.

Lo que automáticamente genera el código necesario una celda del Cuaderno

Tras haber generado el código, es momento de ejecutarlo en la celda del cuaderno. Nos desplazamos al extremo izquierdo y pulsamos el botón de Play. Al hacerlo, observaremos que la ejecución se realiza con éxito, mostrándonos incluso una vista previa de los datos en la parte inferior.
Iniciar Data Wrangler en Microsoft Fabric
Con el cuaderno listo, es hora de lanzar Data Wrangler. En la parte superior, encontraremos una pestaña llamada Datos, la cual seleccionaremos. Esto nos llevará a la opción Iniciar Data Wrangler. Al desplegar, veremos un Data Frame identificado como DF, que seleccionaremos para comenzar

Al acceder a Data Wrangler, nos encontramos con una interfaz intuitiva. A la derecha, un panel de resumen muestra estadísticas dinámicas de las tablas o columnas. El centro presenta la tabla de datos y un perfil de columnas arriba. A la izquierda, un panel de operaciones facilita ejecutar tareas de limpieza de datos con simples clics. Abajo, un panel de pasos de limpieza registra nuestras acciones, permitiendo modificarlas fácilmente. También, en la parte inferior, se muestra el código Python generado por las operaciones, aunque la interfaz principal facilita la ejecución sin adentrarse en el código.
Limpiando Datos con Data Wrangler en Microsoft Fabric
Para eliminar una columna innecesaria, como Número de pedido, nos dirigimos a los tres puntos en su extremo derecho, seleccionamos Quitar columnas y vemos una vista previa del cambio. En el panel de pasos de limpieza, se registra este paso, mostrando el código Python generado abajo. Tras confirmar la acción pulsando Aplicar, la columna se elimina, reflejándose en la cuadrícula y en el panel de pasos, listo para la próxima operación.

En Data Wrangler, se realizan varias transformaciones: eliminación de columnas, filtrado de datos, división de texto, corrección de errores tipográficos, y cambio de tipo de datos. Cada acción se ejecuta fácilmente a través de la interfaz, con una vista previa de los cambios y el código Python generado visible para el usuario.
— PASO A PASO:
- Eliminar columna: Clic en tres puntos > Quitar columnas > Aplicar.
- Filtrar datos: Clic en tres puntos > Filtro > establecer condiciones > Aplicar.
- Dividir texto: Panel de operaciones > Formato > Dividir texto > establecer delimitador > Aplicar.
- Corregir errores: Panel de operaciones > “Buscar y reemplazar” > establecer valores > Aplicar.
- Cambiar tipo de datos: Clic en tres puntos > Cambiar tipo de columna > seleccionar nuevo tipo > Aplicar.
- Corregir capitalización: Panel de operaciones > Formato > Escribir el primer carácter en mayúsculas > “Aplicar“.
- Eliminar columnas no deseadas: Seleccionar columnas > Clic en tres puntos > Quitar columnas > Aplicar.
Cada paso se visualiza en la interfaz, y se puede revisar el código Python generado en la parte inferior de la pantalla.
Ver el Código de Python Completo
Data Wrangler permite revisar el código Python generado en cada paso. También se puede visualizar el código de todos los pasos a través de una opción en el panel de pasos de limpieza, brindando una vista previa detallada y comentada del código, lo cual puede ser educativo para quienes deseen aprender más sobre Python, Pandas, y otras librerías. Para regresar a la vista de un solo paso, simplemente se selecciona la opción correspondiente en la parte inferior.

El código generado:

Guardar el Resultado
Dentro de Data Wrangler, tras realizar nuestras transformaciones de datos, contamos con múltiples opciones para guardar o exportar el trabajo realizado. Podemos optar por guardar los datos transformados en un archivo CSV, lo cual es ideal para llevar estos datos a otras plataformas o simplemente tener un respaldo local. También, si deseamos, podemos copiar el código generado al portapapeles o exportarlo a un bloc de notas, lo cual es fantástico para aquellos interesados en revisar o reutilizar el código en otros entornos. Además, el cuaderno en el que trabajamos se guarda automáticamente, aunque podemos renombrarlo para mantener nuestro espacio de trabajo organizado y fácil de navegar. Esto es especialmente útil cuando trabajamos en proyectos extensos o múltiples tareas a la vez, permitiéndonos regresar y entender rápidamente lo que realizamos en cada cuaderno.

Microsoft Fabric en la Academia de Power Skill
La Academia Power Skill, reconocida por su compromiso con la excelencia educativa, está considerando seriamente la incorporación de un curso centrado en Fabric, la plataforma de Microsoft, en su currícula. Este curso, inicialmente concebido con un enfoque en Énfasis, tiene el potencial de evolucionar hacia un programa de formación completo que capacitará a los estudiantes para convertirse en Expertos en Microsoft Fabric. Con una sólida base de conocimientos y habilidades prácticas, los participantes estarán bien posicionados para explorar y aprovechar al máximo las robustas herramientas y capacidades que ofrece Fabric, elevando así su competencia y valor en el mundo tecnológico.
Este proyecto de curso no solo refleja la continua adaptación de la academia a las tendencias y tecnologías emergentes, sino que también reafirma su misión de empoderar a los profesionales con educación de vanguardia, preparándolos para los desafíos y oportunidades en la esfera digital.
Conclusiones
Tras explorar las funcionalidades y capacidades de Data Wrangler dentro de Microsoft Fabric, es evidente que esta herramienta representa un recurso invaluable para los profesionales de datos. Permitiendo una manipulación y transformación de datos intuitiva y efectiva, Data Wrangler demuestra cómo el correcto equilibrio entre una interfaz amigable y una robusta generación de código Python puede acelerar los flujos de trabajo de ingeniería de datos.
La capacidad de visualizar, en tiempo real, los cambios en los datos y el código correspondiente que se genera, no solo facilita la tarea de limpieza y preparación de datos, sino que también se convierte en un recurso educativo para aquellos interesados en profundizar en la programación en Python, Pandas, y otras librerías asociadas. Además, la opción de exportar el código o guardar los datos transformados añade una capa de flexibilidad y portabilidad al trabajo realizado en la plataforma.
Por otro lado, la perspectiva de un curso especializado en Microsoft Fabric ofrecido por la Academia Power Skill sugiere un camino prometedor para los entusiastas y profesionales de la tecnología. Esta formación no solo contribuiría al desarrollo de habilidades críticas en el manejo de Fabric y Data Wrangler, sino que también podría catalizar la adopción y la maestría de estas herramientas en la comunidad tecnológica.
En resumen, Data Wrangler en Microsoft Fabric emerge como una solución potente y accesible para enfrentar los retos inherentes a la ingeniería de datos. Además, la propuesta educativa de Power Skill en esta dirección reafirma la relevancia y el impacto que Fabric podría tener en el ámbito de la gestión y análisis de datos. Con las herramientas adecuadas y la formación correspondiente, los profesionales están un paso más cerca de desbloquear insights valiosos de sus datos, impulsando así la toma de decisiones informada y la innovación en sus respectivos campos.