Fabric

Microsoft Fabric: Un nuevo paradigma en los datos 

La innovación continua (frenética, pero controlada) es una marca de la casa de Microsoft en estos últimos años. Una vez pasada la explosión de la IA a finales del primer trimestre de este año y de su integración en Bing, Azure Open AI y todos los copilots que están por llegar, la compañía de Redmond da una vuelta más a la gestión de los Datos cubriendo asignaturas que tenía “pendientes” dentro de su oferta de prestaciones con la presentación de Microsoft Fabric

“Todos los datos. Todos los equipos. Todo en un solo lugar”,  este es el lema con el que Microsoft nos resume Fabric, una suite que nos permite: 

  • Unificar nuestra estructura de datos cuyo centro único son los data lakes. 
  • Administrar modelos de IA sobre esta única estructura. 
  • Capacitar y ayudar a todos en nuestra compañía en el proceso de toma de decisiones a partir de las conclusiones que nos brinda Fabric después del análisis de los datos. 
  • Y, por supuesto, todo ello con seguridad, compliance y governance de datos integrada. 

Fabric nos permite sacar partido de estos 4 puntos ofreciéndonos esta arquitectura: 

Un único origen, una mejor colaboración 

Podemos ver que la base fundamental, el centro de todo el ecosistema Fabric es OneLake: un data lake único y unificado para toda la organización. De modo similar a lo que ocurre con OneDrive y los tenants de Microsoft, cada tenant de Microsoft Fabric tiene su propio OneLake que debe ser el único lugar donde almacenar todas las analíticas y datos. 

Esta unificación de datos mejora notablemente la colaboración entre todos los profesionales de datos de nuestra organización. Enlaza entre sí todas las herramientas adaptadas a cada uno de los roles de nuestros expertos de datos, experiencias y tecnologías. Por eso, permite que las personas trabajen con ellas de modo instantáneo: 

De este modo Microsoft Fabric pone a nuestra disposición: 

  • Synapse 
  • Power BI 
  • Data Factory 
  • Data Advisor (de momento en versión preliminar) 

A lo largo del artículo profundizaremos en cada uno de los puntos anteriores.

Capacidades Basadas en IA 

En Microsoft Fabric disponemos de todas las características de IA disponibles, tanto en Azure OpenAI como Copilot. Utilizando lenguaje natural para operaciones desde integración de datos hasta informes. De este modo podemos centrarnos en sacar valor de nuestros datos. Copilot juega un rol crucial: Ayuda en DataFlows, Data Pipelines y guía en la creación de modelos ML.

En este vídeo podemos observar algunas pinceladas de estas características: 

Y sobre todo, lo más importante, la premisa y el mantra más importante es que es un entorno confiable

  • Nuestros datos son nuestros y solo nuestros.
  • Nuestros datos no son utilizados para entrenar, reentrenar o mejorar los modelos de Microsoft ni de terceras compañías. 
  • Los datos están protegidos mediante los controles más exhaustivos de seguridad y de compliance. 
  • Compromiso de almacenar y tratar los datos dentro de la UE (EU Data Boundary) 

Microsoft Synapse 

Otro de los elementos que constituyen Microsoft Fabric es Synapse que, a su vez, se divide en 4 aspectos importante: 

  • Ingeniería de datos: Transformación de datos a gran escala: 
Fabric_3
  • Crear y administrar los datos mediante un almacén de lago.
  • Diseñar canalizaciones para copiar datos en el almacén de lago.
  • Usar definiciones de trabajos de Spark para enviar un trabajo por lotes o streaming a un clúster de Spark.
  • Usar cuadernos para escribir código para la ingesta, preparación y transformación de datos.
  • Almacenamiento de datos: ofreciendo un rendimiento SQL máximo acompañado la capacidad de escalar la computación y el almacenamiento de modo independiente. 
  • Data Science: Creación de modelos predictivos sin perder el poder de la colaboración en el entrenamiento, la implementación y la administración de modelos de machine learning. Acompañándonos en todo el proceso desde la formulación del problema hasta el resultado.
The_data_science_process
  • Análisis en tiempo real: Esto es, tener las conclusiones de nuestros datos en tiempo real a partir de un análisis de grandes volúmenes de datos de aplicaciones, sitios web e IoT. Este punto, tiene su pico de utilidad en que responden a preguntas como:
    •  ¿Necesito una actualización alta de la ingesta de datos para realizar consultas?
    • ¿Quiero transformar los datos de streaming? 
    • ¿Tengo un servicio que necesite acceder a los datos con baja latencia de consulta (en cuestión de segundos)? 
    • ¿Necesito buscar o acceder a datos en distintos formatos, como datos estructurados, datos semiestructurados (incluidos datos complicados como JSON u otras matrices) o datos no estructurados (por ejemplo, texto libre)? 
    • ¿Quiero la capacidad de consultar grandes cantidades de datos? 
    • ¿Mis datos tienen un componente de tiempo que puede beneficiarse de la estructura de base de datos optimizada para series temporales? 
    • ¿Quiero la capacidad de crear consultas ad hoc en cualquier campo o fila sin optimización previa? 

Microsoft Power BI 

De todo el universo Fabric quizá el actor más conocido. En esta nueva iteración de Power BI podremos disponer de: 

  • Hub de datos: creación de un repositorio de datos seguro y confiable que brinde la oportunidad a toda la organización de encontrar y analizar los datos adecuados. 
  • Creación de informes que nos permitan sacar conclusiones clave a la vez que visualmente atractivas mediante un diseñador de informes de muy fácil uso: 
creación_de_informes
  • Copilot para la creación y el análisis de informes
  • Integración con Microsoft 365 

Microsoft Data Factory 

Podríamos resumir Microsoft Data Factory como la herramienta ETL de Fabric. 

Sus funcionalidades van desde la Integración de datos recopilando datos de diferentes orígenes (tanto locales como On Cloud), con más de 100 conectores disponibles; pasando por la ETL autónoma y sin código de los Data Flows y los Data Pipelines hasta la gestión de la canalización en la consolidación de datos híbridos para ser supervisados y administrados. 

Microsoft_data_factory
Ejemplo de Data Flow
Data_Pipeline
Ejemplo de Data Pipeline 

Data Activator 

Data Activator es un producto sin necesidad de código en Microsoft Fabric que monitorea datos y activa acciones cuando se cumplen condiciones comerciales. 

Por ejemplo, puedes enviar alertas por correo electrónico cuando los datos de ingresos por ventas en tu informe de Power BI caen por debajo de un umbral. De manera similar, puedes enviar una notificación en Microsoft Teams cuando la temperatura de un paquete perecedero supera un umbral. 

Podemos entrever pues que Data Activator nos ofrece: 

  • Supervisión de datos en tiempo real 
  • Creación de alertas configurables 
  • Desencadenar acciones humanas y automatizadas como respuesta a estas alertas 

Todo sin necesidad de código. 

Microsoft Fabric es un gran paso en la evolución de la gestión y análisis de datos a la par que aprovechamos las, cada día mejores, capacidades de la IA. 

En estos momentos Microsoft Fabric aún está en preview. Por eso os animamos a que lo probéis y podáis ver de primera mano todas estas características que hemos repasado en este artículo: Prueba Fabric

Microsoft_Fabric

Microsoft Fabric responde a la Gestión Unificada de Datos y Potencia de la IA

En resumen, Microsoft Fabric integra data lakes, IA y seguridad en una única plataforma. Permite a las organizaciones consolidar su información, impulsar análisis profundos y tomar decisiones fundamentadas. Con herramientas como Synapse, Power BI, Data Factory y Data Activator, Microsoft no solo demuestra su compromiso con la innovación, sino que también facilita el camino hacia un futuro donde la gestión y análisis de datos se fusionan de manera cohesiva.

Si deseas obtener más información sobre Microsoft Fabric o si tienes alguna pregunta adicional, no dudes en contactarnos. Estaremos encantados de ayudarte y proporcionarte la información que necesites.

Oriol Fernandez – Product Owner at Itequia