Immuta actualiza la plataforma de seguridad de datos para Databricks AI

Publicado: 2023-07-12

Immuta, proveedor de la plataforma de seguridad de datos interoperable, ha anunciado integraciones y actualizaciones que mejorarán la seguridad de Databricks. Databricks es una empresa de software fundada por los creadores de Apache Spark, que brinda soluciones para almacenes de datos y lagos de datos.

En los últimos años, Databricks ha presentado un nuevo e innovador enfoque arquitectónico que combina almacenes con lagos de datos para formar el nuevo modelo "lakehouse". También ha realizado importantes inversiones en inteligencia artificial (IA), lo que exige medidas de seguridad más avanzadas.

Ahí es donde entra Immuta. Fundada en 2015, Immuta es uno de los principales proveedores de plataformas de seguridad de datos de América del Norte y se especializa en la protección del flujo de trabajo de IA. Sus herramientas de gobierno de datos nativas de la nube permiten una mejor seguridad, un descubrimiento más fácil de datos confidenciales y controles de acceso más sólidos.

Gracias a esta nueva actualización anunciada en junio de 2023, los clientes de Databricks podrán disfrutar de las capacidades de la plataforma de Immuta.

Acerca de la integración de Immuta y Databricks

Immuta y Databricks fortalecieron su asociación en mayo de este año cuando Databricks Ventures (el brazo de capital de riesgo de la empresa Lakehouse) realizó una inversión considerable en seguridad. Si bien no se reveló la cantidad, Immuta dijo que los fondos se utilizarían para el desarrollo de productos.

Por lo tanto, tiene sentido que las nuevas actualizaciones presenten Databricks al frente y al centro, brindando a los clientes una gran cantidad de nuevas funciones y capacidades.

Las dos empresas son socias desde hace mucho tiempo y trabajan juntas desde la primavera de 2018, cuando Immuta implementó nuevas herramientas para Apache SparkSQL. Desde entonces, la asociación ha crecido y evolucionado, culminando en esta última actualización. Las características clave incluyen el control de acceso para la protección de la carga de trabajo de IA y el descubrimiento localizado de datos confidenciales.

La necesidad de protección de cargas de trabajo de IA

En 2023, está claro que la protección de la carga de trabajo de IA es la necesidad del momento. Al igual que la nube una vez marcó el comienzo de una revolución digital masiva, estamos presenciando lo mismo para la inteligencia artificial. Más del 90 % de los desarrolladores usan herramientas de IA en el trabajo y una encuesta diferente revela que el 77 % de las empresas usan varias herramientas de terceros para cargas de trabajo de IA.

Esto hace que los sistemas como Databricks sean particularmente vulnerables a ataques e infracciones de seguridad. La empresa está apostando fuerte por la IA y tiene la intención de ayudar a los clientes a reducir costos y acelerar la innovación unificando sus datos, análisis e IA en una plataforma en la nube.

Pero sin un control adecuado de la carga de trabajo de la IA, esto podría significar un vector de amenazas masivo.

Como resultado, la compañía ha incrementado recientemente sus esfuerzos de ciberseguridad. Además de las actualizaciones vitales de Immuta a su plataforma de seguridad de datos, Databricks también se unió a las empresas de seguridad BigID, Theom y Hunters este año.

(Descargar Whitepaper: Proteger sus datos de principio a fin )

Plataforma de seguridad de datos mejorada de Immuta

Ahora, pasemos a los cambios clave que puede esperar de la actualización reciente de Immuta.

1. Integración nativa con Databricks Unity Catalog

El Databricks Unity Catalog se encuentra entre las ofertas principales de la empresa. Le permite gobernar datos estructurados y no estructurados, así como modelos de aprendizaje automático a través de un espacio de nombres de tres niveles que organiza sus activos de datos.

Los datos en diferentes niveles pueden ejercer mucha presión sobre los ingenieros para discutir las políticas de acceso, especialmente a medida que crece la complejidad de los modelos. La integración nativa de Immuta ayudará de tres maneras: proteger los datos, detectar problemas de acceso y descubrir información confidencial.

2. Cumplimiento de la política de seguridad

El nuevo y mejorado Immuta no solo permite políticas de seguridad más inteligentes, sino que también facilita su aplicación. Puede otorgar o revocar derechos de acceso en el nivel de la tabla de Unity a través de la aplicación de políticas nativas.

3. Gestión centralizada de metadatos

Immuta centralizará la gestión de metadatos para la información almacenada en los lagos de Databricks. En la superficie, esto le permite automatizar y orquestar políticas. Pero profundizando más, tiene varios otros beneficios, como ayudarlo a descubrir datos confidenciales más fácilmente. Puede agregar etiquetas como información de identificación personal (PII) para aplicar políticas estrictas en todos los datos confidenciales que descubra.

4. Seguimiento de la actividad del usuario

Immuta le permitirá monitorear y registrar toda la actividad del usuario que ocurre en Databricks. Esto incluye registros de auditoría de consultas de usuarios, quién cambió una política y cuándo, y resúmenes de acceso de usuarios. Aquí, entra en juego el Modelo de auditoría unificado (UAM) de Immuta. Kit garantiza una estructura de registro y metadatos coherentes en Unity Catalog y su instancia principal de Immuta para simplificar la seguridad.

5. Políticas de control de acceso

Immuta introduce la automatización en el entorno de Databricks. Cuando crea una única política de Immuta con una intención de alto nivel, la plataforma de seguridad de datos creará automáticamente varias políticas para ejecutar en Databricks. Esto reduce significativamente su esfuerzo manual para definir políticas de control de acceso.

La compañía afirma que el uso de las nuevas integraciones de Immuta puede reducir la cantidad de roles y políticas para administrar en 93X.

Fortalecimiento de la protección de cargas de trabajo de IA

Si bien la protección de la carga de trabajo de IA no es lo único que puede lograr con la integración de Immuta-Databricks, definitivamente se encuentra entre los principales casos de uso. A medida que la inteligencia artificial crece, es probable que desee migrar los datos de IA a la nube. Ahora que Databricks Unity Catalog está protegido, puede filtrar roles, enmascarar columnas, descubrir datos confidenciales, controlar el acceso a datos de IA y mucho más. Los procesos de migración ahora ocurrirán con más confianza.

Además de la protección de la carga de trabajo de IA, Immuta garantiza que estos procesos de datos cumplan con regulaciones como HIPAA y GDPR.

La plataforma de seguridad de datos también agrega otra capa de confianza al análisis de seguridad. Por lo general, al analizar cargas de trabajo de datos de IA en busca de vulnerabilidades, se ve inundado de riesgos potenciales. Muchos de estos son falsos positivos que solo toman tiempo con pocos resultados. La función de detección de Immuta asigna puntajes a los datos de IA en función del grado de sensibilidad.

Puede priorizar los riesgos y configurar alertas en tiempo real para recibir notificaciones cuando eventos realmente graves amenacen el control de la carga de trabajo de la IA.

¿Cuáles son los beneficios comerciales?

La solución recientemente anunciada brindaría a los clientes los siguientes beneficios:

  • Rendimiento mejorado sin comprometer la seguridad : la arquitectura Databricks Lakehouse es compatible con cualquier nube de su elección. Ahora, puede combinar esta libertad con la seguridad mejorada de Immuta. Esto significa que puede migrar activos de datos de IA a cualquier entorno de nube y garantizar un rendimiento superior sin comprometer la seguridad.
  • Colaboración optimizada e intercambio de datos en Databricks : con Immuta, los usuarios pueden participar en una colaboración segura en Databricks. Esto se debe a que la integración mantiene registros de auditoría detallados con total transparencia. Los usuarios pertinentes pueden acceder al almacén de metadatos centralizado. Puede delegar la administración de las políticas e incluso definir el acceso basado en propósitos.
  • Obtener una ventaja competitiva con seguridad de datos de primer nivel : Immuta brinda seguridad de vanguardia y protección de carga de trabajo de IA al entorno de Databricks. Los usuarios de Unity Catalog podrán aprovechar al máximo sus repositorios de datos, crear nuevos modelos de IA y resolver problemas comerciales complejos sin preocuparse por la seguridad o el cumplimiento.

Lo que los clientes tienen que decir

Immuta es un veterano en lo que respecta a la gestión del gobierno de datos y la protección de la carga de trabajo de IA. Por ejemplo, la empresa ayudó a la investigación clínica de Cognoa a acelerar la IA y el aprendizaje automático compatibles con HIPAA a través de su plataforma de seguridad de datos.

“Con Immuta, básicamente puedes emular la consulta de un usuario y sus permisos para ver exactamente lo que ven. Puede verlo de forma controlada y asegurarse de que nadie tenga acceso a algo que se supone que no debe tener”, dijo Charlie Qin, propietario de la plataforma de datos de Cognoa.

La nueva integración pone beneficios similares a disposición de los usuarios de Databricks Unity Catalog. Esto es lo que dos de sus clientes compartidos tienen que decir:

“Databricks nos ayuda a administrar esos datos e Immuta juega un papel importante en la administración de la seguridad y el control de acceso. A medida que buscamos innovar con nuevos productos e implementar una estrategia de múltiples nubes, debemos tratar los datos de manera adecuada, deben gobernarse”, dijo Jack Berkowitz, director de datos de ADP.

“Swedbank necesitaba construir una plataforma de análisis avanzado a escala empresarial que también reforzara la confianza en nuestra seguridad, administración y acceso a los datos internamente mientras protegía los activos y los datos de nuestros clientes. Immuta y Databricks han sido fundamentales para ayudarnos a construir esa visión y estamos entusiasmados de ver que su asociación avanza al siguiente nivel”, dijo Vineeth Menon, director de ingeniería de Data Lake en Swedbank.

Conclusión

En la era de la IA, la infraestructura de datos en la nube suele tener tres capas: el lago de datos, el almacén de datos y el intercambio de datos. Immuta y Databricks se unen para agregar un cuarto pilar: seguridad de datos en la nube. La IA requiere que la información se maneje a una escala y velocidad increíbles, lo que requiere tres cosas:

  • Separación de la política de la plataforma
  • Controles de datos en la nube nativos y no adaptados
  • Aprovechar atributos en lugar de roles para etiquetar datos

Immuta y Databricks se dieron cuenta de que, a lo largo de los años, sus clientes compartidos comenzaron a ejecutar cargas de trabajo complejas como el aprendizaje automático y la inteligencia artificial en la nube. La nueva integración, con sus componentes Discover, Detect y Secure, permite una mejor granularidad y capacidad de administración para sus almacenes de datos.

Los clientes existentes ahora pueden aprovechar esta integración.