Hay mucha expectación sobre el uso de la inteligencia artificial (IA) en la ciberseguridad. Lo cierto es que el papel y el potencial de la IA en la seguridad aún está evolucionando y queda mucho por explorar y evaluar. un comentario de Chester Wisniewski, científico investigador principal de Sophos.
Para seguir desarrollando la IA lo más rápido posible y poder usarla de manera aún más eficiente en seguridad, el intercambio integral entre investigadores y expertos en IA es particularmente importante. Por esta razón, Sophos AI se compromete a compartir abiertamente los resultados de su investigación con la comunidad de seguridad para hacer que el uso de la IA sea más transparente y contribuir activamente a la discusión y el posicionamiento de la IA en la ciberseguridad. Uno de los temas más importantes en el desarrollo posterior de la IA en ciberseguridad son los diferentes modelos y métodos de cómo la IA aprende con datos antiguos y nuevos.
El "olvido catastrófico" como modelo de detección de IA
La detección de malware es la piedra angular de la seguridad de TI, y la IA es el único enfoque que puede aprender patrones de millones de nuevas muestras de malware en cuestión de días. Sin embargo, cuando se usa IA para la detección de malware, surgen dos preguntas: ¿Debe el modelo conservar todas las muestras de malware para siempre para permitir una detección óptima, aunque a expensas de la velocidad de aprendizaje y actualización? ¿O debería realizar un ajuste fino selectivo que permita que el modelo se mantenga mejor al día con la tasa de cambio del malware, a riesgo de olvidar patrones más antiguos? Este último se conoce como "olvido catastrófico". Hoy en día, volver a entrenar a un modelo toma alrededor de una semana. Se tarda aproximadamente una hora en actualizar un buen modelo de torneado fino.
El equipo de inteligencia artificial de Sophos quería ver si era posible diseñar un modelo de ajuste fino que pudiera mantenerse al día con el panorama de amenazas en rápida evolución, aprendiendo nuevos patrones sin dejar de recordar muestras más antiguas, con un impacto mínimo en el rendimiento. La investigadora Hillary Sanders asumió esta tarea y evaluó una serie de opciones de actualización, que describe en detalle en el blog de Sophos AI.
El dilema del reconocimiento
Mantener actualizada la detección de malware no es tarea fácil. Cada paso que das para defenderte de un ataque, tus oponentes responden con nuevas ideas para evitarlo. Desarrollan actualizaciones utilizando diferentes códigos o técnicas. Como resultado, cada día aparecen cientos de miles de nuevas muestras de malware.
Lo que dificulta aún más la detección es el hecho de que el malware más reciente y efectivo rara vez es completamente "nuevo". A menudo es una combinación de código nuevo, antiguo, compartido, prestado o robado, así como comportamientos adoptados y adaptados. Además, el antiguo malware reaparece años después y se integra en nuevos métodos de ataque para tomar por sorpresa a las defensas. Ergo, los modelos de detección deben asegurarse de que también detectan muestras de malware más antiguas, y no solo las más nuevas.
Actualización de modelos de detección de IA
Cuando se trata de actualizar los modelos de detección de IA con nuevas muestras de malware, los proveedores tienen dos opciones.
Option1: Mantener cada muestra y volver a entrenar el modelo con cantidades cada vez mayores de datos. Esto conduce a un mejor rendimiento general, pero también a actualizaciones más lentas y menos lanzamientos.
Opción 2 El modelo de detección solo se actualiza con nuevas muestras. Esto se llama ajuste fino. En cada paso del proceso de ajuste, el modelo se actualiza con el conocimiento recién agregado y con el impacto en todos los patrones disponibles. Como resultado, el modelo puede “olvidar” (“olvido catastrófico”) los viejos patrones que aprendió previamente. El beneficio: entrenar un modelo con menos datos significa que puede actualizarse e implementarse más rápidamente para seguir mejor el ritmo del malware que cambia rápidamente.
Formación continua de los modelos de reconocimiento de IA
Independientemente de las dos opciones mencionadas, el entrenamiento continuo de los modelos de reconocimiento de IA con nuevas muestras es crucial. Porque los patrones que una IA aprende de las muestras de malware no solo permiten la detección en relación con lo que se ha entrenado directamente. La IA también reconoce muestras previamente desconocidas que muestran al menos cierta similitud con los datos de entrenamiento. Sin embargo, con el tiempo, las nuevas muestras se desvían lo suficiente como para hacer que un modelo anterior sea menos efectivo y requiera una actualización.
El lado izquierdo del gráfico (junto a la línea discontinua) muestra el modelo en la línea de tiempo con las muestras entrenadas más antiguas. Aquí la tasa de reconocimiento es constantemente alta. Se agregan nuevas muestras en el lado derecho para las cuales el modelo aún no se ha entrenado, lo que da como resultado una tasa de reconocimiento más baja.
Tres opciones para actualizar la detección de malware
Las tres opciones para actualizar la detección de malware evaluadas por Hillary Sanders son:
1. Aprende con una selección de muestras antiguas y nuevas
Esto se denomina "ensayo de datos" e involucra una pequeña muestra de muestras antiguas que se mezclan con los nuevos datos de entrenamiento nunca antes vistos. De esta manera, el modelo es "recordado" de la información antigua que necesita para reconocer patrones más antiguos, mientras que al mismo tiempo aprende a reconocer los más nuevos.
2. Ajuste de la velocidad de aprendizaje
Con este enfoque, se ajusta la tasa de aprendizaje del modelo. Esto se logra definiendo cuánto puede cambiar el modelo después de ver una muestra en particular. Si la tasa de aprendizaje es demasiado rápida (en cuyo caso el modelo puede cambiar mucho con cada muestra agregada), solo recuerda las muestras más recientes. Si la velocidad de aprendizaje es demasiado lenta (el modelo puede cambiar solo ligeramente con cada muestra agregada), el aprendizaje tardará demasiado. La dificultad es encontrar el compromiso perfecto entre la velocidad de aprendizaje, la retención de información antigua y la adición de información nueva.
3. Consolidación de Peso Elástico (EWC)
Este enfoque se inspiró en el trabajo de DeepMind de Google en 2017. Como un resorte elástico, tira de un nuevo modelo hacia uno más antiguo en caso de que comience a "olvidarse". Hillary Sanders tiene una descripción más detallada de este principio Blog de SophosAI veröffentlicht.
Como se muestra en el gráfico, los tres enfoques funcionan mejor en las muestras de malware más antiguas (a la izquierda de la línea discontinua) que en las muestras más nuevas (a la derecha de la línea discontinua).
Conclusión
Aprender con una selección de muestras antiguas y nuevas (ensayo de datos) es el mejor compromiso
En la detección de malware, la capacidad de recordar el pasado es casi tan importante como la capacidad de predecir el futuro. Sin embargo, esto debe sopesarse con el costo y la velocidad de actualizar el modelo con nueva información. El ensayo de datos es una forma simple y efectiva de mantener la detección de malware antiguo mientras aumenta significativamente la velocidad a la que puede actualizar y lanzar nuevos modelos.
Más información en Sophos.com
Acerca de Sophos Sophos cuenta con la confianza de más de 100 millones de usuarios en 150 países. Ofrecemos la mejor protección contra amenazas informáticas complejas y pérdida de datos. Nuestras soluciones integrales de seguridad son fáciles de implementar, usar y administrar. Ofrecen el costo total de propiedad más bajo de la industria. Sophos ofrece soluciones de cifrado galardonadas, soluciones de seguridad para terminales, redes, dispositivos móviles, correo electrónico y web. También cuenta con el soporte de SophosLabs, nuestra red global de centros de análisis patentados. Las oficinas centrales de Sophos se encuentran en Boston, EE. UU. y Oxford, Reino Unido.