Asistente inteligente con Machine Learning

Nuestro cliente es líder mundial en soluciones de seguridad. Entre sus servicios, ofrece una amplia gama de soluciones dirigidas a numerosos sectores y segmentos de clientes, desde pequeñas empresas hasta grandes complejos industriales.

Uno de sus servicios más destacados es el Centro de Operaciones, también conocido como SOC, cuyo objetivo es proporcionar soluciones vanguardistas y diferenciadoras mediante el uso de las tecnologías más innovadoras y la supervisión continua de sus clientes.

Entre otras cosas, el SOC es responsable de recibir y administrar los avisos de avería en los dispositivos de vigilancia que tienen instalados. Dentro del proceso de gestión de dichos avisos, hay un operador en el SOC que, en un momento dado, tiene que tomar la decisión de dónde enviar dicho aviso. Se puede enviar a un técnico de sala que intente resolver el problema de manera remota, o a un técnico de campo que resuelva el problema moviéndose físicamente al lugar donde se encuentra el dispositivo dañado.

El hecho de que un operador de SOC tome una decisión de envío incorrecta tiene un coste para nuestro cliente: podría ser el caso de enviar a un técnico de campo cuando la avería podría haberse resuelto de forma remota o viceversa.

Reto

En este contexto, se propuso un caso de uso como proyecto piloto de Machine Learning con tres objetivos principales:

  • Calificar las diferentes fuentes de información y analizar la calidad de los datos recopilados hasta el momento, para optimizar el proceso de recogida de datos para obtener el máximo provecho de ellos.
  • Obtener información detallada sobre la naturaleza de las averías para comprenderlas mejor, lo que también nos permitirá calificar las fuentes de información y evaluar la calidad de los datos que actualmente se recopilan o explotarlos en el futuro.
  • Evaluar la posibilidad de generar un modelo predictivo fiable, que en el futuro pudiera permitir crear una herramienta capaz de ayudar al operador de SOC a la hora de decidir dónde derivar cada aviso de avería. De esta forma mejorarían sus índices de éxito y, por lo tanto, supondría un ahorro considerable para nuestro cliente.

Soluciones

ANÁLISIS DE FUENTES DE INFORMACIÓN Y DATOS

De las tres fuentes de datos recibidas originalmente, concluimos que, en el momento actual, solo una de ellas sería relevante, puesto que es la información que tiene disponible el operador en el momento de la toma de decisiones. Esto nos permitió simplificar enormemente tanto la recopilación de datos como la generación del propio modelo.

Durante el análisis, se identificó que algunas variables tenían porcentajes muy altos de valores nulos, lo que permitía iniciar procesos para refinar y mejorar la recolección de datos para estas variables.

Por otro lado, el análisis de los datos nos hizo sospechar que podría haber un etiquetado erróneo en algunos casos como incidentes de campo o de sala, lo que dificultó el proceso de aprendizaje posterior.

ANÁLISIS DETALLADO DE LOS DATOS RECOGIDOS

El listado "top 10" de instalaciones, paneles y ubicaciones que han generado la mayoría de los incidentes técnicos. En el caso de instalaciones y ubicaciones, no se encontraron patrones relevantes o representativos, pero vimos que el conjunto de incidentes de los 10 paneles para los que tenemos más incidentes técnicos representa más del 50% del total de incidentes. Es decir, si en la primera iteración tuvimos alrededor de 7,500 incidentes, más de la mitad de ellos se concentraron en solo 10 paneles. Podría tener sentido estudiar y analizar este subconjunto más detalladamente e intentar generar un modelo que se enfocase solo en estos 10 paneles (y, por lo tanto, válido solo para ellos). Finalmente eso fue lo que se hizo.

MODELO PREDICTIVO

Se ha trabajado para mejorar el modelo predictivo con la restricción final de las variables individuales disponibles en el momento de la decisión del operador.

Después de varias iteraciones probando diferentes conjuntos de datos, conjuntos de variables y diferentes métodos de aprendizaje, en el total de datos recibidos encontramos que el mejor de los resultados que obtenemos con los datos actuales es de alrededor del 66% de fiabilidad.

Sin embargo, al ver los resultados obtenidos en el análisis descriptivo, optamos por trabajar con el subconjunto de paneles "top 10" que comentamos anteriormente para tratar de obtener modelos más fiables.

Resultados

Con el objetivo de poner a disposición de los operadores de campo una solución que les ayudara en su proceso de toma de decisiones, se creó una interfaz que utiliza el modelo generado y en la que el operador en primer lugar introduce los datos de un incidente e inmediatamente recibe una predicción sobre la incidencia evaluada con un porcentaje de fiabilidad asociado.

Antes de iniciar el sistema de evaluación de incidentes, el operador decidió que aproximadamente el 50% de los incidentes podrían resolverse en sala (remotamente) y el otro 50% desplazando físicamente a un técnico al lugar de la avería. En este sentido el número de incidentes enviados incorrectamente fue de aproximadamente el 30%. Una vez que se inició el sistema que planteamos, el operador comenzó a seguir sus criterios a la hora de seleccionar dónde enviar un incidente. El resultado fue que el número de incidentes enviados incorrectamente se había reducido al 10%, con el ahorro de costes que esto implica para nuestro cliente.

Háblanos de tu proyecto, podemos ayudarte.

Hacemos uso de las cookies para mejorar su experiencia en nuestra web. Más info.