Extracción de patrones para la Industria 4.0 a través de un modelo predictivo

EXTRACTION OF PATTERNS FOR INDUSTRY 4.0 THROUGH A PREDICTIVE MODEL

Inés Sittón Candanedo 1,

Sara Rodríguez González 1,

Lilia Muñoz 2*

1 BISITE Digital Innovation Hub Universidad de Salamanca, España

2 GITCE, Universidad Tecnológica de Panamá, Panamá

[email protected]

RESUMEN– El Internet de las Cosas ha venido incorporándose a nuestras vidas de forma progresiva, trayendo consigo grandes beneficios para la humanidad como lo es disponer de infraestructuras y servicios más interconectados y eficientes, generación de empleo, reducción de costos operativos e incremento de ganancias. En este sentido, el desarrollo e instalación de sensores avanzados para recolección de datos, las soluciones informáticas de conexión remota y otras tecnologías disruptivas están marcando un proceso de transformación en la industria; dando inicio a lo que diversos sectores han denominado cuarta revolución industrial o Industria 4.0. En este artículo se presenta un modelo predictivo para la extracción de patrones utilizando técnicas de fusión de datos que permitan el diseño de un modelo de mantenimiento predictivo, a través de un enfoque de entrenamiento supervisado, realizar la clasificación de datos y probabilísticamente valores predictivos.

Palabras clave– Industria 4.0, modelo, predicción, sensores.

ABSTRACT– The Internet of Things has been incorporated into our lives progressively, bringing with it great benefits for humanity such as having more interconnected and efficient infrastructures and services, generating employment, reducing operating costs and increasing profits. In this sense, the development and installation of advanced sensors for data collection, remote connection computing solutions and other disruptive technologies are marking a process of transformation in the industry; giving rise to what several sectors have called the fourth industrial revolution or Industry 4.0. This article presents a predictive model for the extraction of patterns using data fusion techniques that allow the design of a predictive maintenance model, which allows using a supervised training approach, perform data classification and probabilistically predictive values.

Keywords– Industry 4.0, model, prediction, sensors.

1. Introducción

El sector industrial está desempeñando un papel cada vez más importante a nivel mundial. Se considera un motor de la innovación, crecimiento y estabilidad social. Sin embargo, la competencia es cada vez más intensa. Los clientes demandan productos de alta calidad, mucho más personalizados, con un tiempo de producción menor, lo que implica en muchos casos la utilización de herramientas acorde con los requerimientos.

En términos generales, solo aquellas empresas que logren conseguir productos a la medida y disminuyan los tiempos de producción, con la máxima eficiencia y eficacia en sus plantas, serán más competitivos. La solución está en la unificación del mundo real y el virtual, lo que se entiende como Industria 4.0.

En este sentido, la Industria 4.0 y los términos similares como Smart Manufacturing, Smart Production, Internet Industrial, 4.0, Industria Conectada 4.0, por mencionar algunos de los que han sido adoptados para identificar este paradigma de la cuarta revolución industrial, suponen un cambio de mentalidad importante y hacen referencia a la conversión del modelo industrial conocido hasta el momento por la irrupción del Internet de las Cosas (IoT), las redes de sensores y los sistemas ciber físicos (CPS) [1].

La estandarización es otro de los grandes retos que trae consigo la implementación de la Industria 4.0, convirtiéndose en el tema objeto de interés de los gobiernos, empresas y la comunidad científica para el desarrollo de soluciones, modelos o aplicaciones predictivas basadas en IoT. En opinión de algunos autores, existe una oportunidad para los investigadores en el contexto de la cuarta revolución industrial, porque si bien es cierto que las redes de sensores no son un tema reciente, aún son un desafío cuando se trata de encontrar soluciones para el problema de la fusión automática de los datos, el procesamiento y la integración del gran volumen de datos que generan estas fuentes heterogéneas [2].

Dentro de los grandes desafíos asociados al paradigma Industria 4.0, nos enfocamos en los datos generados por redes de sensores IoT instalados en máquinas y su adecuado procesamiento para obtener información que permita anticipar fallos y programar el mantenimiento predictivo de los equipos. Durante los últimos años este tema ha sido objeto de investigaciones por la diversidad de actividades industriales y de equipos que las conforman [3].

El artículo está estructurado de la siguiente manera: la primera sección describe la introducción, seguida el trabajo relacionado del paradigma Industria 4.0, sus habilitadores tecnológicos, investigaciones y países que destacan por sus iniciativas para convertir sus industrias en fábricas inteligentes (Smart Factories). En una tercera sección, se explica la propuesta para el diseño de un modelo predictivo, tomando como base el Modelo Omnibus utilizado para la fusión de datos [4]. Además, se presenta un caso de estudio. Se hace referencia a las técnicas y algoritmos que se utilizarán en las etapas de prueba para la extracción de patrones. En la cuarta sección se presentan los resultados. Finalmente, en la última sección se presentan las conclusiones y trabajos futuros.

2. Trabajo relacionado

La industria es una actividad de vital importancia en una región, ya que mediante ella puede mantenerse tanto el mercado laboral de dicha región como el valor añadido o las habilidades que los empleados pueden aportar. Una industria débil se traduce en incluso modificaciones en los estamentos sociales de una región, ya que puede afectar a la clase media y polarizar cada vez más la sociedad. Las tres revoluciones industriales previas provocaron grandes avances en la productividad y cambiaron la vida de las personas en todo el mundo. En la tabla 1 se puede apreciar un resumen de las revoluciones industriales.

Tabla 1. Resumen de las revoluciones industriales

El referente del concepto Industria 4.0 surge en Alemania durante el año 2011, cuando el Gobierno y el sector empresarial, encabezado por Bosch, conforman un grupo de investigación para encontrar un marco común que permitiera la aplicación de las nuevas tecnologías, entregando su primer informe en el 2012, que luego fue presentado en público durante la Feria de Hannover en 2013. Así inicia el paradigma de lo que hoy se conoce como la cuarta revolución industrial, referenciada bajo diferentes términos de acuerdo con el país en donde se desarrollen iniciativas para su investigación, y aplicación dentro del ecosistema industrial tanto a nivel macro como de PyMEs [5].

Según el trabajo desarrollado por el Ministerio de Industria, Energía y Turismo de España [6], dentro de la iniciativa Industria conectada 4.0, los nuevos requerimientos del mercado en la economía digital se pueden resumir en:

Personalización masiva: el consumidor, tanto final como intermedio, demanda cada vez más productos singulares y adaptados a sus preferencias, pero a bajo precio. La personalización masiva implica la producción a bajo costo de productos y servicios de alta calidad y en grandes volúmenes, pero personalizando el producto o servicio a las necesidades y gustos del cliente.

Acceso omnicanal a los productos y servicios: con la aparición de canales digitales, los canales se han multiplicado. El cliente ahora requiere de una mayor coherencia entre todos los canales. El reto de la omnicanalidad es eliminar las diferencias entre canales, haciendo que las relaciones con el cliente sean homogéneas independientemente del medio utilizado (ya sean físicos o digitales).

Conocimiento predictivo de los hábitos de uso y consumo: la empresa, cada vez más, deberá ser capaz de adelantarse a las demandas del cliente, ofreciéndole, entre todos los productos y servicios disponibles, aquellos más alineados con sus necesidades, sus gustos y sus preferencias. El conocimiento predictivo, así considerado, es un medio para la personalización del servicio al cliente. Democratización del acceso a la información: los clientes tienen acceso, en todo momento, tiempo y lugar, a toda la información disponible en un momento dado. Dicha democratización es hoy una realidad en los países desarrollados, donde la gran mayoría de la población tiene acceso a Internet y, por medio de este, a noticias, precios de productos y servicios, opiniones, ideas, publicaciones, informes, etc. de todo tipo y de todo el mundo.

No es posible hablar de una cuarta revolución industrial sin hacer referencia al Internet de las Cosas; aunque no existe una definición estándar aceptada universalmente para el IoT, la ITU (International Telecommunication Union) y el IERC (Internet of Things European Research Cluster) citados por Cruz et al.,., [6], lo define como: “una infraestructura de Red Global y dinámica con la autoconfiguración de las capacidades basadas en protocolos de comunicación estándar e interoperables, donde “cosas” físicas y virtuales tienen identidad, atributos físicos, personalidades virtuales y utilizan interfaces inteligentes que se integran a la perfección en la red de información”.

La IoT ha traído consigo entre otras cosas el uso integrado de las tecnologías de la información y las comunicaciones, el desarrollo y acuerdos sobre estandarización, y un nuevo modo de ver a toda la sociedad interactuando con una infraestructura de comunicaciones Persona-Máquina o M2M (Máquina a Máquina) que proporcionara una nueva generación de servicios en una Internet del Futuro con la interconexión de dispositivos de detección inalámbricos en Redes de Sensores Inalámbricas (WSN Wireless Sensor Network) basadas en IP [7].

Diversos sistemas se han desarrollado utilizando sensores o redes de sensores, generando su incorporación en infraestructura, inteligencia ambiental, productos, equipos de producción, por lo que, son un componente implícito en un entorno actual [8].

Una WSN forma una gran cantidad de nodos de sensores con el objetivo de detectar un fenómeno físico como: luz, temperaturas, vibraciones, entre otros [9]. En el contexto Industria 4.0 las WSN se consideran un revolucionario método de recopilación de información y con el acelerado desarrollo tecnológico de sensores, estas redes se han convertido en una tecnología clave del IoT.

3. Propuesta

Para afrontar el problema de la fusión automática de la información generada por sensores distribuidos heterogéneamente, Bajo J. et al., [10] indican la importancia de encontrar nuevas soluciones, destacando las diversas técnicas de fusión de datos e información que se encuentran en la literatura. En este contexto, Al Momani B. et al. [11], señalan que la fusión de datos ha demostrado ser valiosa en muchas aplicaciones, como el reconocimiento de patrones y la clasificación, donde en diversas investigaciones destacan modelos de fusión de datos para la gran gama de problemas existentes.

La primera etapa de esta investigación analiza el modelo de fusión de datos Omnibus, presentado por Bedworth M. y O’Brien J. [4] donde se enfatiza la extracción de patrones dentro de su ciclo. Este modelo de acuerdo con Almasri et al., [12] consta de una actividad formada por cuatro estados cíclicos que se desarrollan en el siguiente orden:

Detección y procesamiento de la señal: la información se colecta y preprocesa.

Extracción de patrones: con la información pre procesada, se extraen los patrones y se fusionan para crear los contextos necesarios.

Decisión: los contextos son procesados y se establecen las acciones a seguir.

Etapa de actuación (Act stage): se elige el plan a seguir.

La figura 1 muestra las diferentes etapas que constituyen el modelo que se propone, basándose en el modelo Omnibus, descrito anteriormente. Se inicia con un proceso de recolección de datos no estructurados, a partir de redes de sensores; luego mediante la aplicación de técnicas y algoritmos de fusión de datos se extraerán patrones, permitiendo el diseño de un modelo predictivo orientado a la industria 4.0. La aplicación de este modelo permitirá a las organizaciones una toma de decisiones oportuna en lo referente a la gestión del mantenimiento de equipos.

image

Figura 1. Diseño propuesto: modelo predictivo en industria 4.0.

El reconocimiento de patrones no es un término nuevo, tiene sus orígenes en la ingeniería y las aplicaciones estadísticas, sin embargo, su evolución ha permitido importantes desarrollos en el área de las ciencias computacionales, donde, facilita la detección automática de regularidades en los datos mediante el uso de algoritmos de inferencia y predicción, construidos a partir de teoremas probabilísticos como el de Naives Bayes, permitiendo tomar acciones tales como clasificar los datos en diferentes categorías [13]. Los métodos de fusión de datos, en su mayoría probabilísticos, se fundamentan en la regla de Bayes, teorema de Naives Bayes, que permite combinar información previa y de observación, sin embargo, existen otros métodos como: Filtros de Kalman, Random Forest (arboles aleatorios), Secuenciales de Monte Carlo o estimaciones de densidad y otras alternativas a los métodos probabilísticos como la teoría de la evidencia y los métodos de intervalo [14].

4. Caso de estudio

Los sistemas de climatización (HVAC) controlan el clima interior, la temperatura del aire, la humedad y la presión, creando un entorno de producción óptimo en edificios industriales. Estos equipos son fundamentales para el funcionamiento de una fábrica en el contexto de la Industria 4.0, sin embargo, el mantenimiento de rutina no siempre identifica las fallas en esos sistemas. El objetivo del mantenimiento predictivo en el paradigma de la Industria 4.0 es extender la vida útil del equipo utilizando diferentes herramientas y técnicas para identificar patrones anormales tales como: vibración, temperatura o equilibrio.

De acuerdo con la importancia de los sistemas HVAC en estos entornos, se presenta un caso de estudio, donde se utilizó un banco de datos organizado por columnas que contiene el registro de temperatura óptima y los valores reales medidos por sensores en edificios, para analizar el comportamiento de un sistema de climatización HVAC [15] y determinar si el equipo está fallando y requiere ser reemplazado al no mantener las temperaturas interiores en un rango óptimo.

La tabla 2, describe las variables del conjunto de datos HVAC, que está formado por 8,000 registros en edificios con un rango de edad de 0 a 30 años.

Tabla 2. Descripción de variables

Para el preprocesado de los datos se estableció un rango para las temperaturas normales y dos tipos de alarma que indican las temperaturas extremas y por lo tanto, una posible falla en los equipos. En la tabla 3 se almacenan los valores obtenidos de la diferencia entre la temperatura medida ‘TargetTemp’ y la temperatura óptima ‘Actualtemp’; en la segunda los valores de la conversión binaria asignando un 0 a las temperaturas normales y un 1 a las alarmas por temperaturas extremas (frío o calor).

Tabla 3. Descripción de temperatura normal y alarmas

5. Resultados

Para este caso de estudio se utilizó el clasificador Naive Bayes, entre sus ventajas se destacan: la rapidez y su capacidad de estimar con distribuciones unidimensionales. La figura 2, presenta su aplicación al conjunto de datos, en el cual y es una variable de clase o categórica y x es un vector dependiente (patrón o característica) donde x1 hasta xn. Por lo anterior, en la variable y, a cada valor considerado óptimo se le asigna un 0 y a cada temperatura fuera del rango normal se le asigna un dígito 1 para realizar la clasificación [16]. Este algoritmo se emplea en procesos secuenciales de mantenimiento de un modelo probabilístico dentro de un estado que con el tiempo va evolucionando, mientras es monitorizado por sensores. Una de las ventajas de este método es su formulación, ya que permite su aplicación en una variedad de problemas de fusión de datos sin modificar su representación o recurrir a otros modelos de observación [14].

Figura 2. Pseudocódigo Naive Bayes.

La figura 3 presenta la predicción que se obtiene al utilizar el clasificador basado en el algoritmo Naive Bayes. Se observa una gráfica que muestra los valores de los sensores (color azul) correspondientes a la temperatura y la predicción que realiza el algoritmo (color rojo). Evidenciando que la predicción de valores que realiza este algoritmo es similar a los captados por el sensor, con una precisión del 95%.

Luego de aplicar el modelo Naive Bayes y obtener su porcentaje de precisión, se aplicó al conjunto de datos un algoritmo basado en el clasificador Random Forest (RF) o Bosques Aleatorios, en este sentido, varios autores como [17] y [18] confirman que el clasificador Random Forest es una herramienta efectiva en los procesos de predicción con datos no estructurados como es el caso de los recolectados por redes de sensores IoT.

Este clasificador es considerado, además, como un método estadístico no paramétrico que permite abordar los problemas de regresión y clasificación de dos o más clases. Las recientes investigaciones de Scornet, E., et al., referenciadas a su vez por Genuer, R., et al., [17] demuestran la coherencia del método y sus parámetros de rendimiento. Breiman, L. [20] define Random Forest de la siguiente manera: “…un bosque aleatorio es un clasificador que consiste en una colección de clasificadores estructurados en árbol {h(x,.., Θk), k=1,…} donde {Θk} son vectores aleatorios independientes, distribuidos de forma idéntica y cada árbol arroja un voto unitario para la clase más popular de la entra x…”.

image

Figura 3. Resultado Naive Bayes.

La figura 4 muestra la implementación de un modelo de predicción utilizando Random Forest, en el que se dividió el conjunto de datos originales. Los valores que se generaron muestran una precisión del 72%, si se utiliza como variable categórica, la clasificación binaria como característica, evalúa la edad de los equipos con una predicción con tendencia a fallo (1), en los equipos con un rango de edad de 15 a 30 años. Con estos resultados, si utilizamos como métrica de comparación la precisión (accuracy), para este caso de estudio se obtienen resultados más exactos al utilizar el clasificador Naive Bayes.

Figura 4. Pseudocódigo Random Forest (Bosques aleatorios).

6. Conclusiones

El modelado e integración del gran volumen de datos industriales generados por las máquinas y recolectados por sensores, es un claro problema que requiere el desarrollo de futuras investigaciones. El modelo de mantenimiento predictivo que se presenta en este artículo está en una etapa incipiente, permitiendo el uso de otras técnicas para la extracción de patrones, en bancos de datos con un mayor volumen de medidas realizadas por sensores instalados en otros entornos industriales. La realización de pruebas utilizando varios métodos y técnicas de clasificación, entrenamiento y predicción, permitirán obtener las bases necesarias para efectuar un diseño de algoritmo que admita su implementación en un conjunto de datos heterogéneo, lo que es característico en organizaciones del contexto industria 4.0.

En las pruebas efectuadas, hasta el momento, el algoritmo Naive Bayes permitió, mediante un enfoque de entrenamiento supervisado, realizar la clasificación de datos y probabilísticamente generar las predicciones de valores con una precisión del 95% y Random Forest (bosques aleatorios) con un 72%. En trabajos futuros se efectuarán pruebas aplicando otras técnicas y métodos para la determinación de patrones como lo es el Filtro de Kalman, permitiendo realizar comparaciones sobre la eficiencia y confiabilidad de los algoritmos y empleando otras métricas de evaluación diferentes a la precisión. Además, se utilizarán bancos de datos industriales de mayor volumen que requieran para su procesamiento y análisis de plataformas con tecnología Big Data.

7. Agradecimiento

Sittón Candanedo dispone de una beca IFARHU- SENACYT del Gobierno de la República de Panamá.

8. Referencias

H. Kagerman, R. Anderl, J. Gausemeier, G. Schuh and W. Wahlster (2016). “Industrie 4.0 in a Global Context: Strategies for Cooperating with International Partners”, Acatech Study, Munich, Germany.

F. Civerchia, S. Bocchino, C. Salvadori, C., E. Rossi, L. Maggiani, L., and M. Petracca, (2017). Industrial Internet of Things Monitoring Solution for Advanced Predictive Maintenance Applications. Journal of Industrial Information Integration.

M. García-Valls (2016). Prototyping low-cost and flexible vehicle diagnostic systems. ADCAIJ: Advances in Distributed Computing and Artificial Intelligence Journal, Salamanca, v. 5,n. 4.

M. Bedworth, & J. O'Brien. (2000). The Omnibus model: a new model of data fusion? IEEE Aerospace and Electronic Systems Magazine, 15(4), 30-36.

Gobierno de España, Ministerio de Industria, Energía y Turismo, Santander y Telefónica (2015). “La Transformación Digital de la Industria Española. Informe Preliminar”.

M. Cruz, P. Oliete,, C. Morales, C. González, B. Cendón,, & A. Hernández (2015). "Las Tecnologías IoT dentro de la Industria Conectada 4.0". Gobierno de España, Ministerio de Industria, Energía y Turismo, Escuela de Organización Industrial (eoi). Libro digital en: http://a.eoi.es/industria4.

I. Ishaq, D. Carels, G. Teklemariam, J. Hoebeke, H. Van den Abeele, E. De Poorter, I. Moerman, I., and P. Demeester, (2013). "IETF standardization in the field of the internet of things (IoT): a survey," Journal of Sensor and Actuator Networks, vol. 2, pp. 235-87, June 2013.

S. Rodríguez, D. Tapia, E. Sanz, C. Zato, F. C. de la Prieta, & O. Gil. (2010). Cloud computing integrated into service-oriented multi-agent architecture. In Balanced Automation Systems for Future Manufacturing Networks (pp. 251-259). Springer, Berlin, Heidelberg.

K. Hoon, B. Kita, M. Goreti, K. Haengkon, Y. Hyun, C. Ramos (2014). A Study on the Key Management Strategy for Wireless Sensor Networks. ADCAIJ: Advances in Distributed Computing and Artificial Intelligence Journal, Salamanca, v. 3, n. 3

J. Bajo, J. De Paz J., G. Villarrubia, and J. Corchado, (2015). “Self-organizing architecture for information fusion in distributed sensor networks,” Int. J. Distrib. Sens. Networks, vol. 2015, pp.1-13

B. Al Momani, P. Morrow, S. McClean. (2011). “Fusion of Elevation Data into Satellite Image Classification Using Refined Production Rules. In Image Analysis and Recognition”. Springer: Berlin/Heidelberg, Germany; pp. 211–220.

M. Almasri, and K. Elleithy, (2014). “Data fusion models in WSNs: comparison and analysis”. In American Society for Engineering Education (ASEE Zone 1), 2014 Zone 1 Conference of the IEEE, pp 1-6.

C. Bishop, (2006). “Pattern recognition and machine learning”. Springer.

B. Siciliano, (2008). “Handbook of Robotic”. Springer.

Hortonworks, (2017). “Analyze HVAC Machine and sensor data”. https://es.hortonworks.com/hadoop-tutorial/how-to- analyze-machine-and-sensor-data/#section-2.

S. Marsland, (2015). Machine learning: an algorithmic perspective. CRC press.

R. Genuer, J. Poggi, C. Tuleau-Malot & N. Villa-Vialaneix, (2017). Random forests for big data. Big Data Research, 9, 28- 46.

S. Janitza, G. Tutz, & A. Boulesteix, (2016). Random forest for ordinal responses: prediction and variable selection. Computational Statistics & Data Analysis, 96, 57-73.

E. Scornet, G. Biau, PJ. Vert, (2015) “Consistency of random forests”. In: The Annals of Statis tics, Vol., 43(4), 1716-1741.

L. Breiman, (2001) “Random Forests”. In: Machine Learning, Vol 45, 1, pp. 5-32.

S. Marsland, (2015). Machine learning: an algorithmic perspective. CRC press.

Ministerio de Industria, Economía y Competitividad (s.f.). (2015). Plataformas Tecnológicas. Disponible en: http://www.idi.mineco.gob.es/portal/site/MICINN/menuitem.6f 2062042f6a5bc43b3f6810d14041a0/?vgnextoid=844cb292d3ff 4410VgnVCM1000001d04140aRCRD

F. Ballesteros. (2017). “La Estrategia Predictiva en el mantenimiento industrial”. Predictécnico (23), pp. 36-45. Grupo Álava, España.