Análisis de Consumo de Energía Eléctrica Usando Análisis de Componentes Independientes
Carlos Boya
Facultad de Ingeniería Universidad Latina de Panamá
David, Panamá
[email protected]
Resumen-Este documento presenta un método para el análisis de la serie de tiempo de consumo eléctrico utilizando Análisis de Componentes Independientes (ICA). Con este método es posible detectar y extraer de manera automática factores que influyen separadamente en el consumo eléctrico, así como estudiar su relación en la curva de consumo diario con ayuda de perfiles estimados paralelamente con ICA. ICA logra aislar estos comportamientos en un grupo de componentes sin perder representatividad de los datos ofreciendo una visión más profunda del consumo eléctrico con el objetivo de facilitar su modelado y pronóstico.
Palabras claves- Análisis de componentes independientes, análisis de series de tiempo, consumo de energía eléctrica.
Abstract- This paper presents a method for time series analysis of electricity consumption using independent component analysis (ICA). With this method it is possible to automatically detect and extract factors influencing separately in electricity consumption and study their relationship in daily consumption curve using profiles parallel estimated by ICA. ICA separates these behaviors in a group of components without losing data representativeness giving a deeper insight of electricity consumption in order to facilitate modeling and forecasting.
Keywords— Independent component analysis, time series analysis, electricity consumption.
Tipo de Articulo: original
Fecha de Recepción: 15 de septiembre de 2014
Fecha de Aceptación: 23 de noviembre de 2014
Introducción
En conocimiento profundo sobre el comportamiento del consumo eléctrico de una región es de gran importancia para el manejo apropiado del sistema eléctrico, siendo su principal motivación la creación de modelos de predicción que ayuden a cuantificar y planear futuros requerimientos de energía. Otra razón importante es el control y manejo de varios escenarios futuros enfocados en aspectos técnicos, demográficos, sociales y económicos [1]. Las empresas eléctricas de generación, transmisión y distribución requieren estos modelos con el fin de prever futuras necesidades técnicas y económicas, valorar las mejores estrategias de precios y desarrollar planes de expansión.
Dependiendo del período de tiempo, los modelos son desarrollados para estudiar a corto, medio y largo plazo la evolución del consumo utilizando modelos de predicción tradicionales como series de tiempo, regresión lineal, modelos econométricos y filtros ARIMA (siglas en inglés de Autoregressive Integrated Moving Average). Adicionalmente nuevos enfoques como sistemas expertos, redes neuronales, Fuzzy logic, máquinas de vector soporte entre otros, han ampliado el alcance del análisis y la oportunidad de tratar con aspectos más complejos del consumo eléctrico [2].
En los modelos de predicción se utilizan datos históricos de consumo para su desarrollo y evaluación, además de incluir variables exógenas de tipo ambiental (temperatura, humedad) y econométricas (crecimiento económico y poblacional). Éstas últimas, normalmente tienen influencia a medio y largo plazo (desde un mes en adelante) [3]. Los datos son medidos desde períodos tan cortos como minutos hasta anuales por lo que todas estas variables influyen de diferentes maneras al consumo dando complejidad y limitando el análisis previo al modelo de pronóstico.
Una serie de tiempo del consumo eléctrico puede ser dividida en varios componentes: la tendencia, que puede representar el crecimiento o desaceleración del consumo; los ciclos que representan cambios semanales; variaciones estacionales, como patrones periódicos que se repite año tras año, relacionados a las estaciones; y fluctuaciones irregulares, como un componente no estacionario el cual es difícil de explicar o modelar. Este último componente está relacionado a los días festivos o situaciones anómalas a lo largo del año. Todos estos componentes son patrones que provee información útil a un futuro sistema de predicción [4,5]. Para realizar la descomposición de la serie se asumen relaciones lineales o no lineales entre estos factores y se aplican filtros ARMA, ARMAX, Exponentially weighted methods [6,7], sin embargo esta operación es empírica, dependiente de los datos y con una operación de ensayo y error hasta obtener un modelo óptimo.
El objetivo de este documento es proponer un método automático de análisis enfocado en la descomposición de la serie de consumo en “factores fundamentales” utilizando la técnica de Análisis de componentes independientes o ICA (Siglas en inglés de Independent Component Analysis). Esta descomposición es guiada por la idea de independencia entre los factores, los cuales subyacen en la serie escondidos por un proceso de mezclado. En este trabajo se asume que estos factores están mezclados de manera lineal y que es posible aislarlos asumiendo independencia estadísticas entre ellos. En los siguientes trabajos [8- 11] se ha propuesto ICA para separar componentes desde series de tiempo en finanzas. En este trabajo aplicamos esta técnica al consumo eléctrico y reportamos la obtención de componentes relevantes y asociados a comportamientos de corto, medio y largo plazo del consumo.
La organización del trabajo es la siguiente: en la Sección II se explica el modelo de separación de ICA, la Sección III muestra cómo trabaja ICA con series de tiempo; en la sección 4 se realiza un análisis de datos de consumo eléctrico de la Republica de Panamá utilizando el método propuesto. Finalmente en la sección V se encuentran las conclusiones del trabajo.
2. Análisis de componentes independientes
Análisis de componentes independientes es una técnica enfocada en el problema de separación ciega de fuentes o BSS (Blind Source Separation) que busca recuperar un conjunto de señales que han sufrido un proceso de mezclado con información sólo disponible en las mezclas.
La técnica ICA fue propuesta por P. Comon en 1994 [12] y ha sido utilizada en numerosos campos de ingeniería y ciencia. En las referencias [13-19] se enumeran algunas aplicaciones de ICA en biomédica, acústica, sistemas eléctricos, telecomunicaciones, procesamiento de imágenes, aplicaciones industriales, ambiente y finanzas.
En ICA las señales que sufren el proceso de mezclado son conocidas como fuentes originales. El proceso de mezclado es asumido lineal como se muestra en:
(1)
Donde xi (t) son M mezclas, i=1,2,…M, si (t) son N fuentes originales, j=1,2,…N, aij son los coeficientes de mezclado y t es el índice de tiempo. La ecuación (1) puede ser escrita en forma matricial
x(t) = As(t) (2)
donde x(t) = [x1(t),x2(t),… xM (t) ]T son las M mezclas formadas por las N fuentes originales s(t)=[s1 (t), s2 (t),… sN(t) ]T y A es la matriz de mezclado de tamaño MxN formada por los coeficientes de aij mezclado. En este sistema lineal, tanto s(t) como A son desconocidos y sólo se tiene acceso a las mezclas x(t). En ICA para recuperar las fuentes bajo estas limitaciones se asume que hay igual cantidad de fuentes y mezclas (M=N); que las fuentes son independientes entre sí y que como máximo sólo una de las fuentes debe presentar distribución gaussiana. Siguiendo estas asunciones se utiliza el siguiente modelo para recuperar las fuentes
y(t) = Wx(t) (3)
donde y(t) = [y1(t),y2 (t),… yN(t) ] son las fuentes originales estimadas, llamados componentes independientes (IC), W una matriz de demezclado de tamaño NxM que en el caso de perfecta recuperación equivale a W=A-1.
El objetivo de ICA es adaptar los parámetros de la matriz W por medio de un criterio que mida la independencia estadística entre las salidas y(t). En este trabajo hemos utilizado el algoritmo FastICA [20] el cual aplica un criterio de no gaussianidad para la búsqueda de independencia. Este algoritmo fue desarrollado en el Laboratorio de Información y ciencias computacionales de la Universidad de Helsinki, por H. Gvert, J. Hurri, J. Srel y A. Hyvarinen; es de código abierto y accesible a través de la página web [21]. Además de FastICA existen una gran cantidad de algoritmos, como JADE, INFOMAX, EASI, etc, diferenciados por la manera en la cual tratan la búsqueda de la independencia estadística en los datos [22].
3. Series de tiempo con ICA
El consumo eléctrico está acomodado como una serie de tiempo unidimensional u(k), donde k es el índice horario en la serie. De esta manera, sólo tenemos acceso directo a una mezcla. ICA requiere tener igual cantidad de fuentes y mezclas, por lo cual, si estamos buscando varios factores integrados en la serie de consumo es importante tener más mezclas. Para resolver este problema la serie de tiempo u(k) es divida en 24 nuevas series de tiempo, una para cada hora del día. Es decir, 24 sensores que miden el consumo por hora a lo largo de los días. Similares enfoques han sido propuestos en los trabajos [23-24]. Así, la serie histórica de consumo de energía eléctrica por hora u(k) es dividida en 24 variables y agrupadas en un vector x(t)=[x1(t),…,xM (t)]T donde M=24 y t es el índice de cada día. Cada serie tendrá un largo de D días a considerar en el análisis. Posteriormente se utilizan estas 24 series como entrada al algoritmo FastICA y se estiman las matrices W and A, y los componentes independientes y(t).
Es importante anotar que el vector x(t) puede ser reconstruido utilizando la matriz A y los componentes independientes y(t) usando (1) y posteriormente rearmar la serie de consumo u(k). Esta reconstrucción puede ser realizada descartando algunos IC y de esa manera ofreciendo la posibilidad de analizar el consumo sin estos factores.
4. Análisis de los datos
A continuación se utilizará ICA para realizar un análisis de los datos de consumo del sistema eléctrico nacional de la República de Panamá. En este estudio se ha utilizado datos ofrecidos por el Centro Nacional de Despacho de la Empresa de Transmisión Eléctrica, S.A. (ETESA) accesibles en los informes estadísticos en su página web [25]. Los datos utilizados cubren un período de 7 años desde enero del 2006 hasta diciembre de 2012 (2557 días) y están arreglados de manera horaria.
Tabla 1. Consumo eléctrico nacional total por año y cambio porcentual.
Año | Consumo total anual (GWh) | Cambio porcentual (%) |
2006 | 5582 | - |
2007 | 5957 | 6.7 |
2008 | 6057 | 1.7 |
2009 | 6478 | 6.9 |
2010 | 6913 | 6.7 |
2011 | 7324 | 5.9 |
2012 | 7996 | 9.2 |
Antes de aplicar ICA introducimos un análisis estadístico básico que sirve como referencia a nuestro estudio. En la Tabla 1 se presentan el consumo total por año y el respectivo cambio porcentual, el cual muestra un crecimiento sostenido cercano al 7% anual a excepción del año 2008 y 2012. En el 2008 la crisis económica mundial in3uyó notablemente en el país, disminuyendo el crecimiento en el consumo, caso contrario en el 2012, donde la construcción de grandes obras de infraestructura civil como la ampliación del Canal, el Metro, etc., incrementaron el consumo.
En la Figura 1 se ha graficado toda la serie de datos por hora (en gris) aunque como guía sólo se han colocado los años en vez de las horas en el eje ‘x’. Aquí es posible observar un crecimiento del consumo con variaciones estacionales anuales; también es posible observar la tendencia (en rojo), la cual muestra más claramente el crecimiento en el consumo. Esta conducta es conocida como comportamiento a largo plazo en el consumo. En la Figura 2 se puede observar el consumo en un menor plazo desde enero a febrero de 2006. Este revela la presencia de ciclos diarios y semanales, los cuales están perturbados por días festivos como el 9 de enero alrededor de las horas 192 y 216 o carnavales a partir de la hora 1380.
Figura 1. Consumo por hora desde Enero de 2006 hasta Diciembre de 2012 (en gris). En rojo la tendencia media de este consumo.
Figura 2. Gráfica de consumo por hora para los meses de Enero y Febrero de 2006.
Estos análisis básicos pueden ofrecer una perspectiva general del comportamiento del consumo eléctrico, sin embargo no ofrecen un detalle muy claro sobre los ciclos estacionales además de contener una gran cantidad de ruido debido a repentinas subidas o bajadas en el consumo, días festivos u otras situaciones anómalas. El método propuesto utilizando ICA nos aportará información más representativa y estructurada a este análisis.
La serie de consumo u(k) está compuesta por 61368 horas que corresponde al total de horas de los 2557 días. Siguiendo el procedimiento propuesto en la sección III, la serie u(k) es dividida en 24 series xi(t) , donde i=1,2,…,24 y con t=1,2,…,2557 formando x (t). En la gráfica (a) de la Figura 3 se muestra una curva típica de consumo diario. Cada hora en esta gráfica es representada por una variable xi (t) por lo que tenemos 24 en total. Estas variables sufren cambios a través de los días como se puede observar en la gráfica (b) de la Figura 3 donde se muestra un perfil tridimensional de consumo diario total a lo largo de los 2557 días. En esta última gráfica es posible apreciar la variabilidad del consumo por hora a través de los días, además de la correlación entre varios grupos de horas. Las primeras horas del día cambian poco y muestran valores bajos de demanda a diferencia de las horas picos (de 10 a 14) con más variación y valores máximos de demanda. Otro grupo de horas que varían en conjunto corresponde al intervalo desde la hora 16 a las 21. Con ICA es posible extraer variables representativas de estos grupos de señales como veremos a continuación. Utilizando x(t) como entrada al algoritmo FastICA son estimados 24 componentes independientes arreglados en y(t) además de las matrices de W y A . En este trabajo el algoritmo fue operado con sus parámetros por defecto.
Debido a la cantidad de componentes independientes (IC) a analizar y al limitado espacio sólo mostraremos algunos IC para dar una visión general del método de análisis propuesto. De los componentes estimados existen un grupo que presentan sólo unos pocos picos máximos. En la Figura 4 son mostrados dos de estos IC. El primer IC (Figura 4(a)) contiene un pico el día 63 o sábado 4 de Marzo de 2006. Este valor coincide con una bajada en el consumo a las 8 de la noche de esa fecha. Aquí ICA ha colocado en este IC información sólo representativa de este repentino cambio en el consumo. El segundo IC (Figura 4(b)) contiene dos picos máximos importantes. Uno el día 736 o domingo 6 de enero de 2008 y el otro el día 816 o miércoles 26 de marzo de ese mismo año. Para las dos fechas hay una bajada en el consumo a las 12 P.M. De esta manera, ICA ha agrupado en este IC este patrón de bajadas de energía respecto a la hora 12 P.M. En la figura 5 se muestran otros cuatro IC pero con patrones más estructurados. En la Figura 5(a) se muestra un IC con un ciclo semanal con valores aproximadamente constantes los primeros cinco días de la semana, un máximo el sábado y un mínimo el domingo. Este IC ha recogido un patrón representativo de los fines de semana. Sin embargo el segundo IC (Figura 5(b)) muestra también un ciclo semanal con un valor máximo constante para los primeros cinco días de la semana (días laborables) y un valor mínimo para el sábado y domingo. Nótese que en las gráficas de estos dos IC sólo consideramos 500 días ya que así es posible observar su comportamiento a corto plazo. Los siguientes IC presentan un comportamiento a medio y largo plazo por los que son considerados en un intervalo de 2000 días. El IC mostrado en la Figura 5(c) presenta variaciones anuales estacionales con valor máximo constante entre el mes de febrero hasta el mes de agosto y mínimo de los meses de octubre a noviembre.
El último IC (Figura 5(d)) es la tendencia de crecimiento del consumo con variaciones que contiene máximos a principio de cada año. Así, ICA ha agrupado en estos 4 IC variaciones comunes a todos los días considerados en la serie de consumo.
Figura 3. (a) Curva típica de consumo diario. Cada hora representa una variable. (b) Un perfil del consumo diario desde enero de 2006 a diciembre de 2012.
Figura 4. Eje de amplitud en unidades arbitrarias (U.A.), En las gráficas (a) y (b) se presentan dos IC extraídos desde los datos por ICA con máximos bien pronunciando sobre el valor medio cero.
Figura 5. Eje de amplitud en unidades arbitrarias (U.A.), (a) IC con comportamiento cíclico semanal (los fines de semana). (b) IC de ciclo semanal (días de la semana). (c) IC con variaciones anuales estacionales. (d) IC con un patrón de tendencia de crecimiento promedio.
Además de la información contenida en los componentes independientes, perfiles de consumo interdiarios o curvas típicas relacionadas a cada IC pueden ser observadas en los coe2cientes de mezclado de la matriz "A" . Estos perfiles están contenidos en los vectores columnas de "A" y corresponden a cada IC en concreto. Ejemplo: El vector columna "a" _1 corresponde al primer IC extraído por ICA, el "a" _2 al segundo y así sucesivamente. En la Figura 6 mostramos los perfiles correspondientes a los IC de las gráficas 5(b) y 5(d), respectivamente. Como hemos visto anteriormente, estos IC brindan información sobre el consumo semanal en días laborables y la tendencia de crecimiento del consumo a lo largo de la serie, respectivamente. El IC semanal muestra un perfil por hora (Figura 6(a)) con valores picos desde las 9 a las 16 horas, concerniente a las horas de mayor actividad diaria. El siguiente perfil (Figura 6(b)) correspondiente al IC de tendencia esta relacionado con los valores promedio del consumo. Observando la Figuras 1 donde se muestra la tendencia promedio del consumo para los siete años y Figura 3(b) donde se muestra la curva promedio diaria total, se puede apreciar cierta similitud entre el patrón mostrado por el IC de tendencia y su perfil, respectivamente. De esta manera, ICA ha captado en este IC y su correspondiente perfil los comportamientos promedio en el consumo tanto a largo plazo como a corto plazo (horas), respectivamente.
5. Conclusiones
En este trabajo hemos presentado un método para el análisis y estudio de la serie de tiempo de consumo eléctrico de una región basado en la descomposición de factores o componentes fundamentales de la serie utilizando la técnica de Análisis de Componentes independientes. Esta descomposición es automática y agrupa en cada componente la información mutua que está contenida de manera correlacionada en la serie.
Utilizando datos de consumo eléctrico de la República de Panamá hemos mostrado el funcionamiento del método. Se ha logrado extraer componentes que ofrecen patrones distinguibles y claros sobre el consumo como: tendencias promedio de crecimiento anual, variaciones relacionadas con algunos meses del año; dos ciclos semanales, uno relacionado a los días laborables de la semana y otro a los fines de semana. También se han detectado bajadas repentinas de la demanda relacionadas a ciertas horas del día. Por otro lado, se ha mostrado información sobre los perfiles extraídos desde los coe2cientes de mezclado. Estos perfiles explican la manera de cómo cada IC actúa por hora en la curva de consumo diario.
En trabajos futuros se propone reconstruir la serie descartando algunos IC para luego simular pronósticos y estudiar el impacto de este descarte. También, se plantea estudiar la relación de estos IC con variables exógenas ambientales, económicas y sociales.
Figura 6. Eje de amplitud en unidades arbitrarias (U.A.). perfiles diarios desde la matriz de mezclado A. (a) perfil del IC de ciclo semanal. (b) perfil del IC de la tendencia promedio de crecimiento.
6. Agradecimiento
Agradecemos a la Secretaría Nacional de Ciencia, Tecnología e Innovación (SENACYT) y al Instituto de Formación y Aprovechamiento de los Recursos Humanos (IFARHU) por su soporte financiero, además a la Universidad Latina de Panamá (Sede David) por su apoyo logístico.
Referencias Bibliográficas
[1] R. Sanchez, X. Guillaud, G. Dauphin-Tanguy, “Hybrid electrical power system modeling and management”, Simulation Modelling Practice and Theory, Vol. 25, pp. 190–205, Jun. 2012.
[2] H. S. Hippert, C.E Pedreira, R.C. Souza, “Neural networks for short- term load forecasting: a review and evaluation”, I E E E Transaction on Power Systems, Vol. 16, no. 1, pp. 44-55, Feb. 2001.
[3] S.M Al-Alawi, S.M. Islam, “Principles of electricity demand forecasting Part1. Methodologies”, Power Engineering Journal,Vol. 10, no. 3, pp. 139-143, Jun. 1996
[4] B. L. Bowerman, R. T. O’Connell, A. B. Koehler, Pronósticos, Series de Tiempo y Regresión, Un Enfoque Aplicado, Cengage Learning Editores , 2009.
[5] P. J. Brockwell, R. A. Davis, Introduction to Series and Forecasting, Springer-Verlag, New York, USA, 2002.
[6] S.S. Papas, L. Ekomomou, D.Ch. Karamousantas, G.E. Chatzarakis, S.K. Katsikas, P. Liatsis, "Electricity demand loads modeling using AutoRegressive Moving Average (ARMA) models", Energy, Vol. 33, no. 9, pp. 1353-1360, Sept. 2008.
[7] J.W. Taylor, "Short-term load forecasting with exponentially Weighted methods ", IEEE transactions on Power Systems, Vol. 27, no. 1, pp. 458-640, Feb. 2012.
[8] A.D. Back, A.S. Weigend, “A 2rst application of independent component analysis to extracting structure from stock returns”, International journal of neural systems, Vol. 8, no. 4, pp. 473-484, Aug. 1997.
[9] K. Kivilouto, E. Oja, “Independent component analysis for parallel 2nancial time series”, In Proc. Int. Conf. on Neural Information Processing (ICONIP’98), Tokyo, Japan, October, 1998.
[10] S. Malaroiu, K. Kivilouto and E. Oja, “Time series prediction with independent component analysis”, In Proc. Int. Conf. on Advanced Investment Technology, Gold Coast, Autralia, October, 1998.
[11] E. Oja, et al., “Independent component analysis for 2nancial time series”, Adaptive Systems for Signal Processing, Communications, and Control Symposium 2000, Alberta, Canada, 4 Oct. 2000.
[12] P. Comon, “Independent component analysis, A new concept?”, Signal processing, Vol. 36, no. 3, pp. 287-314, April 1994.
[13] J. Escudero, et al., "Artifact Removal in Magnetoencephalogram Background Activity With Independent Component Analysis", IEEE Transactions on Biomedical Engineering, Vol. 54, no. 11, pp. 1965-1973, 2007.
[14] W. Nakamura, et al., "Removal of ballistocardiogram artifacts from simultaneously recorded EEG and fMRI data using independent component analysis", IEEE Transactions on Biomedical Engineering, Vol. 53, no. 7, pp. 1294-1308, 2006.
[15] P. Pertilä, "Online blind speech separation using multiple acoustic speaker tracking and time–frequency masking”, Computer Speech &Language, Vol. 27, pp. 683-702, May 2013.
[16] J. Gao, et al., "Independent component analysis for multiple- input multiple-output wireless communication systems", Signal Processing, Vol. 91, no. 4, pp. 607-623, April 2011.
[17] T. Ju, et al., "Blind Source Separation of Mixed PD Signals Produced by Multiple Insulation Defects in GIS," IEEE Transactions on Power Delivery, Vol. 25, no. 3, pp. 170-176, Jan. 2010.
[18] C.H. Chen, “The use of independent component analysis as a tool for data mining”, Geoscience and remote sensing symposium, Toronto, Canada, 24-28 June, 2002
[19] C. J. Lu, et. al., “Financial time series forecasting using independent component analysis and support vector regression”, Decision Support Systems, Vol. 47, no. 2, pp. 115- 125, May 2009.
[20] A. Hyvarinen, “Fast and Robust Fixed-Point Algorithms for Independent Component Analysis”, IEEE Transactions on Neural Networks, Vol. 10, no. 3, pp. 626-634, May 1999.
[21] ICA y BSS group, “The FastICA software package”, [online]: “http://research.ics.aalto.fi/ica/fastica/. Ultimo acceso: 23 de mayo de 2014.
[22] A. Hyvarinen, et. al., Independent component analysis: algorithms and applications, Wiley, New York, USA, 2001.
[23] M.A.A. Lima, A.S. Cerqueira, D.V. Coury, C.A. Duque, “A novel method for power quality multiple disturbance decomposition based on Independent Component Analysis”, International Journal of Electrical Power & Energy Systems, Vol. 42, no. 1, pp. 593-604, Nov. 2012.
[24] B. Mijovic, M.D. Vos, I. Gligorijevic, J. Taelman, S.V. Huffel, “Source Separation From Single-Channel Recordings by Combining Empirical-Mode Decomposition and Independent Component Analysis”, IEEE transactions on biomedical engineering, Vol. 57, no. 9, pp. 2188-2196, Sept. 2010.
[25] ETESA, “Comportamiento del sistema”, Centro de Nacional de despacho [online], Disponible: http://www.cnd.com.pa/ informes.php?cat=5, Accesado: 2 de Junio de 2014.