Comparativa de modelos supervisados para la predicción del consumo de energia eléctrica
Laburpena
En el presente proyecto se analizarán, procesarán y correlacionarán datos climatológicos, meteorológicos y de consumo energético, con el objetivo de intentar predecir consumos energéticos a partir de las previsiones meteorológicas.
Se estudiarán de manera exhaustiva los conceptos fundamentales de estadística y de Machine Learning. La metodología utilizada está basada en el lenguaje R y se hará uso de librerías de código abierto para técnicas de minería de datos y Aprendizaje Automático supervisado (predictivo), el cual predice un valor desconocido, que en este caso será la energía eléctrica que se estima consumir, a partir de un conjunto de datos conocidos previamente. También se usarán técnicas para manejar y formatear los datos que se obtengan de repositorios de datos abiertos (Open Data).
Se realizará una comparativa entre 5 modelos basados en técnicas supervisadas de minería de datos, a partir de los resultados obtenidos de la predicción del consumo energético y comparando estos con datos reales de consumo. In the present project, climatological, meteorological and energy consumption data will be analyzed, processed and correlated in order to try to predict energy consumption based on weather forecasts. The fundamental concepts of statistics and Machine Learning will be studied exhaustively. The methodology used is based on the R language and will use open source libraries for data mining techniques and supervised (predictive) automatic
learning, which predicts an unknown value that in this case will be the electrical energyconsumed, based on a set of previously known data. Techniques will also be used to manage and format the data obtained from open data repositories (Open Data).
A comparison will be made between 5 models based on supervised data mining techniques based on the results obtained from the prediction of energy consumption and comparing these with real consumption data. Proiektu honetan, klimatologiaren, meteorologiaren eta
energia-kontsumoaren datuak aztertu, prozesatu eta korrelazionatuko dira, datu klimatologikoen aurreikuspenen arabera energia-kontsumoa aurreikusteko. Estatistika eta
Machine Learning-aren oinarrizko kontzeptuak aztertuko dira.
Erabilitako metodologia R hizkuntzan oinarritzen da eta kode ire
kiko liburutegiak erabiliko dira datu-meatzaritzako tekniketarako eta aurreikusitako ikasketa automatikorako, balio ezezagun bat aurreikusten duena, kasu honetan energia elektrikoaren kontsumoa izango baita. datu ezagunen multzo batetik. Teknikak ere
erabiliko dira datu irekiko datu biltegietatik (Open Data) lortutako datuak kudeatzeko eta formateatzeko. Datuen meatzaritzako gainbegiratutako tekniketan oinarritutako 5 ereduen arteko
konparaketa egingo da, kontsumo energetikoaren aurreikuspenetik lortutako emaitzetan oinarrituta eta kontsumo errealeko datuekin alderatuz.