Повышение точности прогноза электропотребления промышленного предприятия методами машинного обучения с помощью отбора значимых признаков из временного ряда
https://doi.org/10.21285/1814-3520-2022-3-487-498
Аннотация
Цель – повышение точности прогнозирования электропотребления предприятия за счет анализа и предварительной обработки входных данных, а также оценка влияния выбора признаков на результаты различных моделей прогнозирования. В качестве объекта, для которого составляется прогноз, было выбрано деревообрабатывающее предприятие Нижнего Новгорода. В работе сравниваются два типа методов машинного обучения: нейросетевые и ансамблевые модели. Рассмотрен один из способов выделения наиболее значимых параметров (признаков) временного ряда для улучшения результата следующих ансамблевых моделей на базе деревьев решений: адаптивный бустинг (AdaBoost), градиентный бустинг (Gradient Boosting) и случайный лес (Random Forest). Определение наиболее важных признаков исходного временного ряда осуществлено с помощью расчета коэффициентов корреляции между электропотреблением в прогнозируемый час и в предшествующие часы. Установлено, что в рассматриваемом объекте для построения прогноза наиболее важными признаками являются значения потребляемой энергии в те часы, которые отстают от прогнозируемого часа на кратное число суток. В качестве дополнительного признака используется график планово-профилактических работ деревообрабатывающих станков. Результаты показали, что при выборе правильной методики отбора признаков ансамбли деревьев решений способны превосходить искусственные нейронные сети по результатам: наименьшая средняя ошибка нейросетевой модели на тестовой выборке составляет 7,0%, в то время как для одной ансамблевой модели (градиентного бустинга) получено значение ошибки в 5,5%. Показано, что использование графика ремонтных работ также повышает точность прогноза: для рассмотренных ансамблевых моделей снижение ошибки составило от 20 до 30%.
Ключевые слова
Об авторах
Н. Н. СергеевРоссия
Сергеев Никита Николаевич, лаборант межкафедральной Научно-исследовательской лаборатории обработки, анализа и представления данных в электроэнергетических системах
630073, г. Новосибирск, пр-т К. Маркса, 20, Россия
П. В. Матренин
Россия
Матренин Павел Викторович, кандидат технических наук, старший научный сотрудник межкафедральной Научно-исследовательской лаборатории обработки, анализа и представления данных в электроэнергетических системах
630073, г. Новосибирск, пр-т К. Маркса, 20, Россия
Список литературы
1. Lozinskaia A., Redkina A., Shenkman E. Electricity consumption forecasting for integrated power system with seasonal patterns // Applied Econometrics. 2020. Vol. 60. Р. 5–25. https://doi.org/10.22394/1993-7601-2020-60-5-25.
2. Филиппова Т. А., Русина А. Г., Дронова Ю. В. Модели и методы прогнозирования электроэнергии и мощности при управлении режимами электроэнергетических систем: монография. Новосибирск: Изд-во НГТУ, 2009. 368 с.
3. Hernandez L., Baladron C., Aguiar J. M., Carro B., Sanchez-Esguevillas A. J., Lloret J., et al. A survey on electric power demand forecasting: future trends in smart grids, microgrids and smart buildings // IEEE Communications Surveys & Tutorials. 2014. Vol. 16. Iss. 3. P. 1460–1495. https://doi.org/10.1109/SURV.2014.032014.00094.
4. Deb Chirag, Zhang Fan, Yang Junjing, Lee Siew Eang, Shah Kwok Wei. A review on time series forecasting tech- niques for building energy consumption // Renewable and Sustainable Energy Reviews. 2017. Vol. 74. P. 902–924. https://doi.org/10.1016/j.rser.2017.02.085.
5. Hahn Heiko, Meyer-Nieberg Silja, Pickl Stefan. Electric load forecasting methods: tools for decision making // European Journal of Operational Research. 2009. Vol. 199. Iss. 3. P. 902–907. https://doi.org/10.1016/j.ejor.2009.01.062.
6. Cai M., Pipattanasomporn M., Rahman S. Day-ahead building-level load forecasts using deep learning vs. traditional time-series techniques // Applied Energy. 2019. Vol. 236. P. 1078–1088. https://doi.org/10.1016/j.apenergy.2018.12.042.
7. Qiu Xueheng, Zhang Le, Ren Ye, Suganthan P. N., Amaratunga G. Ensemble deep learning for regression and time series forecasting // IEEE Symposium on Computational Intelligence in Ensemble Learning. 2014. https://doi.org/10.1109/CIEL.2014.7015739.
8. Поляхов Н. Д., Приходько И. А., Ван Ефэн. Прогнозирование электропотребления на основе метода опорных векторов // Известия Санкт-Петербургского государственного электротехнического университета. 2014. № 10. С. 26–30.
9. Yildiz B., Bilbao J. I., Sproul A. B. A review and analysis of regression and machine learning models on commercial building electricity load forecasting // Renewable and Sustainable Energy Reviews. 2017. Vol. 73. P. 1104–1122. https://doi.org/10.1016/j.rser.2017.02.023.
10. Yang Jingfei, Stenzel J. Short-term load forecasting with increment regression tree // Electric Power Systems Research. 2006. Vol. 76. Iss. 9-10. P. 880–888. https://doi.org/10.1016/j.epsr.2005.11.007.
11. Matrenin P., Safaraliev M., Dmitriev S., Kokin S., Ghulomzoda A., Mitrofanov S. Medium-term load forecasting in isolated power systems based on ensemble machine learning models // Energy Reports. 2022. Vol. 8. P. 612–618. https://doi.org/10.1016/j.egyr.2021.11.175.
12. Matrenin P., Antonenkov D., Manusov V. Recurrent and ensemble models for short-term load forecasting of coal mining companies // Ural-Siberian Smart Energy Conference. 2021. https://doi.org/10.1109/USSEC53120.2021.9655732.
13. Neupane B., Perera K. S., Aung Zeyar, Woon Wei Lee. Artificial neural network-based electricity price forecasting for smart grid deployment // IEEE International Conference on Computer Systems and Industrial Informatics. 2012. https://doi.org/10.1109/ICCSII.2012.6454392.
14. Amarasinghe K., Marino D. L., Manic M. Deep neural networks for energy load forecasting // IEEE 26th International Symposium on Industrial Electronics (Edinburgh, 19–21 June 2017). Edinburgh: IEEE, 2017. P. 1483–1488. https://doi.org/10.1109/ISIE.2017.8001465.
15. Jie Cai, Jiawei Luo, Shulin Wang, Sheng Yang. Feature selection in machine learning: a new perspective // Neurocomputing. 2018. Vol. 300. P. 70–79. https://doi.org/10.1016/j.neucom.2017.11.077.
16. Koprinska I., Rana M., Agelidis V. G. Correlation and instance based feature selection for electricity load forecasting // Knowledge-Based Systems. 2015. Vol. 82. P. 29–40. https://doi.org/10.1016/j.knosys.2015.02.017.
17. Bouktif S., Fiaz A., Ouni A., Serhani M. A. Optimal deep learning LSTM model for electric load forecasting using feature selection and genetic algorithm: comparison with machine learning approaches // Energies. 2018. Vol. 11. Iss. 7. P. 1636. https://doi.org/https://doi.org/10.3390/en11071636.
18. Huber P. J. Robust estimation of a location parameter // The Annals of Mathematical Statistics. 1964. Vol. 35. Iss. 1. P. 73–101. https://doi.org/10.1214/aoms/1177703732.
19. Pedregosa F., Varoquaux G., Gramfort A., Michel V., Thirion B., Grisel O., et al. Scikit-learn: machine learning in Python // Journal of Machine Learning Research. 2011. Vol. 12. Iss. 85. P. 2825–2830.
20. Ramachandran P., Zoph B., Le Quoc V. Searching for activation functions. 2017. https://doi.org/10.48550/arXiv.1710.05941.
21. Hoffer E., Hubara I., Soudry D. Train longer, generalize better: closing the generalization gap in large batch training of neural networks. 2017. https://doi.org/10.48550/arXiv.1705.08741. https://doi.org/10.48550/arXiv.1705.08741.
22. Khirirat S., Feyzmahdavian H. R., Johansson M. Minibatch gradient descent: faster convergence under data sparsity // IEEE 56th Annual Conference on Decision and Control (Melbourne, 12–15 December 2017). Melbourne: IEEE, 2017. P. 2880–2887. https://doi.org/10.1109/CDC.2017.8264077.
23. Linjordet T., Balog K. Impact of training dataset size on neural answer selection models // Advances in Information Retrieval. Lecture Notes in Computer Science / eds. L. Azzopardi, B. Stein, N. Fuhr, P. Mayr, C. Hauff, D. Hiemstra. Vol. 11437. Cham: Springer, 2019. P. 828–835. https://doi.org/10.1007/978-3-030-15712-8_59.
Рецензия
Для цитирования:
Сергеев Н.Н., Матренин П.В. Повышение точности прогноза электропотребления промышленного предприятия методами машинного обучения с помощью отбора значимых признаков из временного ряда. iPolytech Journal. 2022;26(3):487-498. https://doi.org/10.21285/1814-3520-2022-3-487-498
For citation:
Sergeev N.N., Matrenin P.V. Increasing the accuracy of forecasting the electricity consumption of an industrial enterprise by machine learning methods using the selection of significant features from a time series. iPolytech Journal. 2022;26(3):487-498. (In Russ.) https://doi.org/10.21285/1814-3520-2022-3-487-498