Une des séries macroscopiques de connaissances quantitatives: le modèle de prévision PPI basé sur l'apprentissage automatique

Principaux points de vue:

Le prix et l'inflation sont des éléments importants de l'analyse macroscopique. Cet article analyse les défauts et les difficultés des méthodes courantes de prévision de l'IPP, tente de déconstruire l'IPP et de modéliser la prévision basée sur l'apprentissage automatique.

Quelles sont les méthodes traditionnelles de prédiction de l'IPP et quels sont les points douloureux?

Il existe principalement trois types de prévisions PPI: la méthode de prévision des indices avancés, la méthode de réduction des indices à haute fréquence et la méthode de synthèse des prix des produits industriels.

La méthode de prévision de l'indice de plomb consiste à déterminer l'indice de plomb optimal et à effectuer une prévision de régression après avoir excavé l'indice de plomb qui est conforme à la loi de fonctionnement économique. Par exemple, l'indice des matières premières industrielles du crb est en avance de 2 à 3 mois sur l'IPP. En raison de la corrélation instable et de la période de plomb, la précision est souvent faible.

L'indice à haute fréquence est réduit de façon concise et efficace, et la corrélation entre l'indice des prix des moyens de production et l'IPP au comptant est de 0,98. La relation entre les variables indépendantes et dépendantes n'est pas claire, de sorte que le modèle d'optimisation ne peut pas être ajusté.

L'IPP est synthétisé à l'aide des prix des produits industriels. La relation logique est claire, la fiabilité et la capacité de débogage sont fortes. En théorie, l'effet d'ajustement est optimal parmi les trois types de prévision. Il y a deux difficultés dans les recherches précédentes: 1) Il existe de nombreux types de prix des moyens de production, le problème de co - linéarité du modèle traditionnel d'OLS linéaire est grave, la variance du modèle est grande et facile à ajuster, de sorte qu'un dépistage approprié des variables est nécessaire pour déterminer les principaux Facteurs moteurs de l'IPP; Le Bureau de statistique divulgue peu d'informations sur les pondérations partielles de l'IPP, de sorte qu'il est particulièrement important de comprendre les pondérations dans le processus statistique et les méthodes d'ajustement des pondérations.

II. Comment comprendre le poids et l'ajustement du poids de l'IPP?

Le poids partiel de l'industrie PPI est la proportion de la valeur de la production des ventes industrielles de l'industrie, qui est généralement remplacée par la proportion des revenus de l'industrie. Le Bureau de statistique calcule l'IPP actuel d'une année sur l'autre en fonction de la pondération de l'industrie pour la même période l'an dernier.

1) selon l'interprétation du Bureau de statistique, « la pondération de chaque bien et service dans l'IPC est fondée sur la part des dépenses de consommation de ce type de bien et de service dans les dépenses totales de l'ensemble du panier ». En 2019, la peste porcine africaine s'est propagée rapidement, les truies reproductrices et les porcs vivants dans tout le pays ont chuté, le prix du porc a atteint deux sommets en novembre 19 et février 20, tandis que le poids du porc a grimpé à 4,6% du Sommet en novembre 20, ce qui a retardé le prix du porc d'environ 12 mois à partir de la courbe historique. La compilation de l'IPP et de l'indice de l'IPC est conforme aux statistiques. La formule d'étirement de la chaîne est adoptée pour déduire raisonnablement que le Bureau de statistique utilise la proportion de la valeur de la production des ventes industrielles de la même période de l'année dernière (période t - 12) dans le calcul de l'IPP d'une année sur l'autre et le poids de la période précédente (période t - 1) dans le calcul de l'IPP d'une année sur l'autre.

L'IPP calculé sur la base de la pondération de la part des revenus de l'industrie dans la période t - 12 est le plus proche de la valeur réelle. Nous avons pondéré l'IPP de 39 sous - secteurs industriels d'une année sur l'autre en fonction de la proportion des revenus de chaque période. La corrélation entre les périodes t - 12, t - 11 et t - 10 et l'IPP réel d'une année sur l'autre était supérieure à 99,85%, mais l'écart moyen de la période t - 12 était le plus faible et l'effet était le meilleur.

Modèle de prévision PPI basé sur l'apprentissage automatique

Prétraitement des données: de janvier 2016 à décembre 2021, il s'agit de l'heure de début et de fin des données, et le ciment Portland ordinaire et le caoutchouc naturel avec des séries chronologiques trop courtes sont supprimés. En prenant la moyenne mensuelle des prix des moyens de production et en calculant la proportion d'une année sur l'autre, on obtient 48 variables caractéristiques.

Résoudre le problème de co - linéarité en filtrant les variables sur Lasso. Lasso ajoute un terme de pénalité au coefficient de régression de l'OLS pour obtenir la solution clairsemée du modèle (le coefficient partiel est nul). Après la segmentation de l'ensemble de données, 9 variables clés ont été extraites de 48 variables indépendantes par régression Lasso, les facteurs non significatifs ont été éliminés et 5 variables ont été conservées, y compris les tubes en acier sans soudure, le diesel, l'essence, la paraffine et l'anthracite. La force d'interprétation du modèle r ^ 2 était de 97,1%.

En ce qui concerne l'ajustement du poids, nous avons décalé la variable de 12 périodes pour tenir compte de l'influence de la fluctuation de la valeur de la production des ventes de moyens de production sur le poids annuel de l'année suivante. Après optimisation, la force d'interprétation du modèle est passée à 99,0%. L’hypothèse sous - jacente de cette alternative est que la fluctuation des prix des produits industriels peut représenter la variation de la valeur de vente des produits industriels, mais l’augmentation des prix des matières premières en amont a diminué pendant la réforme de l’offre, de sorte qu’il y a eu un certain écart entre les prévisions de l’ipp et la valeur réelle de l’ipp au début de 2017.

Le modèle prévoit que l'IPP en février sera de 9,1% d'une année sur l'autre.

Le 4 mars, le Bureau de statistique a publié les prix des moyens de production dans le domaine de la circulation à la fin de février. En février, les prix du charbon, du pétrole et des engrais ont augmenté le plus, ce qui signifie que les produits de base ont connu un nouveau cycle de hausse sous la crise russo - ukrainienne et que la pression inflationniste mondiale s'est intensifiée.

En février, 11,0%, 51,3%, 41,1%, 43,5%, 93,6%, 10,3% et - 9,5% respectivement pour les tubes en acier sans soudure, le diesel, l'essence, la paraffine, l'anthracite, le diesel et l'anthracite. Le modèle d'apprentissage de la machine basé sur la régression Lasso prévoit Un IPP de 9,1% en février.

Conseils sur les risques

Le conflit russo - ukrainien a entraîné des interférences et le modèle peut présenter un risque de défaillance.

- Advertisment -