Cet article examine comment les politiques réglementant les mouvements transfrontières et l’utilisation nationale des données électroniques sur Internet ont un impact sur la productivité des entreprises dans les secteurs qui dépendent des données électroniques. Ce faisant, nous collectons des informations réglementaires sur un groupe d’économies développées et créons un indice qui mesure le caractère restrictif de la réglementation des politiques de données de chaque pays. L’indice est basé sur des mesures politiques observables qui inhibent explicitement les mouvements transfrontaliers et l’utilisation domestique des données. En utilisant des données transnationales au niveau de l’entreprise et au niveau de l’industrie, nous analysons économétriquement dans quelle mesure ces réglementations des données au fil du temps ont un impact sur les performances de productivité des entreprises et des industries en aval respectivement. Nous montrons que des politiques de données plus strictes ont un impact négatif et significatif sur la performance des entreprises en aval dans les secteurs dépendants des données électroniques. Cet effet négatif est plus marqué pour les pays dotés de réseaux technologiques solides, pour les entreprises ayant des services et vaut pour plusieurs contrôles de robustesse.
Auteur correspondant: erik.vandermarel @, économiste senior à ECIPE & Université Libre de Bruxelles (ULB) et ECARES, Avenue des Arts 40, 1000, Bruxelles; Martina Francesca Ferracane, martina.ferracane @, candidate au doctorat à l’Université de Hambourg, chargée de politique à l’Institut universitaire européen (EUI) et associée de recherche à l’ECIPE; Janez Kren, @, doctorant à l’Université de Louvain. Nous remercions Giorgio Garbasso, Nicolas Botton, Valentin Moreau, Cristina Rujan pour leur excellente aide à la recherche. Nous tenons également à remercier Stela Rubinova, Julian Nyarko, Sébastien Miroudot, Ben Shepherd et Hosuk Lee-Makiyama ainsi que les participants de la 5e conférence PEPA / SIEL à l’Université de Tilburg, la 34e conférence annuelle de l’Association européenne de droit et Economie (EALE), la Conférence PEP Digital Information Policy Scholars à l’Université George Mason, et la Conférence sur le développement dirigé par les services à l’ADBI à Tokyo pour leurs commentaires utiles sur les versions précédentes.
1. Introduction
Entre 2000 et 2015, le trafic mondial de données sur Internet a été multiplié par 863, ce qui représente un taux de croissance annuel composé de 62,1% (figure 1). Pour de nombreuses entreprises, l’utilisation accrue des données est devenue un élément essentiel des processus de production dans l’ère numérique actuelle, dans le but d’augmenter leurs performances économiques. Dans le même temps, de nombreux gouvernements ont commencé à réglementer l’utilisation et le transfert de données sur Internet. Ces politiques sont susceptibles d’avoir un impact sur les performances de productivité des entreprises.
Cet article examine si les mesures de régulation des données électroniques ont un impact sur la productivité des entreprises. Nous le faisons en utilisant une analyse transnationale au fil du temps des mesures politiques sur l’utilisation et le transfert de données pour un groupe d’économies développées. À notre connaissance, cet article apporte une contribution unique à la littérature en montrant comment les politiques réglementaires sur les données ont un impact sur la productivité de l’entreprise. En particulier, nous évaluons comment des politiques de données plus strictes affectent la productivité de l’entreprise dans les secteurs en aval qui s’appuient sur les données. Nos cadres politiques sur les données entre pays couvrent à la fois la façon dont le flux de données à travers les frontières et l’utilisation domestique des données sont réglementés.
Nous définissons les politiques de données comme les mesures réglementaires qui restreignent l’utilisation commerciale des données électroniques. Nous limitons notre analyse aux mesures politiques mises en œuvre au niveau national ou supranational (comme l’UE). Bien qu’il existe un grand nombre de politiques de données mises en œuvre par les entités publiques locales, ce ne sont pas les politiques sur lesquelles nous nous concentrons sur ce document. Nous identifions deux catégories principales de politiques de données. La première catégorie couvre les politiques qui ont un impact sur le transfert transfrontalier de données; la deuxième catégorie couvre les politiques qui s’appliquent à l’utilisation des données au niveau national. La première catégorie traite de toutes les mesures qui augmentent le coût de la conduite des affaires au-delà des frontières en obligeant les entreprises à conserver les données à l’intérieur d’une certaine frontière ou en imposant des exigences supplémentaires pour les données à transférer à l’étranger. Cette dernière catégorie fait référence à toutes les mesures qui imposent aux entreprises certaines conditions d’accès, de stockage, de traitement ou plus généralement d’utilisation commerciale des données dans une certaine juridiction.
L’étude de la relation entre les approches réglementaires que les pays appliquent à l’utilisation domestique et au transfert transfrontalier de données et aux performances des entreprises en aval nécessite trois nouveaux ensembles de données que nous avons développés de manière unique. Ce sont (a) des informations sur la manière dont les pays sont restrictifs en ce qui concerne l’utilisation domestique et le transfert transfrontalier de données électroniques, (b) une mesure de la performance transnationale des entreprises et enfin (c) un indicateur mesurant dans quelle mesure les secteurs utilisent données dans le cadre de leur processus de production.
En ce qui concerne le premier ensemble d’informations, nous avons créé un ensemble quantifiable et détaillé d’informations politiques sur le cadre réglementaire de 64 économies en vue de l’utilisation et du transfert transfrontalier de données tel que développé dans Ferracane et al. (2018). Cet ensemble de données complet contient des informations détaillées sur l’état et l’historique des politiques de données. Ces informations sur les politiques de données ont été condensées en un indice de politique composite (pondéré) variant dans le temps pour chaque pays couvert. L’indice de politique de données prend des valeurs allant de 0 (complètement ouvert) à 1 (pratiquement fermé) avec des scores intermédiaires reflétant divers degrés de restrictions politiques appliquées à l’utilisation et au transfert transfrontalier de données. La création de cette base de données avec son indice correspondant représente en soi une contribution majeure à la littérature existante, qui peut être utilisée pour de futures recherches dans ce domaine.
Pour notre deuxième ensemble d’informations sur la performance des entreprises, nous utilisons des données cohérentes au niveau de l’entreprise sur un groupe d’économies développées à partir de la base de données ORBIS. En particulier, nous exploitons l’estimation de la PTF récemment développée par Ackerberg et al. (2015), qui a été appliquée dans diverses études telles que Arnold et al. (2015) et Fernades et Paunov (2012). La littérature sur la productivité a proposé plusieurs méthodologies empiriques pour construire un indicateur crédible de la PTF avec les stratégies d’estimation d’Olley et Pakes (1996) et de Levinsohn et Petrin (2003) comme les plus couramment utilisées. La mesure de la PTF par Ackerberg et al. (2015) améliore les deux approches précédentes en abordant leur problème de colinéarité. Dans cet article, nous utilisons cette estimation de la PTF d’Ackerberg dans toutes nos régressions, mais nous effectuons également des contrôles de robustesse avec les autres proxys de la PTF pour comparer les résultats, y compris les mesures TFPR et TFPQ de Hsieh et Klenow (2014; 2009).
Enfin, notre troisième ensemble d’informations est un indicateur mesurant dans quelle mesure les différents secteurs utilisent les données dans le cadre de leur processus de production. Cet indicateur relie les estimations de la PTF transnationale des entreprises et l’indice des politiques de données des pays avec les parts des intrants qui mesurent la dépendance à l’égard des données pour chaque secteur. Cette stratégie d’identification pondère l’état des politiques de données de chaque pays en fonction de la dépendance de chaque secteur à l’égard des données. L’utilisation de données pour chaque secteur est calculée de manière exogène en prenant des coefficients d’entrée-sortie détaillés d’un pays ne faisant pas partie de notre analyse, à savoir les États-Unis. L’utilisation de cette méthodologie suppose que les secteurs qui utilisent comparativement plus de données dans leur processus de production sont plus affectés par les changements dans les politiques de données.
Nous effectuons notre analyse dans un cadre de panel cross-country. Les résultats montrent que des politiques de données plus strictes et plus restrictives ont en effet un impact négatif significatif sur les performances de productivité des entreprises dans les secteurs en aval à forte intensité de données. De plus, nous constatons que cet impact négatif est plus fort pour les pays disposant d’un meilleur environnement propice au numérique et pour les entreprises manufacturières qui produisent également des services. De plus, les résultats sont robustes lors de la correction d’autres politiques réglementaires dans les secteurs des services selon Arnold et al. (2015; 2011). Dans l’analyse, nous appliquons les effets fixes et les variables de contrôle appropriés, et tenons compte de la causalité inverse potentielle en appliquant un décalage entre le moment de la mise en œuvre des politiques de données et la mesure de la productivité des entreprises. En outre, nous avons également divisé notre principal index des politiques de données en différents types de politiques, à savoir les politiques qui affectent l’utilisation domestique des données et celles qui affectent le mouvement transfrontalier des données pour voir si les deux sous-indices individuels ont un impact différent sur la productivité des entreprises.
Notre travail contribue à la littérature existante de trois manières. Premièrement, à notre connaissance, nous sommes les premiers à créer un ensemble de données dans lequel le cadre réglementaire des pays concernant les données a été quantifié d’un descriptif à un indice mesurable. Bien que les travaux existants aient entrepris un exercice similaire en ce qui concerne d’autres politiques réglementaires sur les services (Arnold et al., 2015) ou plus généralement sur les barrières non tarifaires (Kee et al., 2009), à ce jour aucun travail n’a fait un effort similaire pour les politiques de données. Deuxièmement, nous associons notre indice de politique aux données de micro-niveau sur les performances de productivité des entreprises dans un groupe de pays. Cela s’écarte de la plupart des recherches précédentes qui sont basées sur un seul pays et nous permettent d’exploiter les différences entre les pays comme source supplémentaire de variation. Il nous permet également d’utiliser des effets fixes de l’année industrielle pour contrôler les changements possibles. De plus, le fait d’avoir un groupe de pays permet d’extrapoler les conclusions politiques à travers les pays. Troisièmement, nous fournissons des preuves solides de la manière dont ces politiques liées aux données affectent la productivité des entreprises qui dépendent davantage des données.
Le reste de cet article est organisé comme suit. La section suivante traite de la littérature précédente concernant l’utilisation et le transfert transfrontalier des données et leurs effets économiques associés. La section 3 détaille les trois ensembles de données utilisés dans cet article. Il fournit également une analyse descriptive de la manière dont l’utilisation des données dans différents secteurs est liée à la productivité. La section 4 présente la stratégie d’estimation et la section 5 examine les résultats de l’estimation. Enfin, la dernière section conclut en replaçant les résultats dans un contexte plus large.
2. Littérature connexe
Cet article est étroitement lié à la littérature précédente sur l’effet des politiques de services restrictives sur la productivité des entreprises en aval, comme Arnold et al. (2015; 2011). Conformément à leurs travaux sur les services, la stratégie d’identification de cet article pondère un indice des politiques de données restrictives par la part de l’utilisation des données d’entrée pour chaque secteur en aval. Cette valeur est ensuite régressée sur la PTF au niveau de l’entreprise. 1 La raison d’utiliser une méthodologie similaire est que les restrictions politiques sur les données sont étroitement liées à la réglementation des services, car de nombreux services numériques dépendent de l’utilisation et du transfert de données pour leur entreprise. Par exemple, Opresnik et Taisch (2015) montrent que les données sont générées par l’utilisation de services dans les processus de production des entreprises et que ces données sont exploitées dans les étapes ultérieures du processus de production pour des activités plus innovantes et de nouveaux services pour les consommateurs. Cela permet une extraction de valeur accrue à l’aide des mégadonnées et, par conséquent, les services liés aux données deviennent de plus en plus un facteur essentiel pour améliorer la productivité des entreprises. 2
Ce document suit une ligne similaire. Des politiques de données plus restrictives devraient avoir un effet négatif sur les entreprises en aval dans des secteurs qui dépendent des données dans leur processus de production. Aujourd’hui, de nombreuses entreprises des secteurs à forte intensité de données dépendent fortement des données et, par conséquent, les politiques qui restreignent l’utilisation et le transfert transfrontalier des données devraient réduire leur efficacité et, éventuellement, leur productivité. Pourtant, les politiques de données n’ont été mises à l’honneur ces dernières années qu’en raison de l’adoption généralisée des services d’informatique en nuage et de l’augmentation de la fourniture transfrontières de services sur Internet.
Les recherches empiriques sur les politiques de données et la productivité des entreprises sont relativement rares. Au meilleur de nos connaissances, van der Marel et al. (2016) est la seule étude qui explore comment les politiques réglementaires liées aux données électroniques affectent la PTF, bien qu’au niveau de l’industrie. Les auteurs tentent d’abord d’analyser économiquement ce lien en mettant en place un indice de régulation des données à partir des indices de régulation des services existants. Ils calculent les coûts des politiques de données pour les entreprises nationales en établissant un lien entre la réglementation des services de données et la PTF au niveau de l’industrie dans les secteurs en aval dans un petit ensemble de pays. Ils constatent que des politiques de données plus strictes ont tendance à avoir un impact négatif plus fort sur les performances en aval des industries qui sont plus gourmandes en données. Ils utilisent également leurs résultats économétriques dans une analyse d’équilibre général utilisant le Global Trade Analysis Project (GTAP) pour estimer l’impact macroéconomique plus large.
D’autres études ont examiné spécifiquement un cadre politique concernant les données, à savoir le règlement général de l’UE sur la protection des données (RGPD). Christensen et al. (2013) utilise des techniques d’étalonnage pour évaluer l’impact de la proposition du RGPD sur les petites et moyennes entreprises (PME) et conclut que les PME qui utilisent les données de manière assez intensive sont susceptibles d’engager des coûts substantiels pour se conformer à ces nouvelles règles. Les auteurs calculent ce résultat à l’aide d’un modèle d’équilibre général stochastique dynamique simulé et montrent que jusqu’à 100 000 emplois pourraient disparaître à court terme et plus de 300 000 à long terme. Une autre étude de Bauer et al. (2013) utilise un modèle GTAP d’équilibre général calculable pour estimer l’impact économique du RGPD et constate que cette loi pourrait entraîner des pertes allant jusqu’à 1,3% du PIB de l’UE en raison d’une réduction des échanges entre l’UE et le reste du le monde.
Notre étude s’appuie sur ces travaux précités en apportant de nouvelles contributions. Tout d’abord, nous contribuons à la littérature générale sur la réglementation des services en nous concentrant sur un domaine politique particulier, à savoir les restrictions liées à l’utilisation domestique et aux mouvements transfrontières de données. Actuellement, de nombreuses disciplines relatives aux flux de données sont en cours de discussion dans le cadre de diverses négociations à l’Organisation mondiale du commerce (OMC) et d’accords commerciaux régionaux. Pourtant, à ce jour, aucune étude empirique approfondie n’a entrepris de rechercher un effet significatif de ces mesures sur la productivité et le commerce. Deuxièmement, nous construisons un indice réglementaire mesurant le caractère restrictif des politiques de données. L’indice de la politique des données considère un ensemble de politiques qui imposent un coût substantiel à l’utilisation et au mouvement transfrontalier des données et devraient donc augmenter les coûts de la fourniture de biens et services en aval. À son tour, cela aurait un impact sur la productivité de l’entreprise, que nous mesurons avec des données au niveau de l’entreprise.
S’appuyant sur cette approche, cet article suit Iootty et al. (2016) qui utilise les données de productivité transnationale des entreprises couvrant un large éventail d’économies développées utilisant ORBIS pour arriver à plusieurs mesures de productivité de la PTF au niveau de l’entreprise. Gal et Hijzen (2016), entre autres, utilisent également des données transnationales de productivité au niveau de l’entreprise provenant de la même base de données ORBIS pour mesurer la performance économique des entreprises. Cependant, dans leur article, les auteurs utilisent une mesure plus large des performances de sortie alors que nous utilisons spécifiquement la PTF. De plus, Iootty et al. (2016) et Gal et Hijzen (2016) analysent l’impact sur la productivité d’un ensemble plus large de mesures politiques de la réforme globale du marché des produits ou des services et non des politiques de données en particulier.
En bref, notre étude combine tous les travaux susmentionnés en utilisant une stratégie d’identification similaire à Arnold et al. (2015; 2011) mais appliqué aux politiques de données, pour un ensemble plus large de pays et en développant la performance spécifique de la PTF transnationale au niveau de l’entreprise.
1 D’autres travaux antérieurs qui utilisent une stratégie d’identification similaire avec des données de productivité au niveau de l’entreprise dans un contexte de services sont Fernades et Paunov (2012) et Duggan et al. (2013), chacun utilisant un proxy TFP différent.
2 Des travaux récents de Goldfarb et Trefler (2018) discutent des implications théoriques potentielles des politiques de données telles que la localisation des données et les règles de confidentialité sur le commerce, bien que cela soit placé dans un contexte plus large de l’intelligence artificielle (IA). Néanmoins, les auteurs indiquent clairement qu’une industrie de l’IA élargie dans laquelle les flux de données sont un facteur important aurait des implications claires pour le commerce des services. De même, Goldfarb et Tucker (2012) soulignent que les réglementations sur la vie privée peuvent nuire aux activités innovantes en présentant les résultats des études antérieures entreprises dans deux secteurs de services, à savoir les services de santé et la publicité en ligne. Les deux études montrent qu’il existe des liens étroits entre l’approvisionnement et l’utilisation efficaces des données, les secteurs de services et le commerce des services.
3. Les données
Pour effectuer notre analyse empirique, nous avons besoin de trois ensembles de données: un indice réglementaire pour l’utilisation et le transfert transfrontalier des données; une mesure de la performance de la PTF au niveau de l’entreprise; et des coefficients entrées-sorties mesurant dans quelle mesure les secteurs en aval (fabrication et services) utilisent les données comme entrées. Ces coefficients d’entrée-sortie sont ensuite interagis avec l’indice de politique de données pour avoir un score pondéré de restriction réglementaire.
3.1 Index de politique de données
Le premier ingrédient essentiel de notre analyse est un ensemble quantifiable et détaillé d’informations politiques sur le cadre réglementaire des pays en matière de données. Nous nous appuyons sur une nouvelle base de données complète des politiques de données récemment publiée par le Centre européen d’économie politique internationale (ECIPE) pour estimer notre indice de politique de données. 1 Les politiques utilisées pour l’analyse sont celles considérées comme créant un coût pour les entreprises qui s’appuient sur des données pour leurs entreprises. Les critères d’inscription d’une certaine mesure politique dans la base de données sont les suivants: (i) il crée un régime plus restrictif pour les utilisateurs de données en ligne et hors ligne; (ii) cela implique un traitement différent entre les utilisateurs nationaux et étrangers de données; et (iii) il est appliqué d’une manière jugée disproportionnée pour atteindre un certain objectif politique.
À partir de la base de données, ces politiques sont agrégées dans un indice en utilisant un schéma de pondération détaillé adapté de Ferracane et al. (2018) et présenté en détail à l’annexe A. 2 Nous élargissons l’indice publié par Ferracane et al. (2018), qui ne couvrait que les années 2016/2017, pour créer un panel pour les années 2006-2017 que nous pourrions utiliser dans nos régressions. De plus, la base de données et l’indice ont été mis à jour avec de nouvelles mesures réglementaires trouvées dans certains pays.
Pour construire l’indice, chaque mesure politique identifiée dans l’une des catégories reçoit un score qui varie entre 0 (complètement ouvert) et 1 (pratiquement fermé) selon l’étendue de son champ d’application. Un score plus élevé représente un niveau de restriction plus élevé dans les politiques de données. Si certaines politiques de données peuvent être légitimes et nécessaires pour protéger des objectifs non économiques tels que la vie privée de l’individu ou pour garantir la sécurité nationale, ces politiques engendrent néanmoins des coûts substantiels pour les entreprises et sont donc répertoriées dans la base de données.
Après avoir appliqué notre système de pondération, l’indice de politique des données varie également entre 0 (complètement ouvert) et 1 (pratiquement fermé). Plus l’indice est élevé, plus les politiques de données mises en œuvre dans les pays sont strictes. De plus, l’indice est divisé en deux sous-indices qui couvrent deux principaux types de mesures politiques que nous analysons dans cet article: un sous-indice qui couvre les politiques sur les mouvements transfrontaliers de données et un sous-indice qui couvre les politiques sur l’utilisation domestique des données. L’analyse de ces deux sous-indices séparément fournit des informations supplémentaires sur la question de savoir si l’impact des politiques de données sur la productivité des entreprises varie selon la nature des politiques. L’indice de politique de données complètes est mesuré comme la somme de ces deux sous-indices. La liste des mesures incluses dans les deux sous-indices est résumée dans le tableau 1 et le poids spécifique pour chaque mesure est indiqué dans la dernière colonne. Le tableau 2 montre les valeurs de l’indice de politique de données et des deux sous-indices pour l’année 2017.
Comme le montre le tableau 1, les sous-indices sont des mesures en tant que moyenne pondérée de différents types de mesures. Les pondérations sont censées refléter le niveau de caractère restrictif des types de mesures en termes de coûts pour l’entreprise. Le premier sous-indice des flux de données transfrontaliers couvre trois types de mesures, à savoir (i) une interdiction de transférer des données ou une exigence de traitement local des données; (ii) un besoin de stockage local, et (iii) un régime de flux conditionnel. Le deuxième sous-indice couvre une série de sous-catégories de politiques affectant l’utilisation domestique des données. Ce sont: (i) les exigences de conservation des données, (ii) les droits des sujets sur la confidentialité des données, (iii) les exigences administratives sur la confidentialité des données, (iv) les sanctions pour non-conformité, et enfin, (v) d’autres pratiques restrictives liées aux politiques de données .
La figure 2 montre comment les deux sous-indices et l’indice global de politique des données ont évolué au fil du temps entre les années 2006 et 2016. Chaque ligne est une moyenne (pondérée) des 64 pays couverts par cette étude. Comme on peut le voir, il existe une nette tendance à la hausse qui reflète le fait que tous les types de politiques de données deviennent plus strictes au fil du temps. Il convient de noter que les mesures affectant les flux de données transfrontières peuvent directement entraver la libre circulation des données entre les pays et peuvent donc directement restreindre le commerce des services. D’un autre côté, les mesures appartenant au deuxième sous-indice sur l’utilisation intérieure des données n’affectent qu’indirectement le flux de données à travers les frontières et ne devraient donc engendrer des coûts pour le commerce qu’indirectement.
3.2 Performance au niveau de l’entreprise
Les données au niveau de l’entreprise pour estimer nos mesures de PTF sont extraites de la base de données ORBIS du Bureau van Dijk (BvD). Bien que notre objectif soit d’inclure autant de pays développés que possible qui sont couverts par notre indice, ORBIS ne rapporte pas toutes les variables nécessaires au calcul de la PTF pour les 64 pays. De plus, certains petits États comme le Luxembourg, Malte et Chypre n’ont que peu d’observations. Par conséquent, nous limitons l’analyse aux pays de l’UE, au Japon et à la Corée. 3 Les données dans ORBIS sont considérablement améliorées à partir de 2005. Comme indiqué précédemment, les entreprises manufacturières et de services sont considérées dans nos calculs pour faire le point sur l’ensemble de l’économie en aval. La plupart des secteurs de services dépendent relativement plus des données en termes de création de valeur ajoutée que les industries manufacturières, ce qui est la principale raison pour laquelle ils sont inclus. Voir le tableau B1 à l’annexe B pour un aperçu annuel des observations fermes pour les services et les biens.
Une mise en garde s’impose pour nos observations au niveau de l’entreprise. Bien que nous préférerions avoir un ensemble de données de panel entièrement équilibré avec uniquement des entreprises survivantes, dans notre cas, ce souhait semble difficile. Notre calendrier préféré est 2006-2015, qui couvre un format de panneau moins que parfait des entreprises survivantes. En outre, ORBIS fournit une mauvaise piste des entreprises qui entrent et sortent. Si nous devions utiliser uniquement des entreprises survivantes avec un délai plus court après 2010, nos observations chuteraient de 60%. Cela est en grande partie dû au peu d’entreprises qui sont en fait constamment présentes dans ORBIS. Par conséquent, nous préférons travailler avec des données à partir de 2006. En outre, les tendances politiques dans notre échantillon de pays deviennent visibles après 2006, ce qui offre une bonne occasion d’exploiter la variation des changements de politique, bien qu’avec le compromis d’un panel déséquilibré base de données.
Les mesures de PTF au niveau de l’entreprise peuvent être calculées de différentes manières. Au fil des ans, diverses méthodologies ont été développées dans la littérature qui ont été reprises dans des travaux empiriques récents. Les mesures de la PTF par Olley et Pakes (2003) (& P) et Levinsohn et Petrin (2008) (L&P) sont les plus couramment utilisées. Plus récemment, plusieurs articles proches de notre axe de recherche comme Fernandes et Paunov (2012) et Arnold et al. (2015) ont plutôt utilisé l’estimation de la PTF développée par Ackerberg et al. (2015) (ACF). Bien que les trois approches soient correctes pour l’endogénéité des choix d’intrants, y compris le choix des services comme intrants, Ackerberg et al. (2015) améliore les deux anciennes méthodes en corrigeant les problèmes de colinéarité potentiels. Ce problème pourrait autrement se produire à partir d’un facteur de distorsion en ce qui concerne l’identification des coefficients d’entrée variables. Ackerberg et al. (2015) fournissent également une correction pour le moment de la décision de choix d’entrée.
Cette approche d’estimation est également préférée dans notre article et nous l’utilisons dans toutes nos régressions. Pour obtenir la PTF, il faut estimer les fonctions de production. Étant donné qu’il s’agit de plusieurs pays et de plusieurs industries, nous estimons ces fonctions de production pour chaque secteur à deux chiffres de la NACE Rév. 2 et par pays. Cela permet aux industries et aux pays de différer dans leur technologie de production. Dans certains cas, nous regroupons des pays et des industries en raison de leur nombre insuffisant d’observations. 4 Au total, 52 groupes d’industries peuvent être consultés dans les tableaux B2 et B3 de l’annexe B, ainsi qu’un aperçu des observations fermes. 5 Le tableau B4 indique le nombre d’observations fermes des 18 groupes de pays.
Pour commencer à estimer les fonctions de production, nous avons besoin de données au niveau de l’entreprise sur la valeur ajoutée. Normalement, la valeur ajoutée au niveau de l’entreprise est définie comme les ventes moins la valeur des intrants intermédiaires, qui comprend les matériaux, les services et l’énergie. Dans ORBIS, malheureusement, seuls les revenus nets d’exploitation et les coûts des matériaux sont déclarés et nous sommes donc tenus d’utiliser ces deux variables pour calculer la valeur ajoutée.
De plus, les matériaux ne sont déclarés pour aucune entreprise dans certains pays européens. 6 Pour ces pays, nous utilisons des intrants matériels de substitution. Notre façon de procéder est basée sur Basu et al. (2009), dans lequel les auteurs calculent les matériaux en tant que revenus opérationnels moins bénéfices opérationnels, salaires et amortissement. Puisqu’il s’agit d’une mesure moins précise des intrants matériels, nous vérifions s’il existe une forte corrélation entre les deux mesures: l’approche directe et indirecte pour tous les pays qui déclarent les deux méthodes. Le tableau B5 présente les régressions en tant que corrélations de la mesure indirecte sur les matières déclarées directement pour ces pays. Le résultat montre que les corrélations sont très fortes avec un R au carré élevé. Une fois que nous utilisons cette méthode de substitution, le nombre d’entreprises dans notre ensemble de données augmente de 11%. sept
Les fonctions de production elles-mêmes sont estimées en utilisant l’approche standard de Cobb-Douglas sous forme logarithmique, comme le montre l’équation suivante:
Dans l’équation (1), Yit représente la production à valeur ajoutée d’une entreprise i au cours de l’année t et représente la variable de la valeur ajoutée comme expliqué ci-dessus avec les réserves décrites. Kit désigne le stock de capital d’une entreprise et est calculé sur la base de la méthode d’inventaire perpétuel (PIM) en utilisant des actifs corporels fixes réels, tandis que Lit désigne l’apport de main-d’œuvre d’une entreprise, qui est déterminé par le nombre d’employés. De plus, il s’agit de la productivité totale des facteurs non observée et il s’agit du choc aléatoire iid. Comme expliqué dans l’introduction de cette section, nous n’utilisons pas OLS pour estimer l’équation (1) car cette stratégie d’estimation souffre d’un biais de simultanéité dans ses entrées. Au lieu de cela, nous utilisons l’approche d’Ackerberg et al. (2015). Pour cette spécification, les entrées matérielles sont utilisées comme proxy pour obtenir une productivité variable non observée (Ï ‰ it).
Il convient de noter que nous déflatons d’abord les trois variables de leur valeur nominale en valeurs déflatées, puis les mettons en euros en utilisant des taux de change constants de 2010. Les données sur les prix pour les pays de l’UE proviennent de la base de données des comptes nationaux d’Eurostat, et pour le Japon et la Corée de la base de données de l’analyse structurelle de l’OCDE (STAN). Nos déflateurs sont principalement disponibles dans les industries à deux chiffres de la NACE. Dans le cas où les données sur les prix manquent, nous utilisons soit un niveau d’agrégation plus élevé, soit des déflateurs du PIB autrement simples. Pour la valeur ajoutée, nous utilisons l’indice de valeur ajoutée en prix brut (c’est-à-dire le déflateur implicite) en prix constants avec 2010 comme année de référence pour tous les pays. Pour les matériaux, nous utilisons un déflateur pour la consommation intermédiaire et enfin pour le stock de capital nous utilisons la consommation de l’indice des prix du capital fixe.
Les paramètres βK et βL des fonctions de production sont estimés séparément par 18 pays multipliés par 52 secteurs. Cela nous donne un total de 936 fonctions de production. 8 Ils ne sont estimés qu’avec les entreprises qui déclarent systématiquement des valeurs depuis au moins quatre ans, afin de rester en ligne avec les travaux antérieurs. Dans l’ensemble, sur la base des ensembles d’estimations de l’approche Ackerberg non biaisée, nous obtenons des estimations de la PTF logarithmique au niveau de l’entreprise, spécifiques au pays et variant dans le temps. À l’annexe B, le tableau B7 fournit des statistiques résumées pour les variables utilisées dans la fonction de production de l’équation (1) tandis que les tableaux B8 et B9 présentent des statistiques résumées pour toutes nos estimations de la PTF.
3.3 Coefficients d’entrée-sortie des données
La mesure dans laquelle différents secteurs utilisent les données en tant qu’intrants est mesurée à l’aide des tableaux américains d’entrées-sorties du Bureau of Economic Analysis (BEA). Ces matrices entrées-sorties sont au niveau du SCIAN à 6 chiffres, organisation de séminaire ce qui nous permet d’identifier à un niveau désagrégé les secteurs qui dépendent davantage des données dans le cadre de notre stratégie d’identification. Une autre motivation pour l’utilisation des tableaux américains est que les États-Unis ne sont pas inclus dans nos données au niveau de l’entreprise. Cela rend nos coefficients d’entrée sur l’utilisation des données exogènes. Il y a un débat dans la littérature économique sur la question de savoir s’il faut utiliser l’hypothèse de technologies industrielles égales d’un pays à l’autre. L’égalité des coefficients technologiques semble raisonnable si l’on pense que les pays sélectionnés dans l’échantillon sont raisonnablement similaires dans leurs structures économiques et leurs dotations technologiques. 9 Cela est probablement vrai dans notre cas, car nous ne traitons qu’avec des économies développées.
Dans le calcul de ces coefficients d’entrée de données, ou intensités de données, nous devons d’abord déterminer les secteurs qui fournissent des services de données à d’autres secteurs en aval. Le tableau 3 répertorie ces secteurs que nous appelons les «œdata producteurs». Ce sont des secteurs qui déploient une forte intensité de données électroniques lors de la prestation de services. En tant que tels, ces secteurs agissent comme une entrée de données pour d’autres secteurs de l’économie. Cette sélection de secteurs suit van der Marel et al. (2016) et est conforme à Jorgenson et al. (2011) concernant les industries productrices et utilisatrices de technologies de l’information. 10 Les secteurs sélectionnés comprennent, entre autres, les télécommunications; traitement de données, hébergement et services connexes; fournisseurs de services Internet et portails de recherche Web; éditeurs de logiciels; services de conception de systèmes informatiques et autres services informatiques.