Bons e maus usos da destribuiçao de pareto na analise de dados

7327 palavras 30 páginas
Marc Barbut

Des bons et des moins bons usages des distributions parétiennes en analyse des données
In: Histoire & Mesure, 1988 volume 3 - n°1. pp. 111-128.

Citer ce document / Cite this document : Barbut Marc. Des bons et des moins bons usages des distributions parétiennes en analyse des données. In: Histoire & Mesure, 1988 volume 3 - n°1. pp. 111-128. doi : 10.3406/hism.1988.1296 http://www.persee.fr/web/revues/home/prescript/article/hism_0982-1783_1988_num_3_1_1296

Histoire & Mesure, 1988, lll-l, 111-128

Marc BARBUT

Des bons et des moins bons usages des distributions parétiennes en analyse des données

Denis Morsa a publié dans « Histoire & Mesure » (vol. 2, n° 2, pp. 73-92, 1987) un article dans lequel il étudie la distribution de la population des villes et des localités de la Principauté de Liège à la fin du XVIIIe siècle. Il a d'ailleurs la prudence méritoire de le sous-titrer « premières approches ». Cet article est, à mon sens, à la fois exemplaire de ce que doit être un traitement de données en Sciences Humaines, et déplorable en raison de certaines erreurs de statistique qu'il contient (1). Empirisme, modèles, théorie Exemplaire, en effet, car dans son étude, purement empirique, Denis Morsa a des modèles parfaitement explicites en tête ; à savoir que pour les 104 localités, la distribution de la population pourrait obéir à la loi « rang-taille » de Zipf ,

où x(r) est la taille de la ville de rang r quand elles sont rangées par tailles décroissantes, et que pour les 26 de ces localités qui sont, à l'époque, considérées comme villes, cette distribution pourrait être conforme à la première (la première, car il y en a trois) loi de Pareto.

où P(x) est la proportion des villes de taille supérieure à x. Moyennant quoi, il effectue l'ajustement de chacun de ces deux modèles aux données observées, auxquelles il entend respectivement les appliquer ; et constate d'ailleurs que ces ajustements sont assez bons, pour une partie au moins des

Relacionados