50 Jeux de Données Intéressants Pour Trouver les Données Dont Vous Avez Besoin

décembre 5, 2023
50 jeux de données intéressants

Qu’il s’agisse d’un projet scientifique, d’une infographie ou d’une présentation, les données rendent tout plus intéressant.

Mais la collecte de données intéressantes donne envie de s’arracher les cheveux, et tout le monde ne dispose pas des ressources nécessaires pour collecter des données à grande échelle.

Heureusement, il y a suffisamment de personnes dans ce monde qui croient que les données et les jeux de données devraient être partagés autant que possible. Ces personnes ont créé de nombreuses ressources pour simplifier les choses.

Où trouver des jeux de données gratuits ?

Heureusement, il y a suffisamment de personnes dans ce monde qui croient que les données et les jeux de données devraient être partagés autant que possible. Ces personnes ont créé de nombreuses ressources pour simplifier les choses.

Nous avons parcouru internet et trouvé 500 jeux de données parmi les plus intéressants. Mais, histoire de faire court, en voici 50 pour commencer.

Pour vous faciliter la tâche, nous avons divisé les exemples de jeux de données en plusieurs catégories. Vous pouvez zapper la recherche de données sur Google et cliquer sur les liens ci-dessous pour accéder rapidement à la section de votre choix.

Avant de vous plonger dans les sources, si vous souhaitez créer des visuels à partir de vos données, créez un compte Piktochart. Vous pouvez commencer gratuitement et utiliser l’un des modèles d’infographie, de rapport, d’affiche, de brochure ou de présentation pour vous faciliter la tâche.

Jeux de données sur les entreprises et l’emploi

data scientists utilisant des jeux de données sur les entreprises et l'emploi pour visualiser les données

1. Crunchbase – Trouvez des informations sur les entreprises privées et publiques. Vous pouvez rechercher le nombre d’investissements réalisés, l’identité des membres fondateurs et les éventuelles fusions ou acquisitions.

2. Recherche sur Glassdoor – Glassdoor propose des données relatives à l’emploi. Vous pouvez, par exemple, calculer les économies que vous pourriez réaliser en conservant vos employés.

3. Open Corporates – Open Corporates est la plus grande base de données ouverte d’entreprises et de données d’entreprises au monde. Utilisé par les banques et les gouvernements, Open Corporates est fier de disposer des données les plus précises du marché.

Jeux de données sur la criminalité, les conflits et la drogue

4. FBI Uniform Crime Reporting – L’Uniform Crime Reporting compile des rapports statistiques sur la criminalité, des publications et des points de données provenant de milliers de villes, d’universités, d’États et d’agences fédérales chargées de l’application de la loi.

5. Programme de données sur les conflits d’Uppsala – Le Uppsala Conflict Data Program (UCDP) fournit des données sur le crime organisé et les guerres civiles dans le monde.

6. Institut national sur la consommation de drogues – Le National Institute on Drug Abuse (NIDA) surveille la prévalence et les tendances en matière d’abus de drogues aux États-Unis.

agents de police diffusant des données

Jeux de données sur internet

7. DBpedia – DBpedia vise à rendre les informations de Wikipedia facilement consultables via des requêtes SPARQL ou en téléchargeant directement leurs informations. Par exemple, vous pouvez rechercher les joueurs de la NBA nés dans les années 80 dans les villes de plus d’un million d’habitants.

8. Google Trends – Google Trends vous permet d’observer ce qui se passe dans le monde. Cet outil fournit des données sur ce qui devient populaire et sur le nombre de personnes qui recherchent un terme particulier, ce qui le rend utile pour l’analyse exploratoire des données.

9. API Instagram – Facebook vous permet d’utiliser l’API d’Instagram pour accéder rapidement aux commentaires, aux métadonnées et aux statistiques.

Comment une infographie se démarque-t-elle ? Ce livre blanc créé par Piktochart et HubSpot dévoile le secret d’une infographie réussie. Téléchargez-le gratuitement.

exemple de données sur les dépenses personnelles à partir de jeux de données sur internet

Jeux de données financières

Si vous cherchez des données économiques et financières, ne cherchez pas plus loin : ces sources hébergent une multitude de jeux de données historiques.

les données sur les cours des actions et les indicateurs économiques grâce à des jeux de données financières

10. Comtrade – Jeux de données officielles sur le commerce des biens et des services gérés par la base de données COMTRADE de l’ONU. Il propose des outils de visualisation des données, une API et d’autres outils d’extraction.

11. Datahub – Bourse – Du cours de l’or aux sociétés du S&P 500, en passant par le NASDAQ, vous trouverez tout sur datahub.io.

12. Global Financial Data – Global Financial Data porte bien son nom : ce site vous offre des données sur les finances du monde. Cela va de l’immobilier et des données macroéconomiques mondiales aux simples données boursières.

13. Données du FMI – Le FMI, ou Fonds monétaire international, est une organisation qui vise à favoriser la collaboration monétaire entre les pays. Vous y trouverez des données sur le commerce, les finances publiques et le développement financier.

14. The Atlas of Economic Complexity – The Atlas of Economic Complexity fournit des données sur la dynamique du commerce mondial au fil du temps. Vous souhaitez connaître le nombre de textiles exportés par la Chine vers la Corée du Sud ? Facile.

15. La Banque mondiale – La Banque mondiale fournit non seulement des données financières sur les pays, mais aussi des données sur l’éducation et la santé.

16. Données du Financial Times – Vous y trouverez des chiffres concrets sur les différents marchés dans le monde. Ces données comprennent les fluctuations des devises, les taux de rendement des obligations et les prix des matières premières.

Jeux de données sur la santé

17. Centres de contrôle des maladies (CDC) – Le CDC fournit des données quantitatives sur un large éventail de sujets liés à la santé, tels que le diabète, l’espérance de vie, le cancer et l’obésité. Ils fournissent également d’autres ressources que vous pouvez utiliser pour trouver plus de données.

18. Enigma Public – santé – Enigma Public se présente comme « la plus grande collection de données publiques au monde ». Ce site, essentiellement centré sur les États-Unis, fournit des données sur les épidémies d’origine alimentaire, les dépenses en médicaments de Medicare et l’OSHA. Il fournit également des données sur d’autres sujets tels que les transports et l’immigration.

19. Health Data – Portail sur la santé contenant plus de 3 000 jeux de données utiles sur l’épidémiologie et les statistiques démographiques, géré par le département américain de la santé et des services sociaux (U.S. Department of Health & Human Services). API disponibles.

20. NHS Digital – Fournit des données sur le système de santé et la sécurité sociale au Royaume-Uni. Vous voulez savoir quels sont les médicaments prescrits par les médecins au Royaume-Uni ? Eh bien, vous pouvez maintenant le découvrir.

21. US Food & Drug Administration – La FDA fournit des données sur les médicaments actuellement autorisés aux États-Unis. Les données sont mises à jour chaque semaine. Vous devrez peut-être rafraîchir au préalable vos connaissances en Excel, car les données ne sont disponibles que sous forme de base de données ou de fichier CSV.

22. Organisation mondiale de la santé – Comme son nom l’indique, l’OMS fournit des données sur différents sujets liés à la santé. Cela va de la sécurité routière à la santé mentale, en passant par l’eau et l’assainissement.

indicateurs de maladies chroniques jeux de données sur les soins de santé

Jeux de données sur le divertissement

23. BFI – Film Forever – Vous y trouverez des données sur l’industrie cinématographique au Royaume-Uni. Vous y trouverez par exemple des données sur la façon dont un film a influencé la culture britannique et combien Avengers : Endgame a invisibilisé tous les autres films la semaine de sa sortie.

24. Football Data – Vous voulez savoir qui était l’arbitre d’un match de football (ou de soccer, selon l’endroit d’où vous venez) en Écosse ? Vous avez de la chance. C’est justement ce que Football Data fournit, et bien plus encore. Le site est fortement axé sur les paris, mais vous y trouverez aussi de nombreuses informations sur les matchs de football passés.

25. Statista – Jeux vidéo – Sous-catalogue de Statista, où vous trouverez des statistiques, des faits et des données de marché sur l’industrie des jeux vidéo dans le monde entier, tels que le nombre de jeux et les revenus des jeux.

Jeux de données gouvernementales

26. Australian Government Catalogue – Comme vous l’avez peut-être deviné à la lecture du nom, ce jeu de données est axé sur le gouvernement australien. Vous y trouverez des données sur la qualité des sols, la vie marine ou la planification environnementale.

27. Data.gov – L’homologue américain de l’AGC. Des tonnes et des tonnes de données sur quatorze sujets différents. De l’agriculture à la sécurité publique, en passant par l’administration locale. Les jeux de données sont plus anciens, mais toujours exacts et faciles à utiliser.

28. Data.gov.uk – Avec plus de 50 000 jeux de données, vous n’aurez aucun mal à trouver ce que vous voulez savoir sur le gouvernement britannique.

29. data.europa.eu – Portail de données ouvertes de la Commission européenne et d’autres institutions de l’Union européenne, couvrant plus de 14 000 jeux de données sur l’énergie, l’agriculture ou l’économie.

30. London Datastore – Données sur la vie à Londres. Vous voulez savoir de combien la population a augmenté en cinq ans ? Ou peut-être voulez-vous savoir combien de touristes ont été accueillis par rapport au trimestre précédent ? Vous le trouverez sur London datastore.

31. NYC Open Data – Si Londres ne vous intéresse pas, vous pouvez consulter les données relatives à la ville de New York. Vous y trouverez des données sur la corruption, les élections et les médias.

32. Open Data Canada – Le portail officiel du gouvernement partageant des jeux de données publiques au Canada. Tout comme le catalogue du gouvernement australien (AGC) et Data.gov.

33. UK Data Service – L’objectif du UK Data Service est de « renforcer la société et d’améliorer la vie des gens en éclairant la recherche de qualité grâce à la puissance des données ». Ils travaillent avec différentes institutions et agences pour recueillir des données sur une grande variété de sujets.

Jeux de données sur les transports

34. National Travel & Tourism Office – Le site semble avoir été conçu dans les années 90, mais il fournit de bonnes informations sur le tourisme international aux États-Unis.

35. NYC Taxi Trip Data – Vous y trouverez les données détaillées de la Commission des taxis et limousines de New York (NYC Taxi and Limousine Commission). Ces données comprennent les dates et heures de prise en charge et de dépose, les lieux de prise en charge et de dépose, les distances parcourues, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers déclarés par le conducteur.

36. Statista – Voyages – Vous trouverez ici des données sur différents sujets liés au tourisme, tels que les hôtels, les destinations de vacances, etc.

37. U.S. Travel Association – La U.S. Travel Association est une organisation à but non lucratif qui représente tous les acteurs de l’industrie du voyage et fournit des données de recherche de haute qualité sur le tourisme et le transport.

Jeux de données météorologiques et environnementales

38. Africa Climate– Données sur l’environnement et le changement climatique dans les pays africains, fournies par les principales organisations internationales telles que la Banque mondiale, l’OMS et le Fonds mondial.

39. Open AQ – Open AQ a pour mission de lutter contre la pollution de l’air. Ce site regroupe des données physiques sur la qualité de l’air provenant de sources de données publiques fournies par le gouvernement, de sources de niveau recherche et d’autres sources.

40. Weather.gov – Fournit des données météorologiques, hydrologiques et climatiques, des prévisions et des alertes pour la protection de la vie et le renforcement de l’économie nationale. Cette source fournit des données météorologiques historiques pour les États-Unis.

Jeux de données diverses

articles intéressants sur les données et sources pour trouver des jeux de données

41. Amazon AWS – Amazon fournit un registre public de toutes les données publiques sur AWS. Des images satellites aux données de l’IRS en passant par les pages web.

42. Data.World – Biologie – Vous trouverez ici des données publiques sur la biologie fournies par des milliers d’utilisateurs et d’organisations à travers le monde.

43. NASA Earth Data System – Depuis 1994, les données de la NASA sur les sciences de la Terre sont gratuites et ouvertes à tous les utilisateurs, quel que soit le but recherché. Le site fournit des données en temps quasi-réel provenant d’instruments de mesure à la consonance sympathique, tels que le spectroradiomètre imageur à résolution moyenne ou le sondeur infrarouge atmosphérique. Splendide.

44. FiveThirthyEight – FiveThirtyEight utilise des données concrètes et des analyses statistiques pour raconter des histoires sur la politique, le sport, l’économie et la culture. Par souci de transparence, ils partagent les données utilisées dans leurs articles.

45. Google Public Data– Il s’agit plutôt d’un moteur de recherche pour les données.

46. Kaggle – Une communauté de science des données qui partage régulièrement des ensembles de données sur les sujets et les catégories les plus variés, y compris des jeux des données sur les joueurs de FIFA19, des critiques de vin ou des images de radiographie thoracique.

47. Pew Internet – Le Pew Research Center est un groupe de réflexion non partisan qui rassemble les sources de données les plus diverses. Ils proposent gratuitement les résultats de leurs propres recherches et analyses, mais seulement deux ans après la publication des rapports.

48. Reddit – Jeux de données – Un subreddit pour les jeux de données. Voici quelques-uns des jeux de données les plus importants de l’année écoulée : 480 000 critiques de Rotten Tomato, le jeu de données de l’UC Berkeley sur la conduite autonome et 1 340 critiques de grains de café.

49. Reeep Data– Jeux de données sur l’énergie propre utilisables gratuitement, y compris concernant les acteurs, les documents sur les résultats des projets, les rapports sur les politiques nationales et plus de 3 000 termes relatifs à l’énergie propre.

50. USDA – Composition des aliments – Le ministère américain de l’agriculture fournit des données sur la composition et les valeurs nutritives de différents aliments.

Utilisez à bon escient ces jeux de données intéressants

Les bonnes données présentées de la bonne manière peuvent faire la différence entre un projet de visualisation de données ordinaire et un projet génial.

Certaines publications, comme l’Economist Intelligence Unit ou Bellingcat, ont bâti leur réputation sur leur utilisation intensive des données et des jeux de données dans leurs rapports. Et si vous n’avez pas besoin d’aller aussi loin qu’eux ou que leurs data scientists, vous pouvez certainement apprendre d’eux pour vos projets de traitement de données.

Rendez votre traitement de données intéressant et compréhensible

Que vous souhaitiez utiliser vos propres données ou des données accessibles au public (à partir des sources ci-dessus) pour vos projets de visualisation de données, assurez-vous de procéder de façon à ce que d’autres personnes puissent comprendre et en tirer des enseignements. Un jeu de données n’est utile que si vous parvenez à le présenter d’une manière digeste pour votre public.

Comment réussir votre projet de visualisation de données

Qu’il s’agisse d’un projet scolaire traitant d’un jeu de données ou d’un projet de science des données et/ou d’un portefeuille de science des données, vous devez d’abord faire des recherches et explorer les données.

Une fois déterminé votre objectif, concentrez-vous sur le message que vous voulez faire passer, utilisez un design simple et visualisez vos données de manière à ce qu’elles soient faciles à comprendre.

Comment commencer à transformer votre jeu de données en un visuel

Jetez un coup d’œil à ces modèles gratuits avec lesquels vous pourrez commencer à créer vos propres visuels en utilisant des données provenant de jeux de données crédibles. Le créateur d’infographies gratuit de Piktochart vous permet de visualiser facilement des données sous forme de superbes visuels.

Des données présentées de manière appropriée peuvent faire la différence entre une présentation médiocre et une présentation exceptionnelle.

Certaines publications, comme l’Economist Intelligence Unit ou Bellingcat, ont bâti leur réputation sur l’utilisation intensive des données dans leurs rapports. Et si vous n’avez pas besoin d’aller aussi loin qu’eux, vous pouvez certainement apprendre d’eux.

Si vous utilisez des données dans vos projets, assurez-vous de le faire d’une manière compréhensible pour les autres. Concentrez-vous sur le message que vous voulez faire passer, utilisez un design simple et visualisez vos données de manière à ce qu’elles soient faciles à comprendre. Jetez un coup d’œil à ces modèles gratuits que vous pouvez utiliser pour créer vos propres visuels à l’aide de données.

Ai Ching
Ai Ching Goh