50 interessante Datensätze, um Daten zu finden

März 27, 2024

Ob Sie ein wissenschaftliches Projekt durchführen, eine Infografik erstellen oder eine Präsentation halten: Daten machen alles interessanter.

Das Sammeln interessanter Daten ist zum Haareraufen und nicht jeder hat die Ressourcen, um Daten in großem Umfang zu sammeln.

Zum Glück gibt es genügend Menschen, die der Meinung sind, dass Daten und Datensätze so weit wie möglich gemeinsam genutzt werden sollten. Jene Menschen haben eine Fülle von Ressourcen geschaffen, die uns zu Gute kommen.

Wo kann ich kostenlose Datensätze finden?

Zum Glück gibt es genügend Menschen, die der Meinung sind, dass Daten und Datensätze so weit wie möglich gemeinsam genutzt werden sollten. Jene Menschen haben eine Fülle von Ressourcen geschaffen, die uns zu Gute kommen.

Wir haben das Internet durchforstet und 500 der interessantesten Datensätze gefunden, die es gibt. Kurz: Hier sind 50 Datensätze, die Ihnen den Einstieg erleichtern.

Um es Ihnen leichter zu machen, haben wir die Datensätze in mehrere Kategorien unterteilt. Sie können die Google-Datensatzsuche überspringen und auf die unten stehenden Links klicken, um schnell zu dem von Ihnen gewünschten Abschnitt zu gelangen.

Bevor Sie sich mit den Quellen beschäftigen, noch ein Hinweis: Wenn Sie mit Ihren Daten Grafiken erstellen möchten, melden Sie sich für ein Piktochart-Konto an. Der Einstieg ist kostenlos, und Sie können eine der Infografiken, Berichte, Poster, Broschüren oder Präsentationsvorlagen verwenden, um sich den Einstieg zu erleichtern.

Datensätze für Unternehmen und Beschäftigung

Datenwissenschaftler, die Unternehmens- und Beschäftigungsdatensätze zur Visualisierung von Daten verwenden

1. Crunchbase – Finden Sie Geschäftsinformationen über private und öffentliche Unternehmen. Sie können nachsehen, wie viele Beteiligungen sie hatten, wer die Gründungsmitglieder waren und ob es Fusionen oder Übernahmen gab.

2. Glassdoor Research – Glassdoor bietet Daten zum Thema Beschäftigung. So können Sie zum Beispiel herausfinden, wie viel Sie durch die Weiterbeschäftigung von Mitarbeitern einsparen können.

3. Open Corporates – Open Corporates ist die weltweit größte offene Datenbank für Unternehmen und Unternehmensdaten. Open Corporates, das von Banken und Regierungen genutzt wird, ist stolz darauf, über die genauesten Daten zu verfügen.

Datensätze zu Verbrechen/Konflikten/Drogen

4. FBI Uniform Crime Reporting – Das Uniform Crime Reporting stellt statistische Verbrechensberichte, Veröffentlichungen und Datenpunkte von Tausenden von Städten, Universitäten, Bundesstaaten und Bundesvollzugsbehörden zusammen.

5. Uppsala-Konfliktdatenprogramm (Uppsala Conflict Data Program) – Das Uppsala Conflict Data Program (UCDP) liefert Daten über organisierte Kriminalität und Bürgerkriege in aller Welt.

6. Nationales Institut für Drogenmissbrauch – Das National Institute on Drug Abuse (NIDA) überwacht die Prävalenz und die Trends des Drogenmissbrauchs in den Vereinigten Staaten.

Polizeibeamte, die Daten streamen

Internet-Datensätze

7. DBpedia – DBpedia zielt darauf ab, die Informationen von Wikipedia über SPARQL-Abfragen oder durch direktes Herunterladen der Informationen leicht durchsuchbar zu machen. Sie können zum Beispiel nach NBA-Spielern suchen, die in den 80er Jahren in Städten mit mehr als 1 Million Einwohnern geboren wurden.

8. Google Trends – Mit Google Trends können Sie sich ansehen, was in der Welt vor sich geht. Es liefert Daten darüber, was populär wird und wie oft nach einem bestimmten Begriff gesucht wird, was für die explorative Datenanalyse nützlich ist.

9. Instagram-API – Facebook ermöglicht es Ihnen, die API von Instagram zu nutzen, um schnell auf Kommentare, Metadaten und Metriken zuzugreifen.

Was zeichnet eine Infografik aus? Dieses von Piktochart und HubSpot erstellte Whitepaper enthüllt die Anatomie einer erfolgreichen Infografik. Kostenlos herunterladen.

Beispiel für persönliche Ausgabendaten aus Internet-Datensätzen

Finanz-Datensätze

Wenn Sie auf der Suche nach Wirtschafts- und Finanzdaten sind, werden Sie bei diesen Top-Quellen fündig, die eine Fülle historischer Datensätze enthalten.

Aktienkursdaten und Wirtschaftsindikatoren durch Finanzdatensätze

10. Comtrade – Offizielle Datensätze zum Waren- und Dienstleistungsverkehr, die von der UN COMTRADE-Datenbank verwaltet werden. Es gibt Datenvisualisierungstools und eine API sowie andere Extraktionstools.

11. Datahub – Aktienmarkt – Von Goldpreisen und NASDAQ-Notierungen bis hin zu S&P 500-Unternehmen finden Sie alles auf datahub.io

12. Globale Finanzdaten – Global Financial Data bietet Ihnen genau das, was der Name verrät: Daten über die Finanzen der Welt. Die Palette reicht von Immobilien- und globalen Makrodaten bis hin zu Marktdaten.

13. IWF-Daten – Der IWF (Internationaler Währungsfonds) ist eine Organisation, die die währungspolitische Zusammenarbeit zwischen den Ländern fördern soll. Sie können Daten über Handel, Staatsfinanzen und finanzielle Entwicklung finden.

14. Der Atlas der wirtschaftlichen Komplexität – Der Atlas der wirtschaftlichen Komplexität liefert Daten über die Dynamik des globalen Handels im Laufe der Zeit. Möchten Sie wissen, wie viele Textilien China nach Südkorea exportiert hat? Kein Problem!

15. Weltbank – Die Weltbank liefert nicht nur Finanzdaten über Länder, sondern auch Daten über Bildung und Gesundheit.

16. Daten der Financial Times – Hier finden Sie kalte, harte Zahlen über die verschiedenen Märkte der Welt. Zu den Daten gehören Währungsschwankungen, Renditesätze von Anleihen und Rohstoffpreise.

Gesundheitsdatensätze

17. Centers for Disease Control (CDC) – Die CDC liefert quantitative Daten zu einer Vielzahl von gesundheitsbezogenen Themen wie Diabetes, Lebenserwartung, Krebs und Fettleibigkeit. Sie bieten auch andere Ressourcen, die Sie nutzen können, um weitere Daten zu finden.

18. Enigma Public – Gesundheit – Enigma Public bezeichnet sich selbst als „die weltweit umfangreichste Sammlung öffentlicher Daten“. Die hauptsächlich auf die USA ausgerichtete Website enthält Daten zu lebensmittelbedingten Krankheitsausbrüchen, Medicare-Medikamentenausgaben und OSHA. Sie enthält auch Daten zu anderen Themen wie Verkehr und Einwanderung.

19. Health Data – Gesundheitsportal mit mehr als 3.000 wertvollen Datensätzen zu Epidemiologie und Bevölkerungsstatistiken, verwaltet vom U.S. Department of Health & Human Services. API verfügbar.

20. NHS Digital – Bietet Daten über das Gesundheits- und Sozialfürsorgesystem im Vereinigten Königreich. Möchten Sie wissen, welche Medikamente von Ärzten im Vereinigten Königreich verschrieben werden? Nun, jetzt können Sie es herausfinden.

21. US Food & Drug Administration – Die FDA stellt Daten darüber zur Verfügung, welche Medikamente derzeit in den USA zugelassen sind. Die Daten werden jede Woche aktualisiert. Möglicherweise müssen Sie Ihre Excel-Kenntnisse auffrischen, da die Daten nur in Datenbank- oder CSV-Form vorliegen.

22. Weltgesundheitsorganisation – Wie der Name schon sagt, stellt die WHO Daten zu verschiedenen gesundheitsbezogenen Themen bereit. Das Spektrum reicht von der Straßenverkehrssicherheit über Wasser und sanitäre Einrichtungen bis hin zur psychischen Gesundheit.

Indikatoren für chronische Krankheiten - Datensatz zum Gesundheitswesen

Datensätze zur Unterhaltung

23. BFI – Film Forever – Hier finden Sie Daten über die Filmindustrie im Vereinigten Königreich. Sie können Daten darüber finden, wie ein Film die britische Kultur beeinflusst hat und wie sehr Avengers: Endgame jeden anderen Film in der Woche, in der er herauskam, irrelevant gemacht hat.

24. Football Data – Möchten Sie wissen, wer der Schiedsrichter bei einem bestimmten Fußballspiel in Schottland war? Nun, Sie haben Glück. Football Data bietet genau das und noch viel mehr. Die Seite ist stark auf Wetten ausgerichtet, aber Sie können auch viele Informationen über vergangene Fußballspiele finden.

25. Statista – Videospiele – Der Unterkatalog von Statista, in dem Sie Statistiken, Fakten und Marktdaten über die Videospielindustrie weltweit finden, wie z.B. die Anzahl der Spiele und die Spieleinnahmen.

Datensätze der Regierung

26. Katalog der australischen Regierung – Wie der Name schon vermuten lässt, konzentriert sich dieser Datensatz auf die australische Regierung. Sie können Daten zur Bodenqualität, zum Meeresleben oder zur Umweltplanung finden.

27. Data.gov – Das US-Pendant des AGC. Unmengen von Daten zu etwa 14 verschiedenen Themen. Von der Landwirtschaft über die öffentliche Sicherheit bis hin zur Kommunalverwaltung. Die Datensätze sind älter, aber immer noch genau und gut zu verwenden.

28. Data.gov.uk – Mit über 50 000 Datensätzen finden Sie problemlos alles, was Sie über die britische Regierung wissen müssen.

29. data.europa.eu – Offenes Datenportal der Europäischen Kommission und anderer Institutionen der Europäischen Union mit über 14.000 Datensätzen zu Energie, Landwirtschaft und Wirtschaft.

30. London Datastore – Daten über das Leben in London. Möchten Sie wissen, um wie viel die Bevölkerung in fünf Jahren gewachsen ist? Oder möchten Sie vielleicht wissen, wie viele Touristen im Vergleich zum letzten Quartal zu verzeichnen waren? Sie finden sie im London Datastore.

31. NYC Open Data – Wenn London nicht Ihr Ding ist, können Sie sich die Daten für New York City ansehen. Sie können Daten über Korruption, Wahlen und Medien finden.

32. Open Data Canada – Das offizielle Portal der kanadischen Regierung zur gemeinsamen Nutzung öffentlicher Datensätze. Ähnlich wie der Australian Government Catalogue und Data.gov.

33. UK Data Service – Die Vision des UK Data Service ist es, „die Gesellschaft zu stärken und das Leben der Menschen zu verbessern, indem wir qualitativ hochwertige Forschung betreiben, indem wir die Macht der Daten freisetzen“. Sie arbeiten mit verschiedenen Institutionen und Behörden zusammen, um Daten zu einer Vielzahl von Themen zu sammeln.

Transport-Datensätze

34. National Travel & Tourism Office– Die Website sieht zwar aus, als wäre sie aus den 90er Jahren, aber sie liefert gute Daten über den internationalen Tourismus in den USA.

35. NYC Taxi Trip Data – Hier finden Sie detaillierte Daten der NYC Taxi and Limousine Commission. Zu den Daten gehören Abhol- und Rückgabedaten/-zeiten, Abhol- und Rückgabeorte, Fahrtentfernungen, Einzelfahrpreise, Tarifarten, Zahlungsarten und vom Fahrer gemeldete Fahrgastzahlen.

36. Statista – Reisen – Hier finden Sie Daten zu verschiedenen tourismusbezogenen Themen wie Hotels, Urlaubsziele und mehr.

37. US Travel Association – Die U.S. Travel Association ist eine gemeinnützige Organisation, die alle Komponenten der Reisebranche vertritt und qualitativ hochwertige Forschungsdaten über Tourismus und Transport bereitstellt.

Wetter & Umwelt Datensätze

38. Afrika Climate– Daten zu Umwelt und Klimawandel in afrikanischen Ländern, die von großen internationalen Organisationen wie der Weltbank, der WHO und dem Global Fund gemeldet werden.

39. Open AQ – Die Aufgabe von Open AQ ist die Bekämpfung der Luftverschmutzung. Sie aggregieren physikalische Luftqualitätsdaten aus öffentlichen Datenquellen, die von der Regierung bereitgestellt werden, sowie aus Forschungsdaten und anderen Quellen.

40. Weather.gov – Liefert Wetter-, Wasser- und Klimadaten, Vorhersagen und Warnungen zum Schutz des Lebens und zur Förderung der nationalen Wirtschaft. Diese Quelle bietet historische Wetterdaten aus den USA.

Verschiedene Datensätze

interessante datengestützte Artikel und Quellen zum Auffinden von Datensätzen

41. Amazon AWS – Amazon bietet ein offenes Register für alle offenen Daten auf AWS. Von Satellitenbildern bis zu Web-Crawl- und IRS-Daten.

42. Data.World – Biologie – Hier finden Sie offene Daten zum Thema Biologie, die von Tausenden von Nutzern und Organisationen aus der ganzen Welt bereitgestellt werden.

43. NASA Earth Data System – Seit 1994 sind die geowissenschaftlichen Daten der NASA kostenlos und stehen allen Nutzern für jeden Zweck offen. Es liefert nahezu in Echtzeit Daten von cool klingenden Messinstrumenten wie einem Moderate Resolution Imaging Spectroradiometer oder einem Atmospheric Infrared Sounder. Neat.

44. FiveThirthyEight – FiveThirtyEight nutzt harte Daten und statistische Analysen, um Geschichten über Politik, Sport, Wirtschaft und Kultur zu erzählen. Im Namen der Transparenz teilen sie die in ihren Artikeln verwendeten Daten.

45. Google Public Data– Eher eine Suchmaschine für Daten.

46. Kaggle – Eine Data-Science-Community, die regelmäßig Datensätze zu den unterschiedlichsten Themen und Kategorien zur Verfügung stellt, darunter den kompletten FIFA19-Spieler-Datensatz, Weinbewertungen oder Röntgenbilder der Brust.

47. Pew Internet – Das Pew Research Center ist ein überparteilicher Fact Tank, der verschiedenste Datenquellen sammelt. Sie bieten auch die Ergebnisse ihrer eigenen Umfrageforschung und -analyse kostenlos an, allerdings erst zwei Jahre nach der Veröffentlichung der Berichte.

48. Reddit – Datensätze – Ein Subreddit für Datensätze. Einige der Spitzenreiter des vergangenen Jahres sind: 480.000 Kritiken zu Rotten Tomato, der Datensatz zum selbstfahrenden Auto der UC Berkeley und 1.340 Bewertungen von Kaffeebohnen.

49. Reeep-Data– Frei verwendbare Datensätze zu sauberer Energie, einschließlich Akteuren, Projektergebnisdokumenten, länderspezifischen Berichten und mehr als 3.000 Begriffen zu sauberer Energie.

50. USDA – Lebensmittelzusammensetzung – Das Landwirtschaftsministerium der Vereinigten Staaten von Amerika stellt Daten über die Zusammensetzung und den Nährstoffgehalt verschiedener Lebensmittel zur Verfügung.

Nutzen Sie diese interessanten Datensätze für sich

Die richtigen Daten auf die richtige Art und Weise präsentiert, können den Unterschied zwischen einem typischen Datenvisualisierungsprojekt und einem erstaunlichen Projekt ausmachen.

Einige Publikationen, wie die Economist Intelligence Unit oder Bellingcat, haben ihren gesamten Ruf auf der Verwendung von Daten und Datensätzen in der Berichterstattung aufgebaut. Und auch wenn Sie nicht so weit gehen müssen wie sie oder ihre Datenwissenschaftler, können Sie für Ihre Datenverarbeitungsprojekte sicherlich von ihnen lernen.

Machen Sie die Ergebnisse Ihres Datensatzes interessant und nachvollziehbar

Unabhängig davon, ob Sie Ihre eigenen persönlichen Daten oder öffentlich zugängliche Daten (aus den oben genannten Quellen) für Ihre Datenvisualisierungsprojekte verwenden möchten: Achten Sie darauf, dass Sie dies auf eine Weise tun, die andere Menschen verstehen und von der sie lernen können. Ein Datensatz ist nur dann nützlich, wenn Sie ihn so präsentieren können, dass er für Ihr Publikum verdaulich ist.

Wie Sie Ihr Datenvisualisierungsprojekt zum Erfolg führen

Unabhängig davon, ob Sie ein Schulprojekt zu einem Datensatz zusammenstellen oder ein Data-Science-Projekt und/oder ein Data-Science-Portfolio vervollständigen, müssen Sie zunächst recherchieren und Daten untersuchen.

Wenn Sie Ihren Schwerpunkt gefunden haben, konzentrieren Sie sich auf den einen Punkt, den Sie vermitteln wollen, verwenden Sie ein einfaches Design und visualisieren Sie Ihre Daten so, dass sie leicht zu verstehen sind.

Erste Schritte zur Umwandlung Ihres Datensatzes in ein Bildmaterial

Werfen Sie einen Blick auf diese kostenlosen Vorlagen, mit denen Sie beginnen können, um Ihre eigenen Visualisierungen mit Daten aus glaubwürdigen Datensätzen zu erstellen. Der kostenlose Infografik-Maker von Piktochart macht es Ihnen leicht, Daten in schönen Grafiken zu visualisieren.

Richtig aufbereitete Daten können den Unterschied zwischen einer mittelmäßigen und einer hervorragenden Präsentation ausmachen.

Einige Publikationen, wie die Economist Intelligence Unit oder Bellingcat, haben ihren gesamten Ruf darauf aufgebaut, dass sie in ihren Berichten in hohem Maße auf Daten zurückgreifen. Und auch wenn Sie nicht so weit gehen müssen wie sie, können Sie sicherlich von ihnen lernen.

Wenn Sie in Ihren Projekten Daten verwenden, sollten Sie darauf achten, dass Sie dies auf eine Weise tun, die andere Menschen verstehen können. Konzentrieren Sie sich auf einen einzigen Punkt, den Sie vermitteln wollen, verwenden Sie ein einfaches Design und stellen Sie Ihre Daten so dar, dass sie leicht zu verstehen sind. Werfen Sie einen Blick auf diese kostenlosen Vorlagen, mit denen Sie beginnen können, um Ihre eigenen Visualisierungen mit Daten zu erstellen.

Ai Ching
Ai Ching Goh