50 data set interessanti per trovare i dati che ti servono

August 29, 2024

Che si tratti di un progetto scientifico, della creazione di un’infografica o di una presentazione, i dati rendono tutto più interessante.

Ma raccogliere dati interessanti fa venire voglia di strapparsi i capelli e non tutti hanno le risorse per raccogliere dati su larga scala.

Fortunatamente, ci sono abbastanza persone in questo mondo che credono che i dati e i data set debbano essere condivisi il più possibile e hanno creato ampie risorse per semplificare le cose.

Dove posso trovare data set gratuiti?

Fortunatamente, ci sono abbastanza persone in questo mondo che credono che i dati debbano essere condivisi il più possibile e hanno creato ampie risorse per semplificare le cose.

Abbiamo setacciato Internet e trovato 500 i data set più interessanti in circolazione. Per essere brevi e chiari, eccone 50 per iniziare.

Per facilitarvi il compito, abbiamo suddiviso gli esempi di dataset in un paio di categorie. È possibile saltare la ricerca del dataset su Google e fare clic sui link sottostanti per passare rapidamente alla sezione preferita.

Prima di scavare a fondo nelle fonti, se si desidera creare visualizzazioni con i dati, registratevi per un account Piktochart. È possibile iniziare gratuitamente e utilizzare uno dei modelli di infografiche, relazioni, poster, brochure o presentazioni per semplificare il lavoro.

Data set sulle imprese e sull’occupazione

data scientist che utilizzano data set aziendali e occupazionali per visualizzare i dati

1. Crunchbase – Trova informazioni commerciali su aziende private e pubbliche. È possibile verificare il numero di investimenti, l’identità dei soci fondatori e l’eventuale presenza di fusioni o acquisizioni.

2. Ricerca Glassdoor – Glassdoor offre dati relativi all’occupazione. È possibile, ad esempio, capire quanto si può risparmiare mantenendo i dipendenti.

3. Aziende aperte – Open Corporates è il più grande database aperto di aziende e dati aziendali al mondo. Utilizzate da banche e governi, le aziende Open sono orgogliose di avere i dati più precisi.

Data set su criminalità/conflitti/droga

4. Rapporto uniforme sulla criminalità dell’FBI – L’Uniform Crime Reporting raccoglie i rapporti statistici sui crimini, le pubblicazioni e i dati di migliaia di città, università, Stati e agenzie federali di polizia.

5. Programma di dati sui conflitti di Uppsala – L’Uppsala Conflict Data Program (UCDP) fornisce dati sulla criminalità organizzata e sulle guerre civili nel mondo.

6. Istituto nazionale sull’abuso di droghe – Il National Institute on Drug Abuse (NIDA) monitora la prevalenza e le tendenze dell’abuso di droga negli Stati Uniti.

agenti di polizia che trasmettono dati in streaming

Data set Internet

7. DBpedia – DBpedia mira a rendere le informazioni di Wikipedia facilmente ricercabili tramite query SPARQL o scaricando direttamente le informazioni. Ad esempio, è possibile cercare i giocatori NBA nati negli anni ’80 in città con più di 1 milione di abitanti.

8. Google Trends – Google Trends consente di osservare ciò che accade nel mondo. Fornisce dati su ciò che sta diventando popolare e su quanto le persone cercano un particolare termine, rendendolo utile per l’analisi dei dati esplorativi.

9. API di Instagram – Facebook consente di utilizzare l’API di Instagram per accedere rapidamente a commenti, metadati e metriche.

Cosa distingue un’infografica? Questo white paper creato da Piktochart e HubSpot rivela l’anatomia di un’infografica vincente. Scaricatelo gratuitamente.

esempio di dati di spesa personale da data set internet

Data set finanziari

Se cercate dati economici e finanziari, non cercate altro che queste fonti principali che ospitano una pletora di serie storiche di dati.

dati sui prezzi delle azioni e indicatori economici attraverso data set finanziari

10. Comtrade – data set ufficiali sul commercio di beni e servizi gestiti dal database COMTRADE delle Nazioni Unite. Sono disponibili strumenti di visualizzazione dei dati, un’API e altri strumenti di estrazione.

11. Datahub – Mercato azionario – Dai prezzi dell’oro alle quotazioni del NASDAQ e alle società dello S&P 500, troverete tutto su datahub.io.

12. Dati finanziari globali – Global Financial Data offre esattamente quello che dice la scatola: dati sulle finanze del mondo. Spazia dai dati immobiliari e macro globali ai dati di mercato.

13. Dati FMI – Il FMI, o Fondo Monetario Internazionale, è un’organizzazione che mira a promuovere la collaborazione monetaria tra i Paesi. È possibile trovare dati sul commercio, sulle finanze pubbliche e sullo sviluppo finanziario.

14. L’Atlante della complessità economica – L’Atlante della complessità economica fornisce dati sulle dinamiche del commercio globale nel tempo. Volete sapere il numero di prodotti tessili che la Cina ha esportato in Corea del Sud? Facile.

15. Banca Mondiale – La Banca Mondiale non solo fornisce dati finanziari sui Paesi, ma anche dati sull’istruzione e sulla salute.

16. Dati del Financial Times – Qui troverete numeri freddi e concreti sui diversi mercati del mondo. I dati includono le fluttuazioni delle valute, i tassi di rendimento delle obbligazioni e i prezzi delle materie prime.

Data set sanitari

17. Centri per il controllo delle malattie (CDC) – Il CDC fornisce dati quantitativi su un’ampia gamma di argomenti legati alla salute, come il diabete, l’aspettativa di vita, il cancro e l’obesità. Forniscono inoltre altre risorse da utilizzare per reperire ulteriori dati.

18. Enigma Pubblico – salute – Enigma Public si definisce “la più ampia raccolta di dati pubblici al mondo”. Il sito, per lo più incentrato sugli Stati Uniti, fornisce dati sui focolai di origine alimentare, sulla spesa per i farmaci Medicare e sull’OSHA. Fornisce anche dati su altri argomenti come i trasporti e l’immigrazione.

19. Dati sulla salute – Portale sulla salute con oltre 3.000 preziosi set di dati sull’epidemiologia e le statistiche sulla popolazione, gestito dal Dipartimento della Salute e dei Servizi Umani degli Stati Uniti. API disponibile.

20. NHS Digital – Fornisce dati sul sistema di assistenza sanitaria e sociale nel Regno Unito. Volete sapere quali sono i farmaci prescritti dai medici nel Regno Unito? Ora potete scoprirlo.

21. Amministrazione statunitense per gli alimenti e i farmaci – L’FDA fornisce dati sui farmaci attualmente approvati negli Stati Uniti. I dati vengono aggiornati ogni settimana. Potreste dover rispolverare le vostre conoscenze di Excel, poiché i dati sono disponibili solo in formato database o CSV.

22. Organizzazione Mondiale della Sanità – Come suggerisce il nome, l’OMS fornisce dati su diversi temi legati alla salute. Si va dalla sicurezza stradale, all’acqua e ai servizi igienici, fino alla salute mentale.

indicatori di malattia cronica set di dati sanitari

Data set sull’intrattenimento

23. BFI – Film per sempre – Qui si possono trovare dati sull’industria cinematografica nel Regno Unito. È possibile trovare dati su come un film ha influenzato la cultura del Regno Unito e su quanto Avengers: Endgame ha reso irrilevante ogni altro film nella settimana in cui è uscito.

24. Dati sul calcio – Volete sapere chi era l’arbitro in una particolare partita di calcio (o di calcetto, a seconda di dove siete) in Scozia? Beh, siete fortunati. I dati sul calcio forniscono proprio questo e molto di più. Il sito è fortemente incentrato sulle scommesse, ma è possibile trovare molte informazioni sulle partite di calcio passate.

25. Statista – Videogiochi – Il sotto-catalogo di Statista, dove è possibile trovare statistiche, fatti e dati di mercato sull’industria dei videogiochi in tutto il mondo, come il numero di giochi e i ricavi del gioco.

Data set governativi

26. Catalogo del governo australiano – Come si potrebbe intuire leggendo il nome, questo data set è incentrato sul governo australiano. È possibile trovare dati sulla qualità del suolo, sulla vita marina o sulla pianificazione ambientale.

27. Data.gov – La controparte statunitense dell’AGC. Tanti e tanti dati su circa 14 argomenti diversi. Dall’agricoltura, alla sicurezza pubblica, all’amministrazione locale. I data set sono più vecchi, ma ancora accurati e di buon utilizzo.

28. Data.gov.uk – Con oltre 50.000 data set, non avrete problemi a trovare ciò che vi serve sapere sul governo del Regno Unito.

29. data.europa.eu – Portale di dati aperti della Commissione europea e di altre istituzioni dell’Unione europea, con oltre 14.000 set di dati su energia, agricoltura ed economia.

30. Archivio dati di Londra – Dati sulla vita a Londra. Volete sapere quanto è aumentata la popolazione in cinque anni? O forse volete sapere quanti turisti hanno avuto rispetto allo scorso trimestre? Si trova nel datastore di Londra.

31. Open data di New York – Se Londra non fa per voi, potete consultare i dati relativi alla città di New York. È possibile trovare dati sulla corruzione, sulle elezioni e sui media.

32. Open data in Canada – Il portale ufficiale del governo che condivide le serie di dati pubblici in Canada. Come il catalogo del governo australiano e Data.gov.

33. Servizio dati del Regno Unito – La visione dell’UK Data Service è quella di “rafforzare la società e migliorare la vita delle persone informando la ricerca di qualità attraverso la liberazione del potere dei dati”. Collaborano con diverse istituzioni e agenzie per raccogliere dati su un’ampia gamma di argomenti.

Data set sul trasporto

34. Ufficio nazionale viaggi e turismo – Il sito potrebbe sembrare realizzato negli anni ’90, ma fa un buon lavoro nel fornire dati sul turismo internazionale negli Stati Uniti.

35. Dati sulle corse dei taxi di New York – Qui potete trovare dati dettagliati della NYC Taxi and Limousine Commission. I dati comprendono le date e gli orari di prelievo e di consegna, le località di prelievo e di consegna, le distanze percorse, le tariffe dettagliate, i tipi di tariffa, i tipi di pagamento e i conteggi dei passeggeri dichiarati dagli autisti.

36. Statista – Viaggi – Qui si trovano dati su diversi argomenti legati al turismo, come hotel, destinazioni turistiche e altro ancora.

37. Associazione turistica statunitense – La U.S. Travel Association è un’organizzazione no-profit che rappresenta tutte le componenti dell’industria dei viaggi e fornisce dati di ricerca di alta qualità su turismo e trasporti.

Data set meteo e ambientali

38. Clima in Africa – Dati sull’ambiente e sui cambiamenti climatici nei Paesi africani, riportati dalle principali organizzazioni internazionali come la Banca Mondiale, l’OMS e il Fondo Globale.

39. Open AQ – La missione di Open AQ è combattere l’inquinamento atmosferico. Aggregano dati fisici sulla qualità dell’aria provenienti da fonti di dati pubbliche fornite dal governo, da fonti di ricerca e da altre fonti.

40. Weather.gov – Fornisce dati meteo, idrici e climatici, previsioni e avvisi per la protezione della vita e il miglioramento dell’economia nazionale. Questa fonte fornisce dati meteorologici storici degli Stati Uniti.

Data set vari

articoli interessanti sui dati e fonti per trovare data set

41. Amazon AWS – Amazon fornisce un registro aperto di tutti i dati aperti su AWS. Dalle immagini satellitari ai dati web crawl e IRS.

42. Data.World – Biologia – Qui si possono trovare dati aperti sulla biologia forniti da migliaia di utenti e organizzazioni in tutto il mondo.

43. Sistema di dati terrestri della NASA – Dal 1994, i dati della NASA relativi alle scienze della Terra sono gratuiti e aperti a tutti gli utenti per qualsiasi scopo. Fornisce dati in tempo quasi reale provenienti da strumenti di misurazione dal suono fresco, come uno spettroradiometro di immagini a risoluzione moderata o un rilevatore di infrarossi atmosferici. Neat.

44. FiveThirthyEight – FiveThirtyEight utilizza dati concreti e analisi statistiche per raccontare storie di politica, sport, economia e cultura. In nome della trasparenza, condividono i dati utilizzati nei loro articoli.

45. Dati pubblici di Google – Più che altro è un motore di ricerca per i dati.

46. Kaggle – Una comunità di scienza dei dati che condivide regolarmente set di dati sui più svariati argomenti e categorie, tra cui il set di dati completo dei giocatori di FIFA19, le recensioni di vini o le immagini delle radiografie del torace.

47. Pew Internet – Il Pew Research Center è un centro di ricerca apartitico che aggrega le più svariate fonti di dati. Offrono inoltre gratuitamente i risultati delle ricerche e delle analisi dei propri sondaggi, ma solo due anni dopo la pubblicazione dei rapporti.

48. Reddit – Data set – Un subreddit per i dataset. Tra i più importanti dell’anno scorso ci sono: 480.000 recensioni dei critici di Rotten Tomato, il set di dati della UC Berkeley sulla guida autonoma e 1.340 recensioni di chicchi di caffè.

49. Reeep Data– Data set gratuiti sull’energia pulita che comprendono attori, documenti sui risultati dei progetti, rapporti sulle politiche nazionali e oltre 3.000 termini sull’energia pulita.

50. USDA – Composizione degli alimenti – Il Dipartimento dell’Agricoltura degli Stati Uniti fornisce dati sulla composizione e sui valori nutritivi di diversi alimenti.

Utilizzate al meglio questi data set interessanti

I dati giusti presentati nel modo giusto possono fare la differenza tra un tipico progetto di visualizzazione dei dati e uno straordinario.

Alcune pubblicazioni, come l’Economist Intelligence Unit o Bellingcat, hanno costruito la loro intera reputazione sul grande uso di dati e insiemi di dati nelle relazioni. E anche se non è necessario spingersi fino a loro o ai loro data scientist, si può certamente imparare da loro per i propri progetti di elaborazione dati.

Rendere interessanti e comprensibili i risultati del vostro data set

Sia che vogliate usare i vostri dati personali, sia che vogliate usare dati accessibili pubblicamente (dalle fonti di cui sopra) per i vostri progetti di visualizzazione dei dati, assicuratevi di farlo in un modo che gli altri possano capire e imparare. Un data set è utile solo se si riesce a presentarlo in modo che sia digeribile per il pubblico.

Come perfezionare il progetto di visualizzazione dei dati

Che si tratti di un progetto scolastico su un data set o di un progetto di scienza dei dati e/o di un portfolio di scienza dei dati, è necessario innanzitutto fare ricerca ed esplorare i dati.

Una volta individuato il vostro obiettivo, concentratevi sull’unico punto che volete trasmettere, utilizzate un design semplice e visualizzate i dati in modo da renderli facilmente comprensibili.

Come iniziare a trasformare il data set in una visualizzazione

Date un’occhiata a questi modelli gratuiti da cui partire per creare le vostre visualizzazioni utilizzando dati estratti da data set credibili. Lo strumento di creazione infografiche gratuito Piktochart consente di visualizzare facilmente i dati in splendide immagini.

I dati presentati nel modo giusto possono fare la differenza tra una presentazione mediocre e una straordinaria.

Alcune pubblicazioni, come l’Economist Intelligence Unit o Bellingcat, hanno costruito la loro intera reputazione sul grande uso dei dati nelle relazioni. E anche se non è necessario arrivare a tanto, si può certamente imparare da loro.

Se dovete usare i dati nei vostri progetti, assicuratevi di farlo in modo comprensibile per gli altri. Concentratevi su un singolo punto che volete trasmettere, utilizzate un design semplice e visualizzate i dati in modo da renderli facilmente comprensibili. Date un’occhiata a questi modelli gratuiti da cui partire per creare le vostre immagini utilizzando i dati.

Ai Ching
Ai Ching Goh