Como bien indica la palabra, un Data Set se trata de una colección de datos que se encuentra habitualmente tabulada.
Algunos profesionales recomiendan comenzar a utilizar estos conjuntos de datos gratuitos para empezar a aprender a analizar datos, crear visualizaciones de datos o simplemente mejorar las habilidades de alfabetización de datos.
UN Data
En esta base de dato se pueden visualizar todos los datos públicos recolectados por las Naciones Unidas.
Worldbank
Esta es la base de datos del Banco Mundial, pero no solo se puede acceder a datos relacionados con la economía de los países. También, poseen otra gran cantidad de datos relacionados con la salud, educación o ciencia y tecnología.
Datos.gob.es
Aquí podemos encontrar todos los datos públicos que recoge nuestro gobierno. La mayoría de los países comparten sus datos, así que también es otra forma de acceder a data sets gratuitos.
Google Public Data
Google no podía faltar en la lista. A través de esta web ofrece los datos que se pueden encontrar en otros data sets, pero no deja de ser interesante buscar algunas veces colecciones de datos aquí.
Awesome Public Datasets
Está dentro de GitHub y a través de esta web puede encontrar un montón de data set que ofrecen otras organizaciones. Hay cualquier tipo de tema desde agricultura hasta neurociencia.
OpenCorporates
Se patrocinan así mismos como el mayor data set de empresas, y podría ser así ya que puedes encontrar datos de cualquier empresa del mundo. Aunque, en esta si es necesario registrarse para acceder a la información.
API de Instagram
Este data set es muy útil sobre todo para los profesionales de marketing, ya que a través de él puedes obtener información de otros usuarios y creadores de Instagram o medir la interacción con el perfil.
Organización Mundial de la Salud
Como muchas otras organizaciones, la OMS también comparte los datos públicos que obtiene de todos los países. Se pueden encontrar datos sobre salud infantil, medicamentos esenciales, covid-19, malaria, etc.
Openap
La misión de Open AQ es luchar contra la contaminación del aire. Por eso, en su web ofrecen un data set de datos físicos de calidad del aire de fuentes de datos públicas proporcionadas por el gobierno y otras fuentes.
FiveThirthyEight
El último, y no por ello menos importante, es FiveThirthyEight. En esta web recogen datos que utilizan para hacer análisis y contar historia, después comparten todos los datos que han recogido para ser totalmente transparentes.