Google lanza un nuevo buscador, ‘Dataser search’, para aquellos que trabajan con Big Data.La liberación de Dataset Search cubrirá las ciencias medio ambientales y las sociales, los datos gubernamentales y el conjunto de datos de nuevas organizaciones como ProPublica.
Google lanza un servicio llamado “Dataset search”, el cual tiene que ver con Google Scholar, el buscador de documentos y artículos científicos. En este caso el nuevo buscador se enfocará en las instituciones que publican sus datos en línea, como universidades y gobiernos. Se busca se incluya la información de cuándo fue creado el conjunto de datos, de qué tratan estos, cuándo fue publicado, etcétera, es decir, todos los posibles metadatos. Toda esta información será entonces puesta en un índice por Google en el Dataset Search y se combinará con el Google’s Knowledge Graph. Así, si los datos se publican por ejemplo, por el CERN, se incluirán algunos datos de la institución en el resultado de la búsqueda.
Natasha Noy, investigadora en Google AI quien ayudó a crear el buscador, dijo que la meta es la de unificar las decenas de miles de diferentes depósitos de conjuntos de datos en línea. “Queremos hacer que los datos sean usados para nuevos descubrimientos, pero mantener la información del origen de los mismos”, comenta Noy.
Por el momento, la publicación de conjuntos de datos es extremadamente fragmentada. Los diferentes dominios científicos prefieren sus propios depósitos. “Los científicos dicen: ‘Yo sé dónde puedo encontrar mis conjuntos de datos, pero esto no es siempre lo que quiero”, dice Noy. “Una vez que salen de su comunidad única, es cuando las cosas se ponen difíciles”.
La liberación de Dataset Search cubrirá las ciencias medio ambientales y las sociales, los datos gubernamentales y el conjunto de datos de nuevas organizaciones como ProPublica.
Es evidente la importancia que los datos han adquirido en nuestra sociedad. La iniciativa de Google es una de las más interesantes debido a su enfoque. Academia y ciencia serán los primeros agradecidos.