Una Web de Datos Eficiente
En los próximos años, veremos una revolución en la capacidad de las máquinas para acceder, procesar y aplicar la información. Esta revolución surgirá de tres áreas de actividad relacionadas con la Web Semántica: la Red de Datos, la Red de Servicios, y la Red de Proveedores de Identidad. Estas redes tienen por objeto hacer accesible el conocimiento semántico de los datos, servicios semánticos disponibles, y conocimientos de las personas procesables, respectivamente. Veamos la primera de estas Webs (de datos) y cómo hacer la información accesible a los ordenadores que transforman la forma en que encontrar información.
Ordenadores más inteligentes
La cantidad de información y servicios disponibles está creciendo exponencialmente. Cada día es más difícil encontrar la información que realmente se busca. Sin embargo, tenemos que aprender a pedir lo que queremos a los ordenadores. ¿Por qué no puede un ordenador comprender qué página web, que entrada de Twitter, fotos de Flickr, mensaje de Facebook, o qué restaurante estamos buscando?
Porque no pueden. No entienden. No tienen acceso a la mayoría de las fuentes. Carecen de la comprensión semántica y el sentido común para construir puentes entre la información.
Es fundamental que las máquinas ganen un nuevo nivel de entendimiento. En lugar de computar estadísticamente cómo un término de búsqueda coincide con un documento, una máquina, literalmente, deben ser capaces de entender. Por lo tanto, las bases de datos vinculados, conocimientos, son necesarias para este nuevo nivel de informática. Ejemplos de estas bases de conocimiento incluyen:
Una enciclopedia que contenga conocimientos para buscar el significado semántico y el contexto de un determinado término (por ejemplo, entender que Berlín es una ciudad, cuántas personas viven allí, y dónde es, etc), Páginas Amarillas o un servicio de consulta en la gran masa a menudo cambiante y compleja de la información (por ejemplo, una ruta desde París a Berlín en coche, o la temperatura actual de Berlín en grados Celsius), una base de datos de personas para buscar información sobre el perfil, con permisos de usuario, lo que podría mejorar la personalización y las recomendaciones.
La Web de los datos
La idea de la Red de Datos se originó con la Web Semántica. Se intentó resolver el problema de la propia incapacidad de las máquinas para entender las páginas web. Inicialmente, el objetivo de la Web Semántica es clasificar páginas web con un conjunto de atributos y metadatos para que los ordenadores cuenten con categorías para interpretar el texto y ponerlo en algún tipo de contexto. Este planteamiento no tuvo éxito debido a que los códigos eran demasiado complicados para los seres humanos que no tenían antecedentes técnicos.
Estos enfoques tienen en común el esfuerzo por mejorar la accesibilidad de los ordenadores a conocimientos sobre páginas web que fueron diseñados para ser consumidos por los seres humanos. Además, estos sitios contienen una gran cantidad de información que es irrelevante para las máquinas y que debe ser filtrada. Lo que se necesita es una base de conocimientos de las máquinas para una búsqueda “silenciosa” de información.
La idea de la Red de Datos se produjo como resultado de esta limitación y la existencia de un sinnúmero de conjuntos de datos estructurados distribuidos en todo el mundo y que contienen todo tipo de información. Estos conjuntos de datos son propiedad de empresas de esa tendencia para que sean accesibles. Normalmente, un conjunto de datos contiene los conocimientos sobre un dominio particular, como libros, música, datos enciclopédicos, las empresas, es el nombre. Si estos conjuntos de datos están interconectados una máquina podría atravesar esta web independientes de modo silencioso, estructurándose para recoger información semántica arbitraria. El resultado sería una masiva, libremente accesible base de conocimientos que formarían la base de una nueva generación de aplicaciones y servicios.
Sin comentarios »
Aún no hay comentarios.
Suscríbete a los comentarios de este artículo por RSS.
Deja un comentario
Debes estar identificado para comentar.