Bienvenido

¿Web Semántica?

Imaginemos internet como una enorme biblioteca llena de información. Sus pasillos guardan estantes repletos; sus escaleras, sótanos, anexos y cuartos secretos son infinitos y sus caminos retorcidos. Una vida humana no alcanza a recorrer dicha biblioteca, no digamos leer toda la información. Así pues, nuestra biblioteca no es más que un almacén que no permite consultar nada porque todo es un perpetuo desorden: se guarda tanto información verídica, como falsa o superflua.

Sin embargo, para tratar de resolver este problema existe una serie de bibliotecarios capaces de localizar cualquier fragmento de información que se les solicite en cualquier libro, en cualquier estante, en cualquier piso. Así, si nosotros preguntamos a un bibliotecario-buscador la palabra "perro", él nos dirá al instante en dónde se encuentra escrita y en cada libro en la que aparece. Aunque estos buscadores son de gran ayuda, no resuelven el problema del todo; pues la palabra "perro" aparece en todos los contextos imaginables, incluso en aquellos que no son relevantes para nuestra búsqueda. Por ejemplo, digamos que necesitamos saber sobre la anatomía del perro; luego de la búsqueda tendríamos que descartar indicaciones impertinentes del bibliotecario-buscador, tales como una novela en la que a un personaje le llaman "perro" , o una asociación Protectora de Especies Raras, Robustas y Omnívoras cuyas siglas son P.E.R.R.O, entre muchas otras cosas. "Entonces mejor preguntar por 'perro+anatomía'", se me dirá. Ojalá fuera tan simple: la biblioteca es tan inmensa, que no importa cuánto especifique mi solicitud, pues habrá miles de resultados que no son relevantes y que, por el contrario, son falsos u ociosos.

Esta biblioteca, pues, es un logro incalculable; pero la información que contiene es tanta, y tan diversa, que su funcionalidad es limitada. Ahora bien, supongamos que de pronto se implementa una nueva política en la biblioteca: "de ahora en adelante", se dice, "los libros se ordenarán, los estantes ya no serán arbitrarios, los pisos no contendrán cualquier tipo de información". Sin duda, este proyecto sería un gran avance para los que consultan la biblioteca. Las búsquedas se simplifican, pues si yo pregunto por la "anatomía del perro" el bibliotecario-buscador sabrá que no debe mandarme al piso de literatura ni al estante de pediatría.

Este cambio tan radical implica que el orden de los libros tiene una estructura identificable y concreta, que el bibliotecario-buscador puede entender lo que digo, no sólo en términos literales, sino en el significado de mis búsquedas. Si este sistema se implementa, la biblioteca potenciará su beneficio muchas veces y pasaría de ser un almacén de información confusa a un edificio ordenado con acceso a cada segmento de conocimiento que queramos alcanzar. Pues bien, algo así es la propuesta de la Web Semántica o Web 3.0.

El internet tiene un impacto brutal en la sociedad de nuestros días, pues se define por su injerencia en muchos aspectos de la vida moderna. Ya sea aprovechando servicios gubernamentales en línea, comprando cosas o divirtiéndonos, el internet se ha convertido en una herramienta de amplia utilidad y alcance. Puede definirse desde distintos ángulos: el físico, el social o el cultural; pero ninguno da cuenta completa de lo que realmente significa para nosotros. Se le puede entender, en primera instancia, como un gran canal de comunicación, un espacio libre y anárquico que es flexible y que permite la creatividad desde muchos puntos de vista. Su desarrollo promete muchas más ventajas, y en ese campo precisamente se incluye a la Web Semántica.

Desde sus inicios, la web se proponía abrir un espacio creativo para compartir información y crear un lenguaje común. Sin embargo, la tecnología actual no permite que dicho objetivo se lleve a cabo por completo. El estado actual (denominado Web Sintáctica o Web 2.0) está basado en datos o en información en bruto. Las dimensiones que ha alcanzado hacen difícil el acceso a la información de manera precisa, pues utilizar un motor de búsqueda genera montones de datos que no corresponden con lo que queremos hallar y, además, éstos no siempre se encuentran estructurados de modo claro. Si bien, en un principio, las capacidades humanas podían discriminar de manera óptima los datos arrojados por un buscador, las crecientes dimensiones de la red han hecho que ese procedimiento, por sí solo, sea imposible. De esta forma, la Web sintáctica produce sitios que generan información a partir del texto libre, pero que no precisa las interconexiones significativas con el total de la red, lo cual propicia que cada sitio sea una "isla".

Para responder a este problema, la Web Semántica se propone ser una web extendida que genere categorías a la información con las cuales la red se intercomunica y que la disposición sea más efectiva. Estas categorías son llamadas "anotaciones", es decir, datos que se encuentran en un nivel diferente respecto al resto de la información. Si regresamos al ejemplo del principio, diríamos que la búsqueda en la biblioteca se mejoraría si "perro" y "anatomía" fueran anotaciones estructurales que se encuentran organizadas de una manera más compleja y, por lo tanto, mejor lograda para su localización. La caracterización de los sitios y la información a partir de estructuras de este tipo es lo que en informática se llama ontología. En concreto, una ontología no es una etiqueta, sino un conjunto de anotaciones que semánticamente describen un área del conocimiento. Las ontologías están pensadas para ser entendidas tanto por usuarios humanos como por computadoras, es decir, van más allá del lenguaje. En términos de una gran biblioteca virtual, una ontología sería el orden reconocible en el que están los libros. Una estructura, pues, que guarda significado y que puede ser expresada en cualquier lengua. Las anotaciones serían los nombres de los estantes que acompañan cada parte de dicha estructura. No se trata de poner etiquetas, propiamente, sino de construir estructuras que reconozcan las categorías en un lenguaje universal, pleno de significado. En suma, se trata de llenar a la red de semántica, de significados, antes que de palabras. Con ello, no sólo la comunicación entre usuario y máquina se mejora, sino también la existente entre máquina y máquina mediante la construcción de lenguajes informáticos que soporten dichas ontologías y que puedan ser traducibles a cualquier lengua natural. Es decir, nuestras búsquedas pueden ser hechas en español, inglés, francés o japonés, y siempre tendremos información pertinente expresada en diversos idiomas.

Esto impulsaría enormemente el desarrollo de nuestra gran biblioteca llamada internet. El ejemplo que dimos al principio tiene sus limitantes, sin embargo, la Web semántica no se resume solamente como la búsqueda de información, sino que también hace más efectiva la prestación de servicios. Cuestiones como el gobierno, el comercio, la enseñanza, la cultura y el turismo electrónicos también se benefician de esta estructura unificada semánticamente. Para decirlo de otra manera, bajo una Web Semántica, los sistemas de información se vuelven compatibles y la prestación de servicios de los cuales echa mano se optimiza.

Un ejemplo interesante es la Web Social Semántica. La red en general se define por un vínculo de intercambio de información; en su dimensión social, la web implica la interconexión, no de documentos, sino de personas u organizaciones. Un primer ejemplo de red social semántica sería el de contar con la posibilidad de localizar personas que se necesitan de acuerdo con sus capacidades laborales y conocimiento de manera más global y completa. Finalmente se trata de crear un espacio social virtual, hacer de internet una plaza pública. Para ello es necesario definir la participación de las personas y la interacción social de una manera compleja y estructurada, y también de una manera semántica. Las posibilidades en este caso son múltiples, pues se puede crear un mensaje que llegará a personas a las que les interesa de manera directa, lo cual tendría un impacto social.

Para terminar, hay que mencionar que la Web Semántica es muy prometedora dentro del campo de las ciencias computacionales y que el interés que hay en ella es muy grande. Entre otras cosas, esto se debe a que su desarrollo abarca muchas disciplinas como la inteligencia artificial, las tecnologías web y la ingeniería de software. Ahora cabe preguntarnos con los nuevos desarrollos tecnológicos, ¿a dónde nos llevará la red y qué impacto tendrá en nuestras vidas?

 

México, DF, Noviembre 2010


Nota: este artículo fue redactado por Fernando Barajas, con base en la investigación Web Semántica y ontologías de dominio. Un enfoque para la organización y gestión de recursos gubernamentales, cuya responsable es la Dra. Carolina Medina Ramírez, quien colabora en proyectos de investigación aplicada del Fondo de Información y Documentación para la Industria (Infotec).

Artículos de Divulgación Infotec
Serie 2: Temas de Web Semántica
Artículo número: 1 | Noviembre 2010

Artículo siguiente

Descarga

Artículo para descarga en pdf: Artículo: ¿Web Semántica?

Artículos de Divulgación Infotec

Autores

Reyna Carolina Medina-Ramírez
cmed@xanum.mx

Doctora en Informática por la Universidad de Nice Sophia-Antipolis, Francia. Su tesis doctoral titulada "Contribución a la búsqueda semántica de información: capitalización de conocimientos en una memoria de interacciones genéticas", fue realizada en el Instituto Nacional de Investigación en Informática y Automatización (INRIA) Sophia Antipolis, Francia. La Dra. Medina realizó una estancia posdoctoral en la Escuela Superior de Ciencias Informáticas (ahora École Polytechnique Universitaire), Francia sobre el tema "Mecanismos para la capitalización y la difusión de conocimientos en una memoria de proyecto". Tiene el reconocimiento "profesor de Tiempo Completo con Perfil Deseable" otorgado por la SEP-PROMEP.

Contenidos relacionados

Si te interesó el artículo, también puedes consultar:

Licencia Creative Commons

Esta obra está sujeta a la licencia Atributo - No comercial - Sin obras derivadas 2.5 México de Creative Commons. Puede copiarla, distribuirla y comunicarla públicamente siempre que cite a su redactor, autor y la institución que la publican (Infotec), no la utilice para fines comerciales ni haga con ella obras derivadas. La licencia completa se puede consultar en: http://creativecommons.org/licenses/by-nc-nd/2.5/mx/

Última actualización: Friday, May 6, 2011  por mdetic evaluador1.

Acerca de Infotec

Servicios

Soluciones integrales

Formación de capital humano

Investigación

Transparencia

Llama sin costo
01 800 2012-353

Conmutador+52 (55) 5624-2800

e-mailinfotec@infotec.com.mx

Twitter@InfotecMexico

MAAGTIC | Normateca Interna | Resultados de Evaluaciones y Auditorías | Órgano Interno de Control | Unidad de Enlace