{"id":152,"date":"2009-07-02T17:05:47","date_gmt":"2009-07-02T22:05:47","guid":{"rendered":"http:\/\/blogviejo.sld.cu\/urra\/?p=152"},"modified":"2009-07-02T17:05:47","modified_gmt":"2009-07-02T22:05:47","slug":"nubes-de-etiquetas-e-indizacion-automatica-publicado-en-la-intranet-20061019","status":"publish","type":"post","link":"https:\/\/blogs.sld.cu\/urra\/2009\/07\/02\/nubes-de-etiquetas-e-indizacion-automatica-publicado-en-la-intranet-20061019\/","title":{"rendered":"Nubes de etiquetas e \u00edndizaci\u00f3n autom\u00e1tica (publicado en la INtranet 2006\/10\/19)"},"content":{"rendered":"<p>La <a href=\"http:\/\/www.db.dk\/bh\/lifeboat_ko\/CONCEPTS\/automatic_indexing.htm\" target=\"_self\">indizaci\u00f3n autom\u00e1tica<\/a> aplicando t\u00e9cnicas de extracci\u00f3n de palabras claves a partir de textos completos es una t\u00e9cnica con muchos a\u00f1os de desarrollo. Con el desarrollo de Internet, y m\u00e1s particularmente con el desarrollo de los motores de b\u00fasqueda estas t\u00e9cnicas adquirieron una relevancia muy particular y se han desarrollado mucho.<\/p>\n<p>Cada vez m\u00e1s aparecen soluciones t\u00e9cnicas y servicios que si habl\u00e1ramos en lenguaje cinematogr\u00e1fico se parecer\u00edan a &#8220;remakes&#8221;. Este puede ser el caso de las denominadas &#8220;tag clouds&#8221; o nubes de etiquetas o palabras claves que comienzan a ser comunes en los Blogs y en el Web en general. Claro est\u00e1 que no son exactamente la misma cosa.<\/p>\n<p>Los especialistas en informaci\u00f3n y bibliotecarios pueden recordar un <a href=\"http:\/\/en.wikipedia.org\/wiki\/KWIC\" target=\"_self\">KWIC<\/a> (Key Word in context) creado por <a href=\"http:\/\/en.wikipedia.org\/wiki\/Hans_Peter_Luhn\" target=\"_self\">Hans Peter Luhn<\/a> <sup>1 <\/sup>de IBM en 1958 y sus variantes como el KWOC (Key Word out of Context) y KWAC (Keyword alongside context) que fueron tan utilizados en los primeros tiempos de uso de la computaci\u00f3n para la indizaci\u00f3n autom\u00e1tica. Tambi\u00e9n recordar\u00e1n las denominadas listas de parada o &#8220;stop words lists&#8221; que indicaban las palabras &#8220;negativas&#8221; o exclu\u00edbles de los mencionados \u00edndices. Pues siguiendo esa tradici\u00f3n de \u00edndices se han popularizado las mencionadas nubes que son esencialmente \u00edndices de palabras o t\u00e9rminos clave que se presentan en el contexto de una p\u00e1gina Web y se hiperenlazan con los titulares o textos de noticias y otros contenidos disponibles en la red ya sea por <a href=\"http:\/\/es.wikipedia.org\/wiki\/RSS_%28formato%29\" target=\"_self\">RSS<\/a> u otras modalidades.<\/p>\n<p>A continuaci\u00f3n se muestra un caso en el que se genera de manera autom\u00e1tica una nube de t\u00e9rminos clave extra\u00eddos de la informaci\u00f3n diaria de salud que es accesible por RSS y que adiciona elementos de valor como la ponderaci\u00f3n del peso de las palabras clave en las noticias citadas y los hiperenlaces a las noticias en s\u00ed. Esto se logra incrustando un fragmento de c\u00f3digo que visualiza el \u00edndice que se produce din\u00e1micamente por un servidor que funciona como respaldo o &#8220;back end&#8221; a este servicio. Los autores del sitio generan de esta forma visitas a su sitio y enlaces que le sirven para valorizarlo en el mercado de Internet y obtener ganancias por esta v\u00eda. Lo interesante es el concepto y la versatilidad de las soluciones que se pueden generar en la red, sobre todo con el desarrollo vertiginoso que est\u00e1n teniendo las soluciones tecnol\u00f3gicas que se agrupan en el denominado Web 2.0 ya mencionado anteriormente.<\/p>\n<p>1. Luhn fue uno de los primeros en trabajar muchas de las t\u00e9cnicas b\u00e1sicas que hoy son comunes en las ciencias de la informaci\u00f3n.<\/p>\n<p>A quienes quieran profundizar sobre el tema, especialmente sobre el tratamiento del tema en el Web ver:<\/p>\n<div class=\"description\"><a class=\"taggedlink\" rel=\"nofollow\" href=\"http:\/\/shirky.com\/writings\/ontology_overrated.html\">Shirky: Ontology is Overrated &#8212; Categories, Links, and Tags <\/a>Excelente trabajo sobre los sistemas de clasificaci\u00f3n, las ontolog\u00edas y los sistemas de organizaci\u00f3n de la informaci\u00f3n con especial referencia al mundo digital disponible en <a href=\"http:\/\/shirky.com\/writings\/ontology_overrated.html\" target=\"_self\">http:\/\/shirky.com\/writings\/ontology_overrated.html<\/a><\/div>\n<div class=\"description\">He recuperado esta entrada que hab\u00eda publicado en la Intranet de Infomed\u00a0 porque hay un interesante servicio de creaci\u00f3n din\u00e1mica de \u00edndices KWIC en Internet que muestra el potencial de esta herramienta en el contexto del Web. Ver <a title=\"Generador de \u00edndices KWIC en l\u00ednea\" href=\"http:\/\/www.webcorp.org.uk\/\"> http:\/\/www.webcorp.org.uk\/<\/a><\/div>\n","protected":false},"excerpt":{"rendered":"<p>La indizaci\u00f3n autom\u00e1tica aplicando t\u00e9cnicas de extracci\u00f3n de palabras claves a partir de textos completos es una t\u00e9cnica con muchos a\u00f1os de desarrollo. Con el desarrollo de Internet, y m\u00e1s particularmente con el desarrollo de los motores de b\u00fasqueda estas t\u00e9cnicas adquirieron una relevancia muy particular y se han desarrollado mucho. Cada vez m\u00e1s aparecen [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[20],"tags":[52,53,54],"_links":{"self":[{"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/posts\/152"}],"collection":[{"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/comments?post=152"}],"version-history":[{"count":0,"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/posts\/152\/revisions"}],"wp:attachment":[{"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/media?parent=152"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/categories?post=152"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.sld.cu\/urra\/wp-json\/wp\/v2\/tags?post=152"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}