Nuevo Sistema de Búsqueda de Spain.info V1

Tal y como se anuncia en el blog de Spain.info v2, formando parte del proyecto “Sistema de Búsqueda Avanzado de La Sociedad Estatal para la Gestión de la Innovación y las Tecnologí­as Turí­sticas,S.A. (SEGITTUR), Colbenson ha implementado el nuevo buscador del portal www.spain.info. Este es solo el 1er entregable de entre los más de 5 planificados!

El sistema de búsqueda está implementado en modo SaaS (Software as a Service) de forma que la plataforma se encuentra soportada por servidores externos al cliente, delegando la administración y mantenimiento del sistema a expertos de Colbenson.

El sistema de indexación y priorización de contenidos se ha realizado mediante un análisis minucioso de los datos relevantes a extraer para cada tipo de recurso (existen 70 tipologí­as), de forma que los gestores de contenidos de SEGITTUR han identificado los metadata de cada contenido para que el motor Autonomy IDOL Server realice la extracción inteligente y permita la homogenización en los siguientes campos:
Ejemplo de IndexaciíƒÂ³n y priorizaciíƒÂ³n buscador.spain.info v1

1. Tí­tulo: se compone automáticamente extrayendo la información de uno o varios metatags del contenido. Para el cálculo de la relevancia tiene un peso mayor que el resto de campos cuando las palabras buscadas se encuentran en él.

2. Campo variable de peso 2: este campo se cumplimenta con un valor distinto en función del tipo de recurso. En ocasiones se extrae automáticamente la localidad para un alojamiento y en otras se detecta la fecha para un evento o fiesta. Este campo tiene un peso menor que el tí­tulo para el cálculo de la relevancia.

3. Contenido completo: se trata del texto completo del contenido excluyendo los menús, banners y zonas laterales de la página, que no son susceptibles de utilizar en la búsqueda. El contenido tiene un peso inferior que el campo anterior para el cálculoa de la relevancia.

4. Campo variable de peso 4: el sistema detecta y extrae automáticamente el contenido seleccionado por los gestores para cada tipo de contenido. En ocasiones este campo se cumplimenta con la categorí­a y subcategorí­a a la que pertenece el recurso, en otras se cumplimenta con otros metadatos del contenido. Este campo tiene un peso de cuarto rango para el cálculo de la relevancia.

5. Orden: los gestores de contenidos de SEGITTUR también han determinado un orden de prioridad para cada tipo de recurso, según las necesidades de negocio que se aplica a continuación de la relevancia según la búsqueda realizada. De esta forma para contenidos con una misma relevancia, calculada mediante los algoritmos del motor Autonomy IDOL Server unidos con las reglas de peso para los cuatro campos indicados anteriormente, se establece una ordenación especí­fica:  Destinos turí­sticos, Reportajes, Eventos, Fiestas, continuando hasta 51 criterios según el tipo.

Un aspecto importante para la priorización de contenidos es la categorización para cada tipo de recurso, de nuevo establecida por los gestores de contenidos de SEGITTUR. El enriquecimiento en este caso se consigue por la incorporación de información que no está dentro de los contenidos, ni en sus URL (son en español para todos los idiomas), porque las categorí­as y subcategorí­as son especí­ficas para cada uno de los idiomas del sistema (español, inglés, francés y alemán). Con esta información añadida se permite al usuario la localización y posicionamiento de contenidos a pesar de no tener en su texto la información de categorización.

Compártelo:
  • Print
  • del.icio.us
  • Twitter
  • Facebook
  • LinkedIn
  • Digg
  • Meneame
  • Tumblr
  • StumbleUpon
  • BarraPunto
  • Technorati
Artículo asignado a: Clientes, Noticias, Turismo. Etiquetado como: , , , . Guarda el Enlace Permanente. Sigue la conversación mediante los RSS de este artículo. Deja un comentario o envía un retroenlace: Trackback URL.

Escribe un Comentario

Your email never will be published or shared. Fields marked with * are required

*
*

Puedes utilizar estas etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

*