Nuevo Sistema de Búsqueda de Spain.info V1
Tal y como se anuncia en el blog de Spain.info v2, formando parte del proyecto “Sistema de Búsqueda Avanzado de La Sociedad Estatal para la Gestión de la Innovación y las Tecnologías Turísticas,S.A. (SEGITTUR), Colbenson ha implementado el nuevo buscador del portal www.spain.info. Este es solo el 1er entregable de entre los más de 5 planificados!
El sistema de búsqueda está implementado en modo SaaS (Software as a Service) de forma que la plataforma se encuentra soportada por servidores externos al cliente, delegando la administración y mantenimiento del sistema a expertos de Colbenson.
El sistema de indexación y priorización de contenidos se ha realizado mediante un análisis minucioso de los datos relevantes a extraer para cada tipo de recurso (existen 70 tipologías), de forma que los gestores de contenidos de SEGITTUR han identificado los metadata de cada contenido para que el motor Autonomy IDOL Server realice la extracción inteligente y permita la homogenización en los siguientes campos:

1. Título: se compone automáticamente extrayendo la información de uno o varios metatags del contenido. Para el cálculo de la relevancia tiene un peso mayor que el resto de campos cuando las palabras buscadas se encuentran en él.
2. Campo variable de peso 2: este campo se cumplimenta con un valor distinto en función del tipo de recurso. En ocasiones se extrae automáticamente la localidad para un alojamiento y en otras se detecta la fecha para un evento o fiesta. Este campo tiene un peso menor que el título para el cálculo de la relevancia.
3. Contenido completo: se trata del texto completo del contenido excluyendo los menús, banners y zonas laterales de la página, que no son susceptibles de utilizar en la búsqueda. El contenido tiene un peso inferior que el campo anterior para el cálculoa de la relevancia.
4. Campo variable de peso 4: el sistema detecta y extrae automáticamente el contenido seleccionado por los gestores para cada tipo de contenido. En ocasiones este campo se cumplimenta con la categoría y subcategoría a la que pertenece el recurso, en otras se cumplimenta con otros metadatos del contenido. Este campo tiene un peso de cuarto rango para el cálculo de la relevancia.
5. Orden: los gestores de contenidos de SEGITTUR también han determinado un orden de prioridad para cada tipo de recurso, según las necesidades de negocio que se aplica a continuación de la relevancia según la búsqueda realizada. De esta forma para contenidos con una misma relevancia, calculada mediante los algoritmos del motor Autonomy IDOL Server unidos con las reglas de peso para los cuatro campos indicados anteriormente, se establece una ordenación específica: Destinos turísticos, Reportajes, Eventos, Fiestas, continuando hasta 51 criterios según el tipo.
Un aspecto importante para la priorización de contenidos es la categorización para cada tipo de recurso, de nuevo establecida por los gestores de contenidos de SEGITTUR. El enriquecimiento en este caso se consigue por la incorporación de información que no está dentro de los contenidos, ni en sus URL (son en español para todos los idiomas), porque las categorías y subcategorías son específicas para cada uno de los idiomas del sistema (español, inglés, francés y alemán). Con esta información añadida se permite al usuario la localización y posicionamiento de contenidos a pesar de no tener en su texto la información de categorización.
