Matriz funcionalidades Idol vs Solr
Recientemente hemos venido compartiendo con vosotros los puntos clave que marcan las diferencias entre software de búsqueda comercial y de código abierto.
Hemos tratado las limitaciones de licenciamiento, las diferencias en desarrollo y posicionamiento así como una introducción en aspectos de interoperatividad, arquitectura y rendimiento mediante una entrevista a Alberto Rodríguez-Tenreiro.
Una vez conocidos dichos puntos clave, debemos de responder, con el máximo nivel de detalle, a las diferencias funcionales entre una tecnología de búsqueda comercial como Autonomy Idol y su homólogo en código abierto Lucene Solr.
Qué mejor forma que publicar la 1ª Matriz de Funcionalidades Lucene Solr – Autonomy Idol.
El objetivo de la matriz aquí presentada es ayudar a traducir el lenguaje variado en fuentes que Lucene Solr ofrece sobre su oferta funcional con el lenguaje de Autonomy Idol.


| Nombre común | Idol | Solr |
| Basic Search Búsqueda Básica |
Retrieval Lite Retrieval Basic Búsqueda Lite Búsqueda Básica |
Función de búsqueda por defecto |
| Advanced Search Búsqueda Avanzada |
Retrieval Concept Retrieval Advanced Búsqueda Conceptual Búsqueda Avanzada |
Función de búsqueda por defecto para estructuras léxicas complejas |
| Directed Navigation Navegación Dirigida |
Parametric Search Búsqueda Paramétrica |
Faceting Agrupación de resultados por valor de campo |
| Spellcheck Corrección Ortográfica |
Spellcheck Corrección Ortográfica |
Spellcheck Corrección Ortográfica |
| Summaries Resúmenes |
Summarization Concept-Context-Basic |
Summarization Explotado dinámicamente mediante Highlighting |
| Highlight Subrayado/resaltado/remarcado |
Highlight Subrayado/resaltado/remarcado |
Highlighting Subrayado/resaltado/remarcado |
| Key Phrase Extraction – Results clustering Extracción de frases – conglomerado de resultados |
Dynamic Thesaurus – Automatic-Query Guidance (AQG)Tesauro Dinámico – Guía Automática de Consultas | KPE (Key Phrase Extractor) – Carrot2 |
| Suggest Documents Contenidos relacionados |
Hyperlinking Contenidos relacionados |
MoreLikeThis Más como un resultado |
| Document Clustering Conglomerado de documentos |
Clusteriing-HotNews- BreakingNews-Spectograph-2Dmap | Clustering Agrupación de resultados en grupos de documentos relacionados entre si |
| Document Level Security Seguridad a nivel de documento |
IAS (Intellectual Asset-protection System) IAS |
Document Level Security Seguridad a nivel de documento |
| Spatial Search Búsqueda geográfica |
Geo-spatial Retrieval Búsqueda Geo-Spacial |
Spatial Search Búsqueda por coordenadas |
El espectro funcional Solr es tan diverso como cambiante, constantemente surgen nuevas funcionalidades así como mejores formas y por ello consideramos oportuno actualizar la matriz con la máxima frecuencia.
La Matriz de Funcionalidades es una propuesta abierta, un punto de partida sobre el que continuar sumando detalle y al que estáis invitados a participar con cualquier idea o comentario.
En el siguiente post publicamos el detalle descriptivo de todas y cada una de las funcionalidades listadas.
No os lo perdáis!

Un Comentario
Excelente post Angel.
Creo que sería interesante resaltar las cada día más importantes funcionalidades por parte de buscadores enterprise en la parte de procesado de texto. El enriquecimiento de los datos es una parte crítica para una óptima recuperación de información; a dia de hoy, es fundamental aplicar estrategias en la mineria de patrones, la extracción de entidades, integración con redes semánticas, clusterización, clasificación y técnicas de procesado para que un buscador pueda ser adaptado a las necesidades de un usuario. En el caso de open source sobresale la tecnología Mahout (http://mahout.apache.org/), la cual además de utilizar algortimos de mineria y emparejamiento muy avanzados (Bayes, etc..), dispone una comunidad de developers y usuarios de lo más dinámica.
Un Retroenlace
[...] La semana pasada publicábamos la 1ª versión de la matriz de funcionalidades Autonomy Idol vs Lucene Solr. [...]