Como excluir de un containterpage los elementos de la página que no deberían ser indexados

Thu Nov 14 12:20:03 CET 2013       Sergio Raposo Vargas       Administración, OpenCms 8

Con solr, cuando realizamos una búsqueda, ya no buscamos directamente sobre los contenidos XML (salvo que tengan página de detalle) sino que realizamos la búsqueda sobre los containerpage directamente.

Esta nueva funcionalidad, aunque muy útil para nuestros buscadores, es un problema para algunos casos, por ejemplo, los contenidos que se encuentran repetidos en todas nuestras páginas, ejemplo, cabecera y pie. Debemos conseguir que estos elementos comunes a todas las páginas no se indexen como parte del contenido del containerpage en Solr ya que sino, cualquier búsqueda de una palabra que esté contenida en estos elementos nos dará como resultado todas nuestras páginas, haciendo poco útil la herramienta de búsqueda.

Para evitar el problema tenemos que indicarle a Solr que elementos del containerpage debe indexar y cuales no. Para ello tenemos en la configuración del formatter un atributo llamado searchcontent.

Este atributo tiene dos posibles valores:

  • true: El contenido del XML correspondiente será indexado como parte del contenido del containerpage
  • false: El contenido del XML no se indexará como parte del containerpage.

Con esta simple configuración podremos indicar aquellos elementos que no son indexables y por tanto haremos que nuestras búsquedas sean más reales.

 

 Solr, containerpage, elementos indexables