Cómo construimos nuestro buscador sin reescribirlo desde cero.
En 2024 nuestro buscador empezó a fallar de forma silenciosa. Las búsquedas con dos palabras devolvían cosas razonables. Las de tres, basura. Las de cuatro, peor. La métrica de Search Click-Through Rate caía un poco cada mes y nadie se daba cuenta porque la gráfica era pequeña y nadie la miraba.
Lo primero que aprendimos: el equipo de búsqueda no era el equipo de búsqueda. Era el equipo de “lo que pase con la query antes de llegar a Elasticsearch”. Lo segundo: cuando llevas siete años sin tocar el pipeline de relevancia, no lo “mejoras”. Lo arqueologías. Cada query rewrite, cada boost, cada synonym dictionary tiene una historia y un autor que ya no trabaja aquí. Hay que decidir qué se queda…