Pilot Systems a réalisé dans le cadre des PGDays 2009 une conférence sur l'indexation d'une base documentaire pour le quotidien Libération.
Ce moteur d'indexation, qui porte sur plus de 500 000 articles plus d'un million de contributions (commentaires), est utilisé massivement dans tout le back-office de Libération, aussi bien pour les recherches que pour la navigation.
Le moteur d'indexation, a été réalisé en Python en reposant sur une base PostgreSQL, afin de remplacer une technologie propriétaire, sous Windows, à base d'XML, qui montrait des limitations en terme de performances et de stabilité.
Les slides de la conférence, expliquant les différentes techniques mises en oeuvre afin d'arriver au résultat recherché (performances et stabilité élevées, malgré la très grande volumétrie) sont disponibles sur http://contributions.pilotsystems.net/publications/supports-de-conferences/conference-pgdays-2009-indexation-de-la-base-documentaire-de-liberation
Actions sur le document