Vous êtes ici : Accueil / 2009 / Novembre / Conférence sur l'indexation d'une base documentaire pour Libération

Conférence sur l'indexation d'une base documentaire pour Libération

écrit le 08/04/2010 Par Gaël Le Mignot
Comments
Pilot Systems a réalisé dans le cadre des PGDays 2009 une conférence sur l'indexation d'une base documentaire pour le quotidien Libération.

Pilot Systems a réalisé dans le cadre des PGDays 2009 une conférence sur l'indexation d'une base documentaire pour le quotidien Libération.

Ce moteur d'indexation, qui porte sur plus de 500 000 articles plus d'un million de contributions (commentaires), est utilisé massivement dans tout le back-office de Libération, aussi bien pour les recherches que pour la navigation.

Le moteur d'indexation, a été réalisé en Python en reposant sur une base PostgreSQL, afin de remplacer une technologie propriétaire, sous Windows, à base d'XML, qui montrait des limitations en terme de performances et de stabilité.

Les slides de la conférence, expliquant les différentes techniques mises en oeuvre afin d'arriver au résultat recherché (performances et stabilité élevées, malgré la très grande volumétrie) sont disponibles sur http://contributions.pilotsystems.net/publications/supports-de-conferences/conference-pgdays-2009-indexation-de-la-base-documentaire-de-liberation

Actions sur le document

blog comments powered by Disqus