Bee-rain reprend ses couleurs progressivement
lundi 01 juin 2009, 14:12Rappelons d'abord le principe de Bee-rain.
Bee-rain est un service en ligne qui analyse en "temps réel" le web et qui met en évidence les expressions et mots-clé qui sont largement cités sur internet. L'explication de cette rupture de service est simple et rapide à exprimer : elle se résume à "problème technique et manque de temps".
Pour rentrer plus dans les détails, la première version de Bee-rain à souffert dès le début à un problème de taille : la base de donnée, comme tout les robots indexeurs grossit très/trop rapidement. Or, dans le cas du serveur qui héberge Bee-rain, la Base Mysql est imitée à 100Mo (seulement quelques jours d'indéxation !)
Pour pallier à ce problème, l'équipe Bee-rain à tenté une approche un peu différente : d'une part, la base de données est désormais stockée au format sqLite 3, mais cette base est partitionnée selon une fréquence définie (30 jours pour le moment, mais cette durée va certainement être réduite). Le deuxième point qui à été optimisé est le nombre de sources indéxées. Dans la première version, le robot Bee-rain indéxait le web dans sa globalité ; la version 2 se limite(ra) à seulement quelques sources "choisies" ! La performance sera donc très largement accrue, quant à la pertinence, celà ne devrait pas être trop compromettant pour le projet.
Pas d'actualité
Dernière modification : lundi 21 février 2011, 23:08
Public-Storm est un outil en ligne de Remue-méninges collaboratif. Sur un thème donné (un Storm), laissez votre imagination et votre créativité déborder... et proposez vos suggestions.