Modèles de coût pour la sélection
de vues matérialisées dans le nuage,
application aux services Amazon EC2 et S3
 
 
Romain Perriot, Jérémy Pfeifer, Laurent d'Orazio, Bruno Bachelet
(LIMOS, Clermont-Ferrand, France)
 
Sandro Bimonte
(IRSTEA, Clermont-Ferrand, France)
 
Jérôme Darmont
(ERIC, Lyon, France)
 
9èmes Journées Francophones sur les Entrepôts de Données et l'Analyse en Ligne
Blois, France
13-14 juin 2013
 

La performance des entrepôts de données est généralement assurée grâce à des structures de données physiques comme les index ou les vues matérialisées. Dans un tel contexte, des modèles de coût permettent de sélectionner un ensemble pertinent de ces structures. Toutefois, cette sélection devient plus complexe dans un nuage informatique. En effet, le critère d'optimisation est double, avec un équilibre entre coût monétaire et temps de réponse. Cet article introduit de nouveaux modèles de coût intégrant le paiement à la demande en vigueur dans les nuages. Sur la base de ces modèles, un problème d’optimisation est défini pour trouver, parmi des vues candidates, celles à matérialiser pour minimiser à la fois le coût total d’interrogation et de maintenance de la base de données dans un nuage et le temps de réponse total pour un ensemble de requêtes donné. Dans un premier temps, nous optimisons les deux critères séparément: un critère est optimisé avec une contrainte limitant le second. Notre proposition est validée de manière expérimentale.