Les principes fondamentaux d’un datawarehouse – traitement batch, par Greg Rahn

Cet article est la traduction d’un article de Greg Rahn publié sur son blog. L’article original en anglais est: The Core Performance Fundamentals Of Oracle Data Warehousing – Set Processing vs Row Processing. Cet article fait partie d’une série sur les principes fondamentaux des datawarehouse, mais s’applique à tous les traitements de type batch.

Durant 6 ans à faire des Proof Of Concept et des Benchmarks sur des datawarehouse pour les clients, il y a un domaine qui s’est toujours montré problématique: les traitements par lots (batch). La plupart du temps, ces batchs prennent la forme de procédures et packages PL/SQL, qui font du chargement de donnée, de la transformation, du traitement, ou quelque chose de similaire.
La raison pour laquelle c’est souvent problématique, c’est que les développeurs y ont codé en dur la lenteur du traitement. Je suis certain que les développeurs ne savaient pas qu’ils faisaient cela, lorsqu’ils ont codé leur PL/SQL, mais en tout cas, c’est ce qui est arrivé.

Alors comment ont-ils codé ‘en dur’ cette lenteur en PL/SQL ?
Lire la suite

Droit au but en lisant un rapport AWR ou Statspack, par Franck Pachot

Il n’a a pas eu beaucoup d’articles traduits ces derniers mois. Pour patienter, voici un lien sur une présentation:
Interpreting AWR Report – Straight to the Goal en anglais, mais très visuel…

C’est parfois difficile d’aborder un rapport AWR ou Statspack qui comprends 50 pages de statistiques, dont seulement quelques unes sont utiles dans un contexte donné. J’ai vu plusieurs personnes qui ne savent pas vraiment par où commencer. Et sans une approche méthodique, c’est facile de perdre du temps sur des choses qui ne feront pas gagner un un temps significatif dans l’amélioration du temps de réponse.

Cette présentation montre une approche méthodique: en partant du temps passé en base de données (DB time) pour voir si le rapport est pertinent ou pas, puis en prenant les éléments du ‘Top 5 events’ en montrant où aller chercher les détails qui permettent de comprendre la raison d’un problème de performance, comment le résoudre, et estimer le gain en temps de réponse que peut apporter la résolution.