Article complet: Bench Sun sur Talend : 1 million de ligne par seconde pour trier 7,4 GB de données (60 millions de ligne)

30/04/2009

Permalink 18:32:37, Catégories: Talend, divers, Récapitulatif OpenSource, Récapitulatif Business Intelligence, 127 mots   French (FR) , Cedric CARBONE

[BI][OpenSource] Bench Sun sur Talend : 1 million de ligne par seconde pour trier 7,4 GB de données (60 millions de ligne)

Sun vient de publier un bench sur nos nouveaux composants permettant de faire de la parallélisation. Ils ont testé sur 2 machines : des bi-cpu quad core.
Les fichiers de données sont générés à l'aide du DBGEN v2.8.0 (le générateur de données utilisés dans de nombreux benchs comme le TPC-H ) et varient de 6 Million de ligne (740 MB ) à 3,3 milliards de ligne (415 GB ).

Différentes opérations ont été effectué (calculer un count, calculer une moyenne, trier les données).

Par exemple, trier 60 millions de lignes (7,4 GB ) prend 1 minute de temps (1 million de ligne par seconde).

Tous les détails et tous les résultats sont disponibles à :
http://blogs.sun.com/aja/entry/talend_s_new_data_processing
Merci Amir pour ton travail!

Social Bookmarking:

                                     

Commentaires, Pingbacks:

Connectez-vous pour vous abonner à cet article:

Flux de commentaires pour cet article : Atom 1.0  RSS 2.0

Cet article n'a pas de Commentaires/Pingbacks pour le moment...

Vous devez être identifié pour poster un commentaire.

Talend ETL - Cédric Carbone (co2)

Logo de Talend
Talend Open Studio
ETL Open Source
Blog français dédié à l'intégration de données, la business intelligence, Java et bien sur Talend Open Studio

Cedric Carbone - Talend CTO

Catégories


Rechercher

<  Février 2012  >
Lun Mar Mer Jeu Ven Sam Dim
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29        

Syndiquez ce blog XML

Articles :

Commentaires :

 
 
 
 
Partenaires

Hébergement Web