Archives pour la catégorie Modélisation

Les types système: Evolution de SQL SERVER 7.0 à SQL SERVER 2005

SQL Server 7.0 définit :
Les Numériques Exactes
Les types d’entiers
INTEGER 4 octets
SMALLINT 2 octets
TYNYINT 1 octet 0 à 255.
Les numériques exactes
DECIMAL (P, S) numérique de précision P, avec S chiffres derrière la virgule
DEC (P,S) et NUMERIQUE(P,S)
Les Numériques Approximatifs
FLOAT(n) Flottants
REAL Synonyme de FLOAT 4 octets
Les Monétaires
MONEY et SMALLMONEY
date et temps
DATETIME Date et heure 8 octets
SMALLDATETIME
Les caractères
char(n) – ANSI – 8000 caractères.
varchar(n) – ANSI – 8000 caractères.
nchar(n) – Unicode – 4000 caractères.
nvarchar(n) – Unicode – 4000 caractères.
text – ANSI – 1,073,741,824 caractères.
ntext – Unicode – 536,870,912 caractères.
Les Binaires :
Binary[n] 1 à 8000 octets et VarBinary[n]
Image : 0 à 2 Giga
spéciaux :
bit, cursor, sysname,timestamp

SQL Serveur 2005 définit 7 catégories de types:

- Numérique exact
big int, int, smallint, tinyint,
decimal(p,s), numeric(p,s)

Les types Numérique Exact permettent de spécifier la précision souhaitée pour un attribut numérique, et donc de représenter une valeur exacte. BigInt est nouveau depuis 2000

- Numérique approximatif
float, real.

Les numériques flottants correspondent aux types couramment utilisés en programmation (FLOAT, DOUBLE) et ne représentent une valeur qu?avec une précision limitée.
Par exemple, si vous stocker 1,00015454 dans un float(8), seul les 8 digits sont garantis : 1,000154. Le reste est arrondi.
On utilise ces valeurs arrondis plutôt dans des applicatifs scientifiques que financier.
- Monnaie
money,smallmoney
4 digit de précision : exemple : smallmoney 214,748.3647

- Date et Time
datetime, smalldatetime

- Caractères
char(n),nchar(n),varchar(n),varchar(max),nvarchar(n),nvarchar(max),text,ntext

char(n) – ANSI – 8000 caractères.
varchar(n) – ANSI – 8000 caractères.
varchar(max) – ANSI – 1,0773,741,824 caractères.
text – ANSI – 1,073,741,824 caractères.

nchar(n) – Unicode – 4000 caractères.
nvarchar(n) – Unicode – 4000 caractères.
nvarchar(max) – Unicode – 536,870,912 caractères.
ntext – Unicode – 536,870,912 caractères.

la différence entre char et varchar provient du stockage de la totalité des caractères pour le char contre le stockage des seuls caractères utilise pour le varchar.

- binary
binary(n),varbinary(n),varbinary(max),image

Le type Binary stocke des flux binaires, des images, des fichiers.

- caractères spéciaux ( xml, guid )
bit,timestamp,uniqueidentifier,sql_variant,cursor,table,xml

Bit : stocke 0,1 ou Null.

Timestamp : Une table ne peut posséder qu’une seule colonne Timestamp qui est mis à jour sur la date/heure de la base à chaque insertion ou mise à jour.

UniqueIdentifier: Un identifiant 16 bits qui identifie la ligne dans la base de données, l’instance ou le serveur.

SQL_variant : Nouveau depuis 2000,le type indéfini de cette colonne de 8000 caractères permet de stocker n’importe quoi.

Cursor: Utilisé par les applications qui déclarent des cursors. Ne peut être utilisé dans une table.

Table : Nouveau type depuis 2000, Utilisé dans une variable de procédure stockée, trigger ou function.

XML : Nouveau depuis 2005, il stocke un document xml de 2 gigaoctets.

Redécouvrir SQL Serveur 2005 – Nouveaux Types de Données : Varchar(max),nvarchar(max) et varbinary(max)

Sous SQL Serveur 7 et SQL Serveur 2000, une ligne de table ne peut excéder 8000
bytes.
VARBINARY ne peut exceder 8000 bytes à condition que la ligne ne contient qu’une
colonne VARBINARY.
Une colonne VARCHAR ne peut excéder 8000 caractères.
Une colonne NVARCHAR ( 2 bytes par caractère ) ne peut excéder 4000 caractères.
varchar(n)ANSI – 8000 caracteres.
nvarchar(n)Unicode – 4000 caracteres.

Pour stocker plus de données dans une seule ligne de table, vous devez utiliser
les BLOB text,ntext et image. Ces données sont stockées dans une collection de
pages séparées de la page principale qui stocke les données. Ces données BLOB
sont stockées dans une B TREE Structure. Ces données BLOB ne sont pas du tout
aisée à manipuler, d’abord, on ne peut pas stocker un BLOB dans une variable de
procédure ou de fonction et il est impossible d’utiliser des fonctions de
chaines de caractères comme REPLACE, CHARINDEX or SUBSTRING avec un BLOB. Dans
la plupart des cas, vous devez utiliser READTEXT, WRITETEXT, et UPDATETEXT avec
les BLOBs ( text,ntext et image ).
Le type text,ntext et image doivent normalement disparaitre dans SQL Serveur
2008.
textANSI – 1,073,741,824 caracteres.
ntextUnicode – 536,870,912 caracteres.

Dans SQL serveur 2005, Varchar(max),nvarchar(max) et varbinary(max) supportent 2
gigabits de données. On peut utiliser ces types dans une procédure stockée ou
une fonction comme variable et les fonctions de caractères peuvent être utiliser
avec ces types là. Une réelle avancée pour les utilisateurs.
varchar(max)ANSI – 1,0773,741,824 caracteres.
nvarchar(max)Unicode – 536,870,912 caracteres.

[SQL Serveur] Connaissez-vous le type Numeric(p,s) ?

Vous connaissez tous les types INT ou BIGINT pour stocker des entiers.

Vous connaissez le type FLOAT pour stocker des valeurs arrondis de décimaux.

Par contre le type NUMERIC(p,s) et le type DECIMAL(p,s) sont moins connus.

Ils permettent de stocker des valeurs entières ou décimales avec précision.

Ce sont les types à utiliser de préférence dans une application financière

PowerAMC les utilisent pour générer ces identity!

La première valeur p indique nombre maximal de digit qui peut être stocké. Avec une valeur maximale de 38 digits( 10^38 )

La valeur s indique le nombre de chiffres après la virgules.

Exemple: Pour stocker un entier de 0 à +/- 9999 : NUMERIC(4,0).

Exemple : Pour stocker un décimal de 0 à +/- 99,99 : DECIMAL(4,2).

Il semble que NUMERIC(p,s) et DECIMAL(p,s) soient des synonymes. Je recommande NUMERIC(p,0) pour les entiers et DECIMAL(p,s) pour les réels.

La norme SQL recommande d’ utiliser un synonyme que SQL Serveur accepte : DEC(p,s).

[SQL Serveur] Comment obtenir un script de la base de données de développement en vue de l’appliquer en production ?

Power AMC 12 est indispensable lorsque l’on part de rien, on modélise le Modèle Conceptuel de Données, éventuellement, on réalise quelques modifications sur le Modèle Physique de Données bien que je déconseille, mieux vaut un script issu directement du MCD. On génére un script de la base vide.

SQL Serveur Management permet de scripter l’ensemble des procédures, des vues, des triggers pour obtenir un script complémentaire permettant de générer l’ensemble de la base de données.

SQL Serveur Publishing Wizard permet de récuperer les INSERT pour l’ensemble des données de la base. On peut aussi utiliser SQL Scripter pour récupérer les données par table, pour info, il est limité à 10 enregistrements par table en version demo.

Toad for sql serveur, un freeware, permet de créer des contraintes complémentaires simplement avec quelques clics de souris. j’avoue que cela rend bien service car écrire des contraintes à la main est fastidieux.

Un outil de versionning pour sauvegarder le script, les modifications, les évolutions de celui ci.

lecture recommandée pour power amc 11

Un livre indispensable pour retrouver les réflexes de conception d’un Modèle conceptuel de données et travailler ainsi à la génération d’une base de données avec power amc 11.

Conception des bases de données relationnelles en pratique de jacky akoka et isabelle comyn wattiau edition vuibert informatique.

On y trouve les notions d’un MCD, d’un modèle relationnelle, des exercices en SQL, des exercices de modélisation de bases de données avec la correction.

[Power AMC 12.0] Définir un IDENTITY dans le MCD.

Un truc, que je viens de découvrir en travaillant avec Power AMC 12. Je savais qu’il était possible de créer une clef identity à partir du MPD. Cette solution, entraine, une différence entre le MCD et le MPD. Il est donc préférable de prévoir les IDENTITY directement depuis le MCD. C’est tout à fait envisageable graçe au type de données SEQUENCE qui crée un IDENTITY sur un NUMERIC(18,0) ce qui laisse de la marge.

conception d’un schéma relationnel.

Les dépendances fonctionnelles.

Je viens de suivre un cours trés intéressant de michel freville du cnam sur la conception d’un schéma relationnel, j’y ai appris la méthode « ancienne » pour décomposer les relations ( autrement dit les tables ). Il existe tout un processus en commençant par déterminer les dépendances fonctionnelles. Il s’agit de déterminer les liens sémantiques entre les attributs ou les sous ensemble d’attributs d’une relation. Par exemple : La puissance d’une voiture est dépendante de l’immatriculation du véhicule. Si je connais l’immatriculation, je peux déduire la puissance. c’est une dépendance fonctionnelle. On doit déterminer la couverture minimale des dépendances fonctionnelles. c’est à dire, les seules dépendances qui restent quand on a supprimé toute celle qui se déduise logiquement. Par exemple, l’immatriculation définit la marque, la marque définit le pays. Une relation inutile à supprimer est donc l’immatriculation définit le pays… On est capable de retrouver cette dépendance fonctionnelle par transitivité. A partir de la couverture minimale, on est capable de déterminer la clé primaire de la relation en produisant un graphe des dépendances fonctionnelles. c’est assez génial! Je ne détaille pas. Il existe aussi un algorithme de BERNSTEIN qui permet de passer d’un graphe des dépendances fonctionnelles à un schéma relationnelle compatible avec la 3 eme forme normale.

Les formes normales.

Les formes normales ne sont que des règles qui permettent de déterminer le niveau de redondance et d’intégrité d’un schéma relationnelle. Un diagramme de classe conçu par l’analyse UML ( objet du monde réel distincts ) si il est conçu intelligemment avec une analyse poussée supprimant toute redondance d’information conduit à un schéma relationnel qui respecte la quatrième forme normale. Si l’analyse n’est pas poussée assez loin, on peut se retrouver à ne pas respecter la 4 eme, la 3 eme, la seconde ou la première forme normale.

Première forme normale :

Une relation R est en 1ière forme normale, si tout attribut
de R contient une valeur atomique.

exemple :
Membre du projet(NumeroMembre,Nom,Ville,NumerosDesProjets) est dénormalisée car NumérosDesProjets contient plusieurs Numéros de Projets pour un seul membre.
(‘1′,’Jean’,’Lyon’,’1,2,7′) (‘2′,’corinne’,’Marseille’,’1,2,9′)…

Pour passer en premiere forme normale:
MembreDuProjet(NumeroMembre,Nom,Ville,NumeroProjet)
(‘1′,’jean’,’Lyon’,’1′) (‘1′,’jean’,’Lyon’,’2′) (‘1′,’jean’,’Lyon’,’7′) (‘2′,’corinne’,’Marseille’,’1′)…

remarque : en premiere forme normale, on est oblige de changer de cle primaire : NumeroMembre ne suffit plus, on doit ajouter NumeroProjet.

Deuxième forme normale :

- Une relation R est en 2ième forme normale si et
seulement si :
1) Elle est en 1ière forme normale.
2) s’il existe une dépendance fonctionnelle totale reliant la clé à chaque attribut non clé.

remarque : la dependance fonctionnelle totale indique que pour une cle primaire compose, l’attribut doit etre dépendant de toute la cle composée, pas seulement d’une partie.

Pour passer MembreduProjet en 2 eme forme normale ( en fait on passe directement en 3 eme forme normale )
Employe(NumeroEmploye,Nom,ville)
Appartenance(NumeroEmploye,NumeroProjet)

Troisième forme normale :

- Une relation R est en 3ième forme normale si et
seulement si :
1) Elle est en 2ième forme normale.
2) Aucun Attribut non clé ne dépend d’une clé quelconque par transitivité.

exemple :EmployeDuDepartement(NumeroEmploye,Nom,prenom,age,NumeroDepartement,DescriptionDepartement ) est en deuxieme forme normale.
En troisième forme normale, cela donne :
Employe(NumeroEmploye,Nom,prenom,age)
Departement(NumeroDepartement,DescriptionDepartement)

Pour un complément d’information sur les formes normales, je vous renvoie vers le livre de Andreas Meier – introduction pratique aux bases de données relationnelles.

A bientôt.