 |
 |
Estructura
sección 2:
2.1.
Las
bases de datos
2.2.El modelo de arquitectura de bases de datos.
2.3. Los modelos de datos
2.4. Los sistemas de gestión de bases de datos
2.5. Los usuarios.
2.6. La creación de bases de datos.
2.7. Creación de una base de datos: enfoque E/R y transformación relacional.
2.8. Propuesta de un método estándar de diseño.
|
 |
2.7. Creación
de una base de datos: enfoque E/R y transformación relacional.
2.7.1. El enfoque
entidad-relación de Chen.
Por sus características, se ha seleccionado el enfoque entidad-relación
propuesto por Chen (CHEN, 1976; MOTA, CELMA Y CASAMAYOR, 1994; KORTH y
SILBERSCHATZ, 1993: 25-226; BATINI, CERI y NAVATHE, 1994). Este modelo
toma como punto de partida considerar la existencia de entidades, que
representan objetos, personas, etc, sobre las que se quiere almacenar
información relevante. Las entidades con las mismas características forman
un tipo de entidad. A las características necesarias para describir completamente
a cada tipo de entidad se les denominará atributo. Posteriormente, las
entidades y sus atributos se representan físicamente a través de tablas
(transformación en un modelo relacional) en las que los datos se almacenan
en dos dimensiones. Las filas de la tabla contienen los atributos de cada
una de las entidades, y las columnas el conjunto de atributos del mismo
tipo de cada entidad. El grado de la tabla corresponderá al número de
columnas de la tabla. En este momento estaremos trasladando el modelo
semántico entidad/relación al modelo clásico relacional, se decir, la
transformación entre el modelo conceptual y el lógico. El principio fundamental
en este modelado, que no puede obviarse de ninguna forma, es que hechos
distintos deben almacenarse en objetos distintos.
Uno de los puntos
fuertes de este modelo es que prevé que las entidades puedan mantener
relaciones entre ellas. En primer lugar, es necesario definir la clave
de la entidad. La claves serán el atributo, o conjunto de atributos, perteneciente
al mismo tipo de entidad que hacen único el acceso a esa entidad u ocurrencia
de la tabla, determinando de esta forma a una única entidad. La presencia
de varios atributos que pueden funcionar como clave da lugar a la existencia
de claves candidatas, y por otra parte se puede hablar de claves simples
(formadas por un único atributo) y claves múltiples, compuestas o concatenadas
(formadas por un conjunto de atributos. No hay que obviar tampoco el concepto
de clave ajena, aquel atributo de una tabla que puede funcionar como clave
en otra. La ocurrencia de entidad será, en este contexto, cada uno de
los posibles valores reales que puede tomar la clave de una entidad.
Las relaciones entre
tablas, basadas en la conexión de éstas a través de las claves, pueden
ofrecer diferentes cardinalidades, entendiendo como tal el número de ocurrencias
de una entidad que se relacionan con ocurrencias de la otra entidad. Pueden
identificarse tres tipos: (1,1), donde una ocurrencia se relaciona con
otra; (1,m), donde una ocurrencia puede relacionarse con varias; y (m,n),
donde varias ocurrencias de una entidad pueden relacionarse con varias
ocurrencias de la otra entidad. El modelo de Chen es n-ario, lo cual quiere
decir que las relaciones pueden establecerse entre una, dos o más entidades.
Las entidades pueden ser de dos tipos:
1. Entidad regular:
aquella sobre la que se puede definir la clave primario dentro de sus
propios atributos.
2. Entidad débil: aquellas que no puede utilizar sus propios atributos
como clave, al estar asociada a otra entidad.
La definición del
modelo conceptual con la técnica propuesta por Chen propone una secuencia
de fases para la obtención del modelo:
1. Identificar las
entidades dentro del sistema: para ello, debe conocerse el funcionamiento
del sistema en estudio, a través de estudios de usuarios, de necesidades
de información, de tipos de información, etc. Como guía puede utilizarse
para la definición de las entidades objetos reales, personas, actividades
del sistema, objetos abstractos, etc.
2. Determinar las claves o identificadores de entidades: señalar aquellos
atributos que identifiquen inequívocamente cada ocurrencia de la entidad,
y que no puedan ofrecer valores nulos.
3. Establecer las relaciones entre la entidades, describiendo el grado
de las mismas: estudiar las asociaciones entre las entidades, para definir
su importancia dentro del contexto del sistema, y obtener su cardinalidad.
4. Dibujar el modelo de datos: representar gráficamente el modelo obtenido.
5. Identificar y describir los atributos de cada entidad: señalar aquellas
propiedades de la entidad de interés para el sistema.
6. Verificaciones: eliminación de las relaciones redundantes y que puedan
ser obtenidas a través de combinar otras asociaciones.
El modelo obtenido
se representa mediante una notación gráfica especializada, a través de
diagramas, cuyas normas generales y variantes especializadas pueden encontrase
en la bibliografía pertinente.
2.7.2. La normalización.
El modelo conceptual de datos obtenido mediante la técnica de entidad-relación
será refinado y convertido en un modelo lógico relacional, utilizando
la normalización, lo que ofrecerá como resultado el conjunto de tablas
a implementar en la base de datos (JACKSON, 1990; MIGUEL Y PIATTINI, 1993:
425-674). Su finalidad es reducir las inconsistencias y redundancias de
los datos, facilitar el mantenimiento y evitar las anomalías en las manipulaciones
de datos. El objetivo será obtener un modelo lógico normalizado que represente
las entidades normalizadas y las interrelaciones existentes entre ellas.
Para ello, se toma como punto teórico de partida el concepto de dependencia
funcional, que dice: "Un atributo B depende funcionalmente de otro atributo
A, de la misma entidad si a cada valor de A le corresponde sólo un valor
de B." Lo anterior se completa mediante la dependencia funcional completa
y la dependencia transitiva.
El procedimiento de
normalización consiste en someter a las tablas que representan entidades
a un análisis formal para ver si cumplen, o no, las restricciones necesarias
que aseguren evitar los problemas citados con anterioridad. A mayor nivel
de normalización, mayor calidad en la organización de los datos y menor
peligro para la integridad de los datos. Este procedimiento consiste en
ir alcanzando formas normales
Todo el proceso se
basa en que una primera relación universal plantearía enormes problemas
de redundancia, consistencia e integridad de los datos, por lo que es
necesario mejorar las relaciones. Estas mejoras deben dar como resultado
tablas equivalentes y mejores que sus respectivas originales, y poseer
siempre tres propiedades: conservación de la información (de atributos
y de tuplas), conservación de dependencias y mínima redundancia de los
datos. Las mejoras introducidas obligan a plantear hasta que Forma Normal
es necesario llegar, es decir, a que nivel de depuración. Normalmente,
es recomendable alcanzar la máxima Forma Normal, aunque luego es muy probable
que restricciones existentes, de algún tipo, obliguen a retroceder a un
nivel inferior de normalización, o incluso a cierto nivel de "desnormalización".
|
 |
 |
 |