{"id":4318,"date":"2019-04-08T12:33:28","date_gmt":"2019-04-08T10:33:28","guid":{"rendered":"https:\/\/dev.wi-lex.de\/index.php\/normalisierung\/"},"modified":"2023-07-17T18:12:24","modified_gmt":"2023-07-17T16:12:24","slug":"normalisierung","status":"publish","type":"page","link":"https:\/\/wi-lex.de\/lexikon\/informations-daten-und-wissensmanagement\/datenmanagement\/daten\/normalisierung\/","title":{"rendered":"Normalisierung"},"content":{"rendered":"<p><span class=\"documentAuthor\"><a title=\"Richard Lackes\" href=\"https:\/\/www.wi-lex.de\/index.php\/autoren\/autorenverzeichnis\/lackes-prof-dr-richard\/\">Richard Lackes<\/a><\/span>,\u00a0<span class=\"documentAuthor\"><a title=\"Markus Siepermann\" href=\"https:\/\/www.wi-lex.de\/index.php\/autoren\/autorenverzeichnis\/siepermann-dr-markus\/\">Markus Siepermann<\/a><\/span><\/p>\n<hr \/>\n<p align=\"JUSTIFY\"><em>Eines der Hauptanliegen beim Datenbankentwurf und -betrieb ist die m\u00f6glichst redundanzfreie Speicherung von Informationen, um somit Probleme bei deren Erfassung und Handhabung zu vermeiden. Die Normalisierung stellt dies auf formaler Ebene sicher, indem Abh\u00e4ngigkeiten auf Attributebene analysiert und eliminiert werden.<\/em><\/p>\n<h2>Definition Normalformen<\/h2>\n<p align=\"JUSTIFY\">Unter dem Begriff Normalisierung wird die Ausrichtung einer Datenbasis im Sinne eines gutm\u00fctigen Verhaltens einer\u00a0<a class=\"internal-link\" title=\"Datenbanksystem\" href=\"https:\/\/www.wi-lex.de\/index.php\/lexikon\/informations-daten-und-wissensmanagement\/datenmanagement\/datenbanksystem\/\">Datenbank<\/a>\u00a0verstanden, indem die Datenbasis so strukturiert wird, dass w\u00e4hrend des Datenbankbetriebes kein anormales Verhalten beim Einf\u00fcgen, L\u00f6schen oder \u00c4ndern eines Datensatzes (sogenannte Einf\u00fcge-, L\u00f6sch- und \u00c4nderungsanomalien) auftritt. Darunter versteht man, dass z.B. mit dem L\u00f6schen einer\u00a0<a class=\"internal-link\" title=\"Information\" href=\"https:\/\/www.wi-lex.de\/index.php\/lexikon\/informations-daten-und-wissensmanagement\/informationsmanagement\/information\/\">Information<\/a>\u00a0zu A auch die letzte Information zu B gel\u00f6scht wird, obwohl diese noch ben\u00f6tigt wird. Um das zu verhindern, werden bei der Normalisierung die Abh\u00e4ngigkeiten der Attribute einer Relation untereinander untersucht und f\u00fcr jede Relation eine einzige funktionale Beziehung der Attribute untereinander zugelassen. Grundlage der Normalisierung sind das Relationenmodell [Codd 1970] und die Normalformen, die in den 1970er Jahren aufgestellt worden sind. Basis der Normalformen bilden verschiedene Formen von Abh\u00e4ngigkeiten, die sukzessive mit jeder Normalform ausgeschlossen werden.<\/p>\n<h3>1. Normalform<\/h3>\n<p align=\"JUSTIFY\">Die erste Normalform bezieht sich zun\u00e4chst auf die \u00e4u\u00dfere Form eines Attributs und fordert, dass jedes Attribut atomar sein muss [Kent 1983, S. 120], d.h. in einem Datensatz darf pro Attribut immer nur ein Wert stehen und keine Werteliste. Diese Forderung sorgt daf\u00fcr, dass in einer Datenbasis ausschlie\u00dflich strukturierte Daten vorliegen, die ein einfaches Retrieval erm\u00f6glichen.<\/p>\n<h3>2. Normalform<\/h3>\n<p align=\"JUSTIFY\">Die zweite Normalform befasst sich mit der Minimalit\u00e4t des Prim\u00e4rschl\u00fcssels einer Relation. Sie besagt, dass jedes Attribut einer Relation vollfunktional vom Prim\u00e4rschl\u00fcssel abh\u00e4ngig sein muss [Codd 1972, S. 43], d.h. es darf kein Attribut aus dem Prim\u00e4rschl\u00fcssel entfallen, ohne dass der Prim\u00e4rschl\u00fcssel seine Identifikationseigenschaft bez\u00fcglich aller anderen Attribute verliert. Falls eine solche Minimalit\u00e4t des Prim\u00e4rschl\u00fcssels nicht vorliegt, handelt es sich bei der betrachteten um eine aus mindestens zwei Relationen zusammengesetzte Relation. Zur Herstellung der zweiten Normalform wird die Relation deshalb gem\u00e4\u00df der Abh\u00e4ngigkeiten in verschiedene Relationen aufgeteilt.<\/p>\n<h3>3. Normalform<\/h3>\n<p align=\"JUSTIFY\">Die dritte Normalform verbietet sogenannte transitive Abh\u00e4ngigkeiten. Eine solche transitive Abh\u00e4ngigkeit liegt vor, wenn in einer Relation R ein Attribut A vom Prim\u00e4rschl\u00fcssel nur mittelbar \u00fcber ein anderes, Nicht-Prim\u00e4rschl\u00fcsselattribut abh\u00e4ngt. [Codd 1972, S. 46-50] Dieses andere Nicht-Prim\u00e4rschl\u00fcsselattribut bestimmt dann bereits Attribut A vollfunktional, so dass diese funktionale Beziehung in eine weitere Relation ausgelagert werden kann. W\u00fcrde das nicht geschehen, k\u00f6nnten bestimmte Informationen bzgl. A nur in Abh\u00e4ngigkeit der Daten aus R gespeichert werden, obwohl sie davon nicht bestimmt werden.<\/p>\n<h3>Boyce-Codd-Normalform<\/h3>\n<p align=\"JUSTIFY\">Da festgestellt wurde, dass die dritte Normalform bestimmte Anomalien nicht beseitigen kann, wurde sie durch durch die sogenannte Boyce-Codd-Normalform konkretisiert. Diese fordert, dass alle Attribute bzw. Attributkombinationen einer Relation, die ein anderes Attribut funktional bestimmen, sich auch als Prim\u00e4rschl\u00fcssel der gesamten Relation eignen m\u00fcssen. [Codd 1974, S. 1018]<\/p>\n<h3>4. Normalform<\/h3>\n<p align=\"JUSTIFY\">Mit Hilfe der vierten Normalform werden sogenannte mehrwertige Abh\u00e4ngigkeiten ausgeschlossen. Diese liegen vor, wenn zu einem gegebenen Attributpaar (X,Y) das Attribut Z nur von X aber nicht von Y bestimmt wird. [Fagin 1977, S. 267] Eine mehrwertige Abh\u00e4ngigkeit kann somit nur innerhalb eines mindestens aus drei Attributen bestehenden Prim\u00e4rschl\u00fcssels vorkommen und tritt im Prinzip dann auf, wenn zwei Relationen A und B k\u00fcnstlich zu einer Relation C zusammengefa\u00dft worden sind, wobei A und B im Prim\u00e4rschl\u00fcssel jeweils mindestens eine \u00dcbereinstimmung (Attribut X) und einen Unterschied (Attribute Y bzw. Z) besitzen. Um in eine solche Relation C alle Daten korrekt einzutragen, m\u00fcssten beim Einf\u00fcgen einer Information i.d.R. mehrere Datens\u00e4tze angelegt werden (Einf\u00fcgeanomalie).<\/p>\n<h3>5. Normalform<\/h3>\n<p align=\"JUSTIFY\">Die f\u00fcnfte und letzte Normalform schlie\u00dft die sogenannten Verbundabh\u00e4ngigkeiten aus. Eine Verbundabh\u00e4ngigkeit liegt dann vor, wenn eine Relation R sich in verschiedene Projektionen vollst\u00e4ndig zerlegen l\u00e4\u00dft. Dies ist sicherlich mit jeder Relation m\u00f6glich. Problematisch ist jedoch, wenn diese Zerlegung nicht auf den Attributen beruht, die sich als Prim\u00e4rschl\u00fcssel der Relation eignen. Deshalb fordert die f\u00fcnfte Normalform, dass jede Verbundabh\u00e4ngigkeit in einer Relation eine Folge ihrer Schl\u00fcsselkandidaten ist. [Fagin 1979, S. 265-267]<\/p>\n<p align=\"JUSTIFY\">Bis auf die erste Normalform basieren alle weiteren Normalformen auf verschiedenen Formen von Abh\u00e4ngigkeiten zwischen den Attributen, die sukzessive mit jeder Normalform ausgeschlossen werden. Die Abh\u00e4ngigkeiten der Normalformen bauen dabei aufeinander auf, d.h. Abh\u00e4ngigkeiten, die in h\u00f6heren Normalformen zum Tragen kommen, umfassen alle Abh\u00e4ngigkeiten vorangegangener Normalformen. Eine Relation, die sich also z.B. in 3. Normalform befindet und somit keine transitiven Abh\u00e4ngigkeiten aufweist, befindet sich automatisch in 2. Normalform mit ausschlie\u00dflich vollfunktional vom Prim\u00e4rschl\u00fcssel abh\u00e4ngigen Attributen (siehe Abbildung 1).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"image-inline\" src=\"https:\/\/wi-lex.de\/wp-content\/uploads\/2023\/07\/normalformen.pdf\" alt=\"Customizing_Abb_1.jpg\" width=\"500\" height=\"150\" \/><\/p>\n<p style=\"font-weight: 400;\">Abbildung 1: Hierarchie der Normalformen<\/p>\n<p align=\"JUSTIFY\">Liegen alle Relationen einer Datenbasis in f\u00fcnfter Normalform vor, so spricht man von einer normalisierten Datenbasis. In der Praxis wird aber aus Performanzgr\u00fcnden oftmals auf eine vollst\u00e4ndig normalisierte Datenbasis verzichtet. Es wird zumindest versucht, die dritte Normalform einzuhalten, wobei selbst darauf an manchen Stellen verzichtet wird. So werden in den meisten Datenbanken z.B. die Postleitzahlen zusammen mit den Attributen Ort, Strasse und Hausnummer in einer Relation mit einem anderen Prim\u00e4rschl\u00fcssel gespeichert, obwohl Ort, Strasse und Hausnummer die PLZ eindeutig bestimmen und somit eine transitive Abh\u00e4ngigkeit zwischen dem Prim\u00e4rschl\u00fcssel und der PLZ besteht.<\/p>\n<hr \/>\n<h3>Literatur<\/h3>\n<p class=\"wl_literaturquelle\">Codd, E.F.: A Relational Model of Data for Large Shared Data Banks. In: Communications of the ACM, Vol. 13 (1970), No. 6, S. 377-387.<\/p>\n<p class=\"wl_literaturquelle\">Codd, E.F.: Further Normalization of the Data Base Relational Model. In: Randall J. Rustin (Hrsg.): Data Base Systems, Courant Computer Science Symposia Series, Vol. 6, Englewood Cliffs, N.J. 1972, S. 33-64.<\/p>\n<p class=\"wl_literaturquelle\">Codd, E.F.: Recent Investigations in Relational Data Base Systems. In: Proc. IFIP Congress, Stockholm u.a. 1974, S. 1017-1021.<\/p>\n<p class=\"wl_literaturquelle\">Fagin, R.: Multivalued Dependencies and a New Normal Form for Relational Data Bases. In: ACM Transactions on Data Base Systems, Vol. 2 (1977), No. 3, S. 262-278.<\/p>\n<p class=\"wl_literaturquelle\">Fagin, R.: Normal Forms and Relational Database Operators. In: Proc. 1979 ACM SIGMOD International Conference on Management of Data, Boston, Massachusetts, 1979, S. 153-160.<\/p>\n<p class=\"wl_literaturquelle\">Kent, W.: A Simple Guide to Five Normal Forms in Relational Database Theory. In: Communications of the ACM, Vol. 26 (1983), No. 2, S. 120-125.<\/p>\n<p class=\"wl_literaturquelle\">Lackes, R.; Siepermann, M.: Wohlstrukturiertheit von Daten in betrieblichen Informationssystemen. In: wisu das wirtschaftsstudium, 32. Jg., Heft 6\/2003, S. 787-794.<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Richard Lackes,\u00a0Markus Siepermann Eines der Hauptanliegen beim Datenbankentwurf und -betrieb ist die m\u00f6glichst redundanzfreie Speicherung von Informationen, um somit Probleme bei deren Erfassung und Handhabung zu vermeiden. Die Normalisierung stellt dies auf formaler Ebene sicher, indem Abh\u00e4ngigkeiten auf Attributebene analysiert <a href=\"https:\/\/wi-lex.de\/lexikon\/informations-daten-und-wissensmanagement\/datenmanagement\/daten\/normalisierung\/\" class=\"read-more\">Read More &#8230;<\/a><\/p>\n","protected":false},"author":568,"featured_media":0,"parent":8581,"menu_order":4,"comment_status":"open","ping_status":"open","template":"","meta":{"footnotes":""},"class_list":["post-4318","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/pages\/4318","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/users\/568"}],"replies":[{"embeddable":true,"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/comments?post=4318"}],"version-history":[{"count":11,"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/pages\/4318\/revisions"}],"predecessor-version":[{"id":16951,"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/pages\/4318\/revisions\/16951"}],"up":[{"embeddable":true,"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/pages\/8581"}],"wp:attachment":[{"href":"https:\/\/wi-lex.de\/wp-json\/wp\/v2\/media?parent=4318"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}