JL Staud – Datenbanken und Datenbanksysteme Datenmodellierung, Datenbankeinrichtung, Datenbanktheorie, Datenbankpraxis

15/10/2018

Vorträge und Termine

Filed under: - HAW LH WS18/19 DBS,Vortragsthemen — admin @ 10:18

Seminar WIF640 – „Neue Entwicklungen im Datenbankgeschehen – NoSQL usw.“ – Montags: 8:45 – 10:15, 10:30 – 12:00

Falls Sie Rückfragen haben: josef.staud@haw-landshut.de

Bitte beachtenSie:

– Mehr zu den Themen und aktuelle Informationen finden Sie immer hier im BLOG: https://datenbanken.staud.info/kategorien/haw-lh-ws18-19-dbs/

– Die Termine können sich nach hinten verschieben.

– Seien Sie zu dem geplanten Termin aber auf jeden Fall vortragsbereit

Liste Themen/Vorträge/Termine – Stand 6.11.2018

    Thema Vortragender
1 19.11. Einführung in die Thematik, Überblick Staud
2 19.11. Neo4J xxx
3 26.11. MongoDB xxx
4 26.11. DynamoDB xxx
5 3.12. Cassandra xxx
6 3.12. Chordless xxx
7 10.12 AmazonSimpleDB xxx
8 10.12. CouchDB xxx
9 17.12. HyperGraphDB xxx

07/10/2018

Hinweise zur Leistungserbringung

Filed under: - HAW LH WS18/19 DBS,Leistungserbringung — admin @ 06:19

(0)

Es gilt Anwesenheitspflicht. Alle sollen von allen Vorträgen profitieren!

(1)

Formale Gestaltung (Grundlagen):

http://www.staud.info/hinweise/hi_f_1.htm

ist ein Link zu einem Button (links oben) auf meiner WebSite www.staud.info mit der Beschriftung „Formale Gestaltung Abschlussarbeiten“. Dies kann evtl. auch hier helfen.

(2)

Zur Länge des Textes: Normalerweise sollten 20 Seiten reichen, es sei denn Sie hätten sehr viele Abbildungen.

(3)

Abzugeben sind:

  • Die digitale Präsentation (als PDF-Dokument, erzeugt aus der PP-Fassung)
  • Die textliche Ausarbeitung (ausgedruckt UND als PDF-Dokument)

(4)

In die Bewertung fließen ein:

  • Qualität der inhaltlichen Auseinandersetzung mit dem Thema
  • Inhaltliche udn formale Qualität des Textes
  • Qualität der Präsentation
  • Rhetorische Kompetenz (Der Vortrag fällt leichter, wenn man das Thema intensiv durchdrungen hat)
  • Formales (Einhalten der zeitlichen Vorgaben, rechtzeitige Abgabe, Tischvorlage)

(5)

  • Beachten Sie die üblichen wissenschaftlichen Standards, auch in der formalen Gestaltung (–> (1) )

(6)

  • Geben Sie den Text als PDF-Dokument ab, bringen Sie ein ausgedrucktes Exemplar für mich mit.

(7)

  • Vergessen Sie nicht eine Tischvorlage („hand out“) mit Titel und Gliederung für jeden Studierenden (1 Seite genügt).

17/09/2018

Vortragsthemen (Aushang)

Filed under: Vortragsthemen — admin @ 09:10

Prof. Dr. Josef L. Staud, WS18/19

Seminar WIF7 – „Neue Entwicklungen im Datenbankgeschehen – NoSQL usw.“

Liste der Vortragsthemen vom Aushang.

Hinweis: Weitere Informationen hierzu finden Sie hier im Blog in „Themen“.

1      HBase

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Hunger, Spichale und George 2013]

2      MongoDB

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Nitschinger und Trelle 2014]

3      Neo4J

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Hunger, Spichale und George 2013]

4      CouchDB

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a]

5      DynamoDB

Ausgangspunkt: [Perkins, Redmond und Wilson 2018a]

6      DEX

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

7      Cassandra

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Wolff, Hunger, Spichale und George 2013]

8      Chordless

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

9      Riak

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Wolff, Nitschinger und Trelle 2014]

10  Membase

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

11  AllegroGraph

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

12  HyperGraphDB

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

13  OrientDB

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

14  AmazonSimpleDB

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

15  Redis

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a]

16  InMemory-Datenbanken

Siehe „Themen“ für die Themenspezifikation.

Ausgangspunkt: [Plattner und Zeier 2011]. [Plattner 2013]

17  XML und Datenbanken

Siehe „Themen“ oben für die Themenspezifikation.

Ausgangspunkt: [Schöning 2003] [Grupe 2018]

WIF7

Filed under: - HAW LH WS18/19 DBS,Themen — admin @ 08:01

Prof. Dr. Josef L. Staud, WS18/19

Seminar WIF7 – „Neue Entwicklungen im Datenbankgeschehen – NoSQL usw.“

Dieser Text enthät eine Themenliste mit Erläuterungen zum Seminar WIF7 – „Neue Entwicklungen im Datenbankgeschehen – NoSQL usw.“

1      Einführung

1.1      Um was geht’s?

Die Datenbankpraxis und mit ihr die Datenbanktheorie haben in den letzten 20 Jahren eine gewaltige Entwicklung genommen. Die klassischen Theorien (relational, objektorientiert) sind ergänzt worden um weitere, die der Vielfalt, Dynamik und Größe der Datenbestände, die inzwischen anfallen (im Internet und anderswo), gewachsen sind.

In diesem Seminar arbeiten wir uns in die Thematik ein, indem wir

  • die methodischen Grundlagen und
  • die verschiedenen Typen von Datenbanken / Datenbanksystemen

dieser neuen Datenbank- und Datenbanksystemtypen kennenlernen.

Konkret wird in jedem Vortrag ein Datenbanksystem vorgestellt.

In Kapitel 3 von:

Staud, Josef L.: Relationale Datenbanken. Grundlagen, Modellierung, Speicherung, Alternativen. Vilshofen 2015.

findet sich eine (sehr) kurze Beschreibung der NoSQL-Thematik. Siehe auch: www.staud.info/dbs/index.htm.

1.2      Zu bearbeitende Fragen

Für alle betrachteten Datenbanken/Datenbanksysteme sollen folgende Fragen beantwortet werden:

  • Welche Datentypen/Datenstrukturen werden unterstützt?
  • Gibt es ein Datenmodell? Falls ja: wie sieht es aus? Schemafreiheit?
  • Anwendungsgebiete, typisches Einsatzszenario
  • Wie werden sie aufgesetzt und skaliert?
  • Replikation und Skalierung?
  • Vor- und Nachteile
  • „Verteilt oder nicht“?
  • Wie werden die CRUD-Operationen (Create, Read, Update, Delete) realisiert? Welche Abfragesprachen liegen vor/werden empfohlen?
  • Liegt Skalierbarkeit vor? Falls ja: vertikal? horizontal?

Insgesamt: Durch welche Strukturen und Anforderungen in den Datenbeständen wurde das jeweilige Datenbanksystem motiviert?

Bei InMemory- und XML-Datenbanken wurde der Fragenkatalog spezifiziert (vgl. unten).

1.3      Theoretische Grundlagen

Die Welt der „Neuen Datenbanktechnologien“ benötigt „neue“ theoretische Grundlagen, die v.a. aus der Notwendigkeit herrühren, Datenbanken in weltweit vernetzten Systemen zu realisieren:

  • Map/Reduce
  • CAP-Theorem
  • Consistent hashing
  • MVCC-Protokoll
  • Vector Clocks
  • Paxos
  • REST, REST-API
  • Spaltenorientierte Datenbanken

Falls eines dieser Themen bei dem von Ihnen gewählten Thema eine Rolle spielt, erläutern Sie es bitte. Es macht auch nichts, wenn ein Thema in mehreren Vorträgen, evtl. mit anderen Beispielen, vorkommt.

Diese theoretischen Grundlagen sind ausführlich und anschaulich dargestellt in [Edlich, Friedland, Hampe u.a. 2011], teilweise und kurz gefasst in [Perkins, Redmond und Wilson 2018a] und auch in den Büchern zu den einzelnen Systemen.

2      NoSQL Datenbanken / Datenbanksysteme

Die folgenden Datenbanken/Datenbanksysteme können in den Vorträgen vorgestellt werden. Die angegebenen Literaturhinweise stellen Einstiegspunkte dar. Ein Literaturverzeichnis findet sich in Kapitel 3.

2.1      HBase

Wide Column Store Wide Column Store

Angesiedelt im „Hadoop ecosystem“, wie es [Perkins, Redmond und Wilson 2018a, S. 55] formulieren.

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Hunger, Spichale und George 2013]

2.2      MongoDB

Dokumentendatenbank mit BSON

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Nitschinger und Trelle 2014]

2.3      Neo4J

(Eingebettete) Graphdatenbank

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a], [Wolff, Hunger, Spichale und George 2013]

2.4      CouchDB

Dokumentendatenbank mit JSON

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a]

2.5      DynamoDB

Ausgangspunkt: [Perkins, Redmond und Wilson 2018a]

2.6      DEX

Graphdatenbank

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.7      Cassandra

Wide Column Store

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Wolff, Hunger, Spichale und George 2013]

2.8      Chordless

Key/Value-System

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.9      Riak

Key/Value-Systeme „mit starken Document-store-Eigenschaften (JSON)“ [Edlich, Friedland, Hampe u.a. 2011, S. 179]

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Wolff, Nitschinger und Trelle 2014]

2.10   Membase

Key/Value-System

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.11   AllegroGraph

Graphatenbank

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.12   HyperGraphDB

Gaphdatenbank

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.13   OrientDB

Multimodel-Datenbank

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.14   AmazonSimpleDB

Wide Column Store e

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011]

2.15   Redis

Key/Value-System ep

Ausgangspunkt: [Edlich, Friedland, Hampe u.a. 2011], [Perkins, Redmond und Wilson 2018a]

2.16   InMemory-Datenbanken

Einige der in 1.2 angeführten Fragen haben hier keine Bedeutung, da es sich hier um (typischerweise) relationale Datenbanken handelt (evtl. aber spaöltenorientiert). Hier können aber betrachtet werden:

  • Bedeutung der Spaltenorientierung?
  • Anwendungsgebiete, typisches Einsatzszenario. Notwendigkeit?
  • Technische Realisierung?
  • Vor- und Nachteile

Insgesamt: Durch welche Strukturen und Anforderungen in den Datenbeständen wurde dieser Datenbankansatz und seine prktische Umsetzung motiviert?

Ausgangspunkt: [Plattner und Zeier 2011]. [Plattner 2013]

2.17   XML und Datenbanken

XML ist mit Sicherheit im Studium thematisiert worden. Hier geht es darum, den Zusammenhang zwischen XML und Datenbanktechniken vorzustellen. Folgende Themen können betrachtet werden:

  • Warum XML
  • Warum XML-Datenbanken und -Datenbanksysteme
  • Was ist ein XML-Dokument? Verwaltete Informationen? Datenstruktur? XML-Schema?
  • Abfrage? Auswertung? (Xpath/Xquery)
  • XML-Datenbanken? Beispiel? Evtl. BaseX [Gruppe 2018, Position 9490]

Ausgangspunkt: [Schöning 2003] [Grupe 2018]

3      Literatur

Die besonders wichtigen und umfassenden Buchtitel wurden fett gesetzt.

Edlich, Friedland, Hampe u.a. 2011
Edlich, Stefan; Friedland, Achim; Hampe, Jens; Brauer, Benjamin und Brückner, Markus: NoSQL. Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken (2. Auflage). München 2011 (Hanser)

Fondermann, Spichale und George 2012
Fondermann, Bernd; Spichale, Kai und George, Lars: BigData. Apache Hadoop. E-Book 2014 (entwickler.press)

Gull 2012
Gull, Clemens: Web-Applikationen entwickeln mit NoSQL. Haar 2012 (Franzis)

Grupe 2018
Grupe, Wilfried: XML: Grundlagen, Technologien, Validierung, Auswertung. Frechen 2018

Gumm und Sommer 2011
Gumm, Heinz-Peter; Sommer, Manfred: Einführung in die Informatik (9. Auflage). München und Wien 2011

Harrison 2015
Harrison, Guy: Next Generation Databases. NoSQL, NewSQL, and BigData, New York 2016 (E-Book)

Kastens und Büning 2008
Kastens, Uwe und Büning, Hans Kleine Büning: Modellierung. Grundlagen und formale Methoden (2. Auflage). Bonn 2008 (Hanser)

Kurowski 2012
Kurowski, Oliver: NoSQL Einführung. CouchDB, MongoDB und Redis. E-Book 2012 (entwickler.press)

Mennerich und Arrasz 2015
Mennerich, Christian und Arrasz, Joachim: Eine Reise durch die Welt von NoSQL. E-Book 2015 (entwickler.press)

O’Reilly 2012
O’Reilly: Big Data Now. 2012 Edition

Perkins, Redmond und Wilson 2018a
Perkins, Luc; Redmond, Eric; Wilson, Jim R.: Seven Databases in Seven Weeks. A Guide to Modern Databases and the NoSQL Movement (2. Auflage). Raleigh 2018

Perkins, Redmond und Wilson 2018b
Perkins, Luc; Redmond, Eric; Wilson, Jim R.: Seven Databases in Seven Weeks. A Guide to Modern Databases and the NoSQL Movement (2. Auflage). Raleigh 2018 (E-Book)

Plattner und Zeier 2011
Plattner, Hasso und Zeier, Alexander: In-Memory Data Management. An Inflection Point for Enterprise Applications. Berlin, Heidelberg 2011

Plattner 2013
Plattner, Hasso: Lehrbuch In-Memory Data Management. Wiesbaden 2013

Schöning 2003
Schöning, Harald: XML und Datenbanken. Konzepte und Systeme.München und Wien 2003

Schrempp 2012
Schremp, Mirko (Hrsg.): BigData – Technologiegrundlagen. E-Book 2012 (entwickler.press)

Trelle 2014
Trelle, Tobias: MongoDB. Der praktische Einstieg. Heidelberg 2014

Wartala 2012
Wartala, Ramon: Hadoop. Zuverlässige, verteilte und skalierbare Big-Data-Anwendungen. München 2012 (Open Source Press)

Welkenbach und Schmutz 2012
Welkenbach, Peter und Schmutz, Guido: Relationale, NoSQL- und NewSQL-Datenbanken. In [Schrempp 2012 (E-Book)]

Wolff, Hunger, Spichale und George 2013
Wolff, Eberhard; Hunger, Michael; Sichale, Kai und George, Lars : NoSQL-Überblick. Neo4j, Apache Cassandra und HBase. E-Book 2013 (entwickler.press) <<Gut zu lesen – prima für den Einstieg>>

Wolff, Nitschinger und Trelle 2014
Wolff, Eberhard; Nitschinger, Michael und Trelle, Tobias: NoSQL-Überblick. Couchbase, Riak, MongoDB. E-Book 2014 (entwickler.press)

 

[1]    Wolf-Rüdiger Hansen, Geschäftsführer des Verbandes Automatische Identifikation, Datenerfassung und Mobile Kommunikation e.V. (AIMD), zitiert nach [Lange 2013, S. 109].

13/10/2017

Texte zur Vorlesung DBS

Filed under: - haw lh ws17/18 dbs,Texte zur Vorlesung — admin @ 10:44

Werte Studierende

hier das Textmaterial zu unserer Vorlesung DATENBANKSYSTEME:

Text zu Relationalen Datenbanken auf meiner WebSeite:

http://www.staud.info/dbs/index.htm

Aufgaben/Fragen zu den besprochenen Kapiteln (PDF):

2 AufgabenDBS 2018 01 25 BLOG

Befehle zum Einrichten der Datenbanken (PDF):

3 SQL-BefehlePortal

Musterklausur (PDF):

HAW Klausur DBS 20180205 MUSTERKLAUSUR

Einführung in SQL / Stand 2017 12 22 (d.h., der von uns durchgearbeitete Text):

1a SQL NEU 2017 12 22

Text zur Entity Relationship – Modellierung (PDF) / Stand 2017 12 22:

1c ERMod 2017 12 22

MfG

Prof. Dr. Josef L. Staud

10/10/2017

Der Weg vom Anwendungsbereich zur Datenbank und ihren Dateien

Filed under: - haw lh ws17/18 dbs,Vom AWB zur DB — admin @ 08:50

Abbildung 1.1-1 von [Staud 2015]

 

13/09/2017

Vorlesung DATENBANKSYSTEME WS17/18

Filed under: - haw lh ws17/18 dbs,Einführung — admin @ 08:55

Werte Studierende,

ich begrüße Sie sehr herzlich zu unserer Vorlesung DATENBANKSYSTEME UND -ANWENDUNGEN im WS 2017/18 an der HAW Landshut.

WebSite und Mailadresse:

www.staud.info     josef.staud@haw-landshut.de

Unsere Themen:

  • Relationale Datenbanken – Grundlagen
  • Relationale Datenbanken – Modellierung, Design
  • Relationale Datenbanken – Speicherung
  • SQL
  • ER-Modellierung
  • „Neue Datenbanktechnologien“ (NoSQL, Big Data, usw.)

Texte:

  • [Staud 2015]: Staud, Josef: Relationale Datenbanken. Grundlagen, Modellierung, Speicherung, Alternativen. Vilshofen 2015.
  • [SQL-Skript]: Kapitel 19 des obigen Buches (zu SQL), in einer neuen überarbeiteten Version!
  • PDF-Dokument zur Entity Relationship-Modellierung
  • Fragenkatalog mit potentiellen Prüfungsfragen

Einzelne Texte sind auch auf www.staud.info veröffentlicht.

Unsere Systeme:

  • mySQL auf der Basis XAMPP, phpMyAdmin
  • ACESS

Terminplanung Stand 2017 10 02:

Die Ersteller der Wochenpläne sehen vor, dass wir im 2-wöchigen Wechsel Vorlesungen bzw. Übungen haben.Da wir in einer „geraden Kalenderwoche“ beginnen, starten wir mit SQL, allerdigns nicht ohne wenigstens die elementaren Grundlagen vorab zu vermitteln.

Da für beides der Raum TI009 vorgesehen ist, können wir flexibel vorgehen. Können also z.B. auch in der Vorelsung die PC nutzen.

Planung Stand 2017 10 02 (wird sich bestimmt noch ändern):

Woche 40 41 42 43 44 45 46 47 48 49 50 51 2 3 4
4./5.10 11./12.10 18./19.10. 25./26.10 1./2.11. 8./9.11. 15./16.11. 22./23.11. 29./30.11. 6./7.12. 13./14.12. 20./21.12. 10./11.1. 17./18.1. 24./25.1.
2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

2V

2V

2P

2P

SQL RM SQL RM SQL RM SQL RM SQL ERM ACCESS ERM ACCESS NoSQL ACCESS

P: Praktikum Datenbanksysteme

V: Vorlesung

Prüfung:

Schriftliche Abschlussprüfung (90 Minuten)

12/10/2016

Seminar „Aktuelle Entwicklungen im Datenbankgeschehen“ an der HAW Landshut

Filed under: Seminar Datenbankgeschehen — admin @ 10:07

Thema des Seminars: Aktuelle Entwicklungen im Datenbankgeschehen

WS 2016/2017

Einführungsveranstaltung: 14. 10. 2016, 8.45 – 12.00 Uhr

Inhalt:

Es geht erstens darum, die wichtigen aktuellen Entwicklungen bei Datenbanken und Datenbanksystemen zu betrachten. Falls Zeit bleibt, werden wir vesuchen, die „Stammdatenkrise“ etwas zu hinterfragen. Was sind die Ursachen, was kann man dagegen tun?

 

Inhalte

(1) Aktuelle Entwicklungen

Auszug aus der Gliederung meines letzten Buches zu DATENBANKEN (siehe unten):

24   Andere (nicht relationale) Datenbanken. 377

24.1 OLTP und OLAP. 377

24.2 Dimensionale Datenbanken. 379

24.3 Spaltenorientierte Datenbanken. 390

24.4 NoSQL-Datenbanken – Überblick. 393

24.4.1 Definition. 394

24.5 BigData. 397

24.6 Konsistenz, CAP-Theorem… 404

24.7 Schemafreiheit 406

24.8 Key/Value – Datenbanken. 408

24.9 Graphendatenbanken. 411

24.10   Dokumentendatenbanken. 412

24.11   InMemory – Datenbanksysteme. 417

(2) „Bessere Datenbanken“

Auszug aus der Gliederung meines letzten Buches zu DATENBANKEN:

14   Muster in Anwendungsbereichen und Modellen. 167

14.1 Ähnlichkeit – Generalisierung / Spezialisierung. 167

14.2 Einzel- und Typinformation. 175

14.3 Enthaltensein – Aggregation. 180

14.4 Enthaltensein und Existenzabhängigkeit – Komposition. 184

14.5 Beziehungsattribute. 188

15   Die Zeit in Datenmodellen und Datenbanken. 193

15.1 Zeitlich fixiert oder zeitabhängig. 193

15.2 Duplizieren zum Zeitpunkt der Rechnungsstellung. 194

15.3 Andere Lösungen. 195

————————————–

Das Buch ist in der Bibliothek vorhanden:

Staud 2015
Staud, Josef: Relationale Datenbanken. Grundlagen, Modellierung, Speicherung, Alternativen. Vilshofen 2015. ISBN 978-3-9817175-1-8

————————————–

Die einschlägigen Kapitel des Buches sind der Ausgangspunkt für die zu erarbeitenden Themen. Weitere Literatur muss natürlich ausgewertet werden. Eine umfassende Literaturliste findet sich im Buch und auf www.staud.info, wo auch das gesamte Buch, aufbereitet in HTML-Seiten, vorliegt.

16/04/2015

Neues Buch zu Relationalen Datenbanken und mehr

Filed under: Bücher zum Thema — admin @ 10:49

Relationale Datenbanken. Grundlagen, Modellierung, Speicherung, Alternativen

März 2015 – 431 Seiten – 143 Abbildungen
ISBN 978-3-9817175-2-5

Beziehbar über den Buchhandel, Amazon oder vom Autor selbst (staud@staud.info).

Auszüge auf www.staud.info –> DATENBANKEN / Relationale Datenbanken

Vorwort des Buches

Datenbanken waren noch nie so wichtig. Diese Aussage mag überraschen, angesichts der Bedeutung, die Datenbanken in den letzten 50 Jahren schon gewonnen haben. Sie ist aber, angesichts der Herausbildung einer digitalen Parallelwelt, richtig.

Datenbanken werden überall dort benötigt, wo – im Rahmen der Informatisierung – Informationen „erhalten bleiben sollen“. Da dies für so gut wie alle Anwendungs- und Lebensbereiche gilt, ergibt sich eine entsprechende Verbreitung von Datenbanken und ein entsprechender Bedarf an Wissen über Datenbanktechniken.

In einer Zeit aber, in der sich die Weltgesellschaft mit dem Internet eine digitale Parallelwelt geschaffen hat, in der sie privat, geschäftlich, kriminell, in staatlichem Auftrag, usw. aktiv ist, ist dieser Bedarf noch größer geworden. Denn alle diese Netzaktivitäten beruhen auf bzw. führen zu Datenbanken. Natürlich Datenbanken der verschiedensten Art. Netzwerkdaten im Social Web, wo Terabyte von Daten bereits emsig ausgewertet werden; Datenbanken der Suchmaschinen, die letztendlich auf die Technologie der „inverted files“ zurückgehehen; „Unstruktierte Daten“ der unterschiedlichsten Art, usw. Und die schon altbewährten Relationalen Datenbanken, die einen sehr großen Anteil am Gesamtbestand von Datenbanken halten, v.a. in den Unternehmen.

Um die Relationalen Datenbanken geht es in diesem Buch in erster Linie. Sie sollen umfassend dargestellt werden und auch der Weg zu ihnen: Vom Anwendungsbereich zur konzeptionellen und logischen Datenmodellierung, dann zum Datenbankdesign und zur Einrichtung der Datenbank. Zum Schluss werden noch die physischen Datenstrukturen beschrieben, auf denen die heutigen Speichertechniken beruhen.

Daneben werden aber auch die wichtigsten Alternativen kurz beschrieben. Alternative Datenmodelle (semantische und logische) und alternative Datenbanktechnologien, von dimensionalen Datenbanken über NoSQL-Datenbanken bis zur InMemory-Technologie.

Bezüglich der relationalen Datenbanktheorie sind in diesem Buch folgende Themen neu und so anderweitig nicht abgedeckt:

  • Die intensive Betrachtung von Mustern in Anwendungsbereichen und in relationalen Datenmodellen(„Semantik sucht Syntax“). Dies sollte die konkrete Datenmodellierung erleichtern.
  • Die Erweiterung der Kardinalitäten zur durchgängigen Betrachtung von Min-/Max-Angaben bei relationalen Verknüpfungen („wieviele Teilnehmer mindestens, wieviele höchstens“). Auch dies sollte bei einer modernen Modellierung so sein.
  • Die Betrachtung des gesamten Wegs von der Wahrnehmung des Anwendungsbereichs bis zur Erstellung der Datenbank und der physischen Datenorganisation.
  • Zahlreiche Beispiele für relationale Datenmodellierung, einige mit Lösungsweg, einige ohne. Dies ist motiviert durch die Erfahrung aus jahrzehntelanger Lehr- und Beratungstätigkeit, dass Datenmodellierung beim Umgang mit Datenbanken die größten Probleme macht und vielerorts nur eingeschränkt beherrscht wird.

Josef Ludwig Staud

 

Inhaltsverzeichnis des Buches

1       Einleitung. 15

1.1   Aufbau des Buches, Gesamtüberblick. 15

1.2   Datenbanken. 18

1.3   Logische Datenmodelle, Datenorganisation. 20

1.4   Relationale Datenbanksysteme. 21

1.5   Die drei Ebenen der ANSI-SPARC – Architektur 24

1.6   Syntax, Semantik, Pragmatik. 25

2       Informationen, Daten, Attribute. 29

2.1   Informationen, Daten. 29

2.2   Klassifizierung von Daten. 31

2.3   Zeichen, Zeichenvorrat 33

2.4   Attribute. 33

3       Konzeptionelle Modellierung. 39

3.1   Anwendungsbereiche. 39

3.2   Objekte und Beziehungen erkennen. 40

3.3   Klassen bilden. 42

3.4   Beispiele. 43

3.5   Zusammenfassung. 44

4       Relationen bilden. 49

4.1   Von Klassen zu Relationen. 49

4.2   Eigenschaften und Darstellung von Relationen. 51

5       Beziehungen erkennen und einrichten. 57

5.1   Beziehungen erkennen. 57

5.2   Schlüssel und Fremdschlüssel 60

5.3   Umsetzung von 1:1. 61

5.4   Min-/Max-Angaben und „1:1 vertieft“. 62

5.5   Umsetzung von 1:n. 66

5.6   Umsetzung von n:m… 69

5.7   Verknüpfung konkret 72

5.8   Mehrstellige Beziehungen. 74

5.9   Integritäten. 75

5.10 Schlüssel vertieft 76

6       Zusammenfassung Grundlagen. 79

6.1   Erste Schritte. 79

6.2   Warum eigentlich flache Tabellen?. 80

7       Die erste Normalform (1NF) 85

7.1   Optimierung durch Normalisierung. 85

7.2   Definition und Herbeiführung. 86

7.3   Tupelvermehrung. 87

7.4   Zerlegung nach 1:n. 88

7.5   Zerlegung nach n:m… 90

7.6   Schlechte Lösungen. 95

7.7   Darstellung ganzer Relationaler Datenmodelle. 97

7.8   Redundanzen in 1NF-Relationen. 100

7.9   Anomalien. 102

8       Funktionale Abhängigkeiten. 105

8.1   Einführung. 105

8.2   Funktionale Abhängigkeit 106

8.3   Schneller Weg zum Erfolg. 110

8.4   Einfache und volle FA.. 113

8.5   Schlüssel (formaler) 115

9       Die zweite Normalform (2NF) 117

9.1   Redundanz trotz 1NF. 117

9.2   Definition. 119

9.3   Beispiel AUFTRÄGE.. 119

9.4   Beispiel PROJEKTMITARBEIT.. 122

9.5   Zerlegung und Zusammengehörigkeit 125

10    Die dritte Normalform (3NF) 127

10.1 Redundanz trotz 2NF. 127

10.2 Beispiel Auftragsköpfe. 128

10.3 Beispiel Angestellte. 129

10.4 Beispiel Aufträge / Artikel / Kunden. 131

10.5 Definition 3NF. 133

11    Die Boyce-Codd – Normalform (BCNF) 137

11.1 Redundanz trotz 3NF. 137

11.2 Beispiel Projektmitarbeit 139

11.3 Definition BCNF. 142

11.4 Noch ein Beispiel 142

12    Die vierte Normalform (4NF) 145

12.1 Das Defizit 145

12.2 Beispiel Vorlesungsbetrieb. 145

12.3 Mehrwertige Abhängigkeit 148

12.4 Definition 4NF. 150

13    Die fünfte Normalform (5NF) 153

13.1 Verbund (Join) und Projektion. 153

13.2 N-Zerlegbarkeit 157

13.3 Definition. 161

13.4 Regeln für die Erstellung relationaler Datenmodelle. 163

14    Muster in Anwendungsbereichen und Modellen. 167

14.1 Ähnlichkeit – Generalisierung / Spezialisierung. 167

14.2 Einzel- und Typinformation. 175

14.3 Enthaltensein – Aggregation. 180

14.4 Enthaltensein und Existenzabhängigkeit – Komposition. 184

14.5 Beziehungsattribute. 188

15    Die Zeit in Datenmodellen und Datenbanken. 193

15.1 Zeitlich fixiert oder zeitabhängig. 193

15.2 Duplizieren zum Zeitpunkt der Rechnungsstellung. 194

15.3 Andere Lösungen. 195

16    Modellierungsbeispiele mit Lösungsweg. 199

16.1 Rechnungsstellung. 199

16.2 Sportverein. 209

16.3 PC-Beschaffung. 214

16.4 Fachliteratur 220

16.5 Hochschule – Vorlesungsbetrieb. 229

16.6 Sprachenverlag. 238

17    Weitere Modellierungsbeispiele. 249

17.1 Obst 249

17.2 Haushaltsgeräte. 251

17.3 Angestellte. 253

17.4 Kfz-Werkstatt 257

17.5 WebShop. 258

17.6 Zoo. 261

18    Von Attributen zu Datentypen. 267

18.1 Vielfalt 267

18.2 Die Datentypen von MySQL.. 271

18.3 Die Datentypen von ORACLE SQL.. 278

18.4 Die Datentypen von ACCESS. 280

18.5 Welcher Datentyp für welches Attribut?. 284

19    SQL – Eine Kurzeinführung. 287

19.1 Einleitung. 287

19.2 Relationen anlegen und löschen. 290

19.3 Eingeben von Daten. 295

19.4 Abfragen der Daten mit Select 299

19.4.1 Projektion. 300

19.4.2 Parameter IN.. 311

19.5 Gezieltes Löschen und Korrigieren. 312

19.6 Maskierung mit LIKE.. 314

19.7 Funktionen. 316

19.8 Verknüpfen von Relationen. 323

19.9 Transaktionen. 332

20    Vom Zeichen zur Datenbank. 343

20.1 Die Ebenen. 343

20.2 Übersicht 345

21    Dateitechniken. 347

21.1 Datenmodell – Datenbank – Datei 347

21.2 Stapeldateien. 348

21.3 Sequenzielle Dateien. 349

21.4 Indexsequenzielle Dateien. 352

21.5 Direktzugriffsdateien/Hashing. 354

22    Speichermedien. 357

22.1 Periphere Speicher 357

22.2 Konkrete Speicherung. 358

22.3 Magnetische Speicher 358

22.4 Optische Speicher 362

22.5 Elektronische Speicher 367

23    Andere Datenmodelle. 373

23.1 Semantische Datenmodelle. 373

23.2 Logische Datenmodelle. 374

24    Andere Datenbanken. 377

24.1 OLTP und OLAP. 377

24.2 Dimensionale Datenbanken. 379

24.3 Spaltenorientierte Datenbanken. 390

24.4 NoSQL-Datenbanken – Überblick. 393

24.4.1 Definition. 394

24.5 BigData. 397

24.5.1 Parallelwelten. 397

24.5.2 Ursache 1: Immer mehr Daten in den Rechnernetzen. 398

24.5.3 Ursache 2: Internet der Dinge und Industrie 4.0. 399

24.5.4 Immenser Speicherbedarf und Vielfalt 401

24.5.5 Volume, Velocity, Variety. 402

24.5.6 Skalierbarkeit 402

24.5.7 Parallelisierung mit Hilfe des MapReduce-Frameworks. 403

24.6 Konsistenz, CAP-Theorem… 404

24.7 Schemafreiheit 406

24.8 Key/Value – Datenbanken. 408

24.9 Graphendatenbanken. 411

24.10   Dokumentendatenbanken. 412

24.11   InMemory – Datenbanksysteme. 417

Index. 421

Literatur 427

Powered by WordPress