[Inhaltsverzeichnis] [Home DissOnline] [Anfang] [Vorheriges Kapitel] [Nächstes Kapitel] [Ende]



4. Erstellung von Metadatenbanken für Umweltchemikalien

4.1 Metadatenbank der Online Datenbanken - DADB

Wie schon oben erwähnt, wurden Metadatenbanken zu den Fragestellungen Chemikalien und Umweltschutz entwickelt, gepflegt und ausgebaut [Voigt 1992]. Eine dieser Metadatenbanken ist die Metadatenbank der Online Datenbanken DADB. Der Dokumentenstand beträgt 453 Einträge (Stand 31.01.97) von nationalen und internationalen Datenbanken auf dem Gebiet der Informationen über Chemie und Umweltschutz.

4.1.1 Datenbankdefinition von DADB

Diese Metadatenbank wurde mit der kommerziellen Software LARS erstellt. Die Abkürzung LARS steht für "Leistungsstarkes Archivierungs- und Recherchesystem" [WEKA, 1992]. Es werden folgende Feldwerte unterschieden: Alphanumerisch, Text, ganze Zahl, Volltext, Kommazahl, Formel (zum Rechnen), Datum, Zeit und Betrag.

In der Tabelle 2 ist die Datenbankdefinition von DADB festgehalten.

Als Feldwerte sind für diese Datenbank "alphanumerisch", "ganze Zahl", "Datum", "Betrag" und "Volltext" gewählt worden.

Neben den administrativen Datenfeldern (1-4) unterscheidet man die bibliographischen Felder (5-26) und die inhaltserschließenden Datenfelder (fettgedruckt).

Unter den bibliographischen Datenfeldern findet man die Kurzbezeichnung und die Bezeichnung der Online Datenbank. Danach schließen sich die Felder Host und sonstige Hosts an. Auf die Hosts (Datenbankanbieter) wurde bereits im Kapitel 2.4.2 eingegangen.

Tabelle 2: Datenbankdefinition DADB (inhaltserschließende Datenfelder fett gedruckt)

PositionFeldname
Kurzbez.
Feldwerte
01Dokumentennummer
DO
ganze Zahl
02Datum
DA
Datum
03Standort
ST
alphanumerisch
04Bearbeiter
BE
alphanumerisch
05Kurzbezeichnung
KU
alphanumerisch
06Bezeichnung
BZ
alphanumerisch
07Host (Datenbankanbieter)
HO
alphanumerisch
08sonstige Hosts
SH
alphanumerisch
09Produzent (Datenbankhersteller)
PR
Volltext
10Typ der Datenbank
TY
alphanumerisch
11Typ 2
TP
alphanumerisch
12Sachgebiet
SA
alphanumerisch
13Quellen
QU
alphanumerisch
14Sprache
SP
alphanumerisch
15Retrievalsprache
RE
alphanumerisch
16ab wann (sind Einträge vorhanden)
AB
ganze Zahl
17bis wann (sind Einträge vorhanden)
BI
ganze Zahl
18Aktualisierung (Update)
UP
alphanumerisch
19Umfang
UM
ganze Zahl
20Zuwachs/Jahr
ZU
ganze Zahl
21Kosten/h
KO
Betrag
22Online Kosten
ON
Betrag
23Offline Kosten
OF
Betrag
24SDI Kosten
SD
Betrag
25sonstige Kosten
SK
Betrag
26Arbeitsunterlagen
AR
alphanumerisch
27Informationstyp
IT
alphanumerisch
28Anwendung der Chemikalien
AW
alphanumerisch
29Anzahl der Stoffe
AN
ganze Zahl
30Deskriptoren (Parameter-Testdatensatz)
DE
alphanumerisch
31Chemikalien-Testdatensatz
TE
ganze Zahl
32Sonstiges
SO
alphanumerisch
33Pflege der DADB
PF
alphanumerisch

In DADB werden Datenbanken der folgenden Hosts ausgewertet: CDP, CIS (Chemical Information Service), DATASTAR, DIALOG, DIMDI (Deutsches Institut für Medizinische Dokumentation und Information), ECHO (European Communities Host Organization), ESA (European Space Agency), FIZ Technik, GBI (German Business Information), ICSTI (International Centre for Scientific and Technical Information), ORBIT, Questel, STN (Scientific and Technical Information Network), VINITI (The All Russian Institute of Scientific and Technical Information) und einige kleinere Hosts, die nur ein oder zwei Datenbanken anbieten. Es zeichnet sich auf dem Datenbankanbieter-Markt eine Konzentrierung ab. Beispielsweise sind DIALOG und DataStar in der Firma Knight-Ridder Information zusammengefaßt. Ebenso fand ein Zusammenschluß von ORBIT und QUESTEL statt. BRS wird seit kurzem unter dem Namen CDP Technologies geführt. Da jedoch die früheren Strukturen, u.a. auch unterschiedliche Retrievalsprachen bestehen blieben, werden die Hosts weiter getrennt aufgeführt.

Der Produzent oder auch Datenbankhersteller wird in DADB mit der vollständigen Adresse angegeben. Zu diesem Feld wurden bereits in Kapitel 2.4.1 Ausführungen gemacht. Ebenso wurde im Kapitel 2. 5 die Typisierung der Datenbanken ausführlich besprochen. Zwei Datenfelder, Typ der Datenbank und Typ 2 wurden eingerichtet. Oftmals ist eine eindeutige Zuordnung zu einem einzigen Typ nicht möglich. Beispielsweise ist die Datenbank BEILSTEIN nicht nur als eine Faktendatenbank, sondern auch als eine Strukturdatenbank und als Reaktionsdatenbank eingestuft.

Im Feld Sachgebiet werden die Hauptthemen der Datenbank im Freitext wiedergegeben. Im Feld Quellen findet man die Art der erschlossenen Publikationen. Beispiele hierfür sind: Fachzeitschriften, Fachbücher, Forschungsberichte, Proceedingsbände, Dissertationen, Patente, Firmenberichte, graue Literatur etc. Es folgen die Datenfelder Sprache und Retrievalsprache, die deutlich voneinander zu unterscheiden sind. Unter dem Feld Sprache ist die Sprache zu verstehen, in der die Datenbank aufgebaut wurde. Über 90 % der in DADB inkorporierten Datenbanken sind auf englisch. Unter dem Begriff Retrievalsprache ist die jeweilige Abfragesprache für die Datenbanken zu verstehen. Für die Suche in Online Datenbanken muß der Host Retrievalprogramme bereitstellen. Jeder Host verfügt über seine eigene Retrievalsprache. Der Rechercheur benutzt für seine Suche einen Satz von Kommandos, die als Retrievalsprache bezeichnet werden. Trotz Bemühungen einiger europäischer Hosts gibt es bisher keine allgemein verbindliche Retrievalsprache, so daß der Rechercheur mehrere Retrievalsprachen beherrschen muß [Kind 1991]. Einige Hosts bieten die Möglichkeit der menügesteuerten Abfrage in einigen ihrer angebotenen Datenbanken. In diesen Fällen entfällt das Erlernen der Retrievalsprache.

In den Datenfeldern ab wann und bis wann wird die Zeitspanne vermerkt, seit wann die Datenbank aufgebaut wird und bis wann sie weiter gepflegt wird. In der Regel ist keine Eintragung im Feld bis wann zu finden. Es gibt jedoch einige Datenbanken, die nicht weiter gepflegt werden, aber dennoch weiter online verfügbar sind. In diesen Fällen ist im Datenfeld bis wann ein Eintrag des Termins der Schließung der Datenbank vermerkt. Es schließt sich das Datenfeld Aktualisierung (Update) an. Hier wird die Frequenz der Pflege der Datenbank vermerkt. Online Datenbanken werden unterschiedlich häufig gepflegt. Die Aktualisierungsfrequenz reicht von täglich bis jährlich. Einige Datenbanken werden auch unregelmäßig gepflegt. Das Feld Nr. 33 Pflege der DADB bezieht sich hingegen auf die Pflege der Metadatenbank. Umfang und Zuwachs pro Jahr beziehen sich auf die Anzahl der Dokumente, die in der betreffenden Online Datenbank zu finden sind und auf die Anzahl der jährlich hinzukommenden Einträge. Es schließen sich fünf Datenfelder, die sich mit den Kosten der Recherche befassen, an. Zunächst einmal handelt es sich um die Kosten/h, d.h. die Anschaltkosten, die man für die Verbindung mit dem Host in der Datenbank zahlt. Die Bezeichnungen Online Kosten und Offline Kosten beziehen sich auf die Preise für die Ausgabe der einzelnen Dokumente online, d. h. am eigenen Rechner inklusive. des Herunterladens der Dokumente bzw. offline, d.h. bei der Übersendung der Dokumente durch den Host. Unter dem Begriff SDI (Selective Dissemination of Information) bezieht sich auf die selektive Informationsverbreitung. Es handelt sich um einen besonderen Vorgang zur regelmäßigen Ermittlung von Informationen aus Online Datenbanken. Der Nutzer formuliert ein Suchprofil in einer Datenbank als SDI-Suche. Diese Suche wird von einem Informationsretrieval-System bei jeder Aktualisierung der betreffenden Datenbank durchgeführt. Als Resultat erhält der Nutzer nach jeder Aktualisierung die gewünschten Antworten zu seinem Suchprofil [Barth 1992, S. 412]. Die Preise für die SDI Suche werden unter SDI Kosten aufgeführt. Für die Recherche in Online Datenbanken werden verschiedene Arbeitsunterlagen hergestellt. Dieses sind zunächst einmal die kurzen Datenbankbeschreibungen, die in Form von sog. Datenbankblättern, auch "fact sheets", "cream sheets" etc. genannt, herausgegeben werden. Auch gibt es für viele Datenbanken umfassende Manuals. Darüber hinaus ist für die inhaltliche Recherche in Datenbanken die Konsultation von Thesauri und Deskriptorenlisten zu empfehlen. In dem Datenfeld Arbeitsunterlagen werden diese vermerkt.

Es schließen sich die sog. inhaltserschließenden Datenfelder (27-31) an. Letztere sind in bezug auf die Thematik "Informationen über Chemie und Umweltschutz" oder "Umweltchemikalien" von übergeordneter Bedeutung. Die Eintragungen in diesen Feldern werden für den im weiteren beschriebenen Bewertungsansatz im besonderen herangezogen.

Unter dem Begriff Informationstyp oder Informationsparameter versteht man beispielsweise physikalisch-chemische Eigenschaften oder Strukturmerkmale. Es gibt Online Datenbanken, deren Schwerpunkte auf einzelnen Informationstypen liegen. Ebenso sind einige Datenbanken für spezielle Anwendungen von Chemikalien (z.B. Pestizide) ausgelegt. Darüber hinaus dient das Datenfeld Anzahl der Chemikalien als grobe Einstufung der Bedeutung der entsprechenden Online Datenbanken für das Thema. Es gibt Datenbanken, die zu über 100.000 Chemikalien Informationen vorhalten; bei anderen Quellen liegt die Anzahl der Stoffe bei einigen Hundert. Für das wichtigste inhaltserschließende Datenfeld, das Datenfeld Deskriptoren (Parameter-Testdatensatz), wurde ein Thesaurus entwickelt, der ca. 100 Schlagwörter oder Suchbegriffe aus den Fachgebieten des Umwelt-, Gesundheits- und Arbeitsschutzes enthält.

Das Datenfeld Testdatensatz Chemikalien dient zur Darstellung, welcher Stoff aus der Testchemikalien-Liste mit 68 umweltrelevanten Chemikalien in der entsprechenden Online Datenbank enthalten ist.

Beide Testdatensätze werden in den Kapiteln 4.1.2 und 4.1.3 näher erläutert.

4.1.2 Chemikalien-Testdatensatz

Für die pragmatische Vorgehensweise im Zusammenhang mit der Problematik der Umweltchemikalien wird versucht, die Anzahl der zu betrachtenden Stoffe einzugrenzen. National und international existieren hierzu einige Auswahlverfahren von prioritären Stoffen [GDCh 1986, Walker 1993, Hushon 1984]. Solche Auswahlsysteme für Chemikalien sind nützlich bei frühen Stufen in der Bewertung von neuen Stoffen und bei der Überprüfung von großen Chemikalienlisten an alten Stoffen z.B. des European Inventory of Existing Commercial Chemical Substances (EINECS) [Klöppfer 1994]. Es wurde in Deutschland in einem mehrstufigen Selektierungsprozeß eine Stoffliste von 512 Stoffen erarbeitet [GDCh 1992].

4.1.2.1 Auswahlverfahren

Die Liste der 512 Stoffe wurde weiter stufenweise eingegrenzt. Ziel war es, durch selektives Anlegen spezifischer Stoffkriterien, potentielle Lebensmittelkontaminanten zu erhalten. Unter Berücksichtigung des Vorkommens in der Umwelt, des Bioakkumulationspotentials und der Abbaubarkeit (Kriterien, die insbesondere auch potentielle Lebensmittelkontaminanten qualifizieren) wurden schließlich 68 Stoffe ausgewählt [Mücke 1987, Mücke 1989].

Diese Stoffliste, die als Grundlage für die weiteren Arbeiten dient, ist in Tabelle 3, alphabetisch geordnet nach dem systematischen Chemikaliennamen aufgelistet. Darüber hinaus werden die laufende Nummer (Testdatensatz Nummer) und die Chemical Abstracts Service Registry Number (CAS-Nummer) aufgeführt. In den letzten beiden Spalten werden die Anzahl der Treffer in DADB, d.h. in wievielen Online Datenbanken die einzelnen Chemikalien abgedeckt sind und deren prozentualer Anteil an der Gesamtheit der in DADB enthaltenen Datenbanken (Dokumentenstand: 453 Januar 1997) aufgeführt. Hierauf wird in Kapitel 6.4.2.3 noch näher eingegangen.

Tabelle 3: Chemikalien-Testdatensatz (68 Stoffe Testdatensatz)

Nr.Name der Substanz CAS-Nummer Anzahl der Treffer in DADB Anteil der Treffer in %
01Acenaphthylene 208-96-8171 38
02Anthracene 120-12-7280 62
03Benz[a]anthracene 56-55-3190 42
04Benzo[k]fluoranthene 207-08-9140 31
05Benzene, 1,3-Bis(1-methylethyl)- 99-62-791 20
06Benzene, 1-Chloro-2,4-dinitro- 97-00-7134 30
07Benzene, 1-Chloro-2-methyl- 95-49-8120 27
08Benzene, 1-Chloro-3-methyl- 108-41-897 21
09Benzene, 1-Chloro-4-methyl- 106-43-411 24
10Benzene, 1-Chloro-2-methyl-3-nitro- 83-42-156 12
11Benzene, 4-Chloro-1-methyl-2-nitro- 89-59-847 10
12Benzene, 1,4-Dibromo- 106-37-6125 28
13Benzene, 1,2-Dichloro- 95-50-1209 46
14Benzene, 1,3-Dichloro- 541-73-1180 40
15Benzene, 1,4-Dichloro- 106-46-7222 49
16Benzene, 1,2-Dichloro-3-nitro- 3209-22-176 16
17Benzene, Ethenyl- 100-42-5307 67
18Benzene, Ethyl- 100-41-4256 57
19Benzene, Hexachloro- 118-74-1266 59
20Benzene, Methylbis(phenylmethyl)- 26898-17-934 8
21Benzene, (1-Methylethyl)- 98-82-8210 46
22Benzene, (1-Methylethenyl)- 98-83-9142 31
23Benzene, 1,1'-Oxybis(methyl)- 28299-41-445 10
24Benzene, Propyl- 103-65-1160 35
25Benzene, 1,2,4-Trichloro- 120-82-1200 44
26Benzene, 1,2,4-Trimethyl- 95-63-6174 38
27Benzeneamine, 2-Chloro,4-nitro- 121-87-981 18
28Benzeneamine, N,N-Diethyl- 91-66-7144 32
29Benzeneamine, N-Phenyl- 122-39-4216 48
30Benzo[a]pyrene 50-32-8221 49
311,1'-Biphenyl,3,3'-Dimethyl- 612-75-960 13
321,1'-Biphenyl,4,4'-Dimethyl- 631-33-254 12
331,1'-Biphenyl, Ethyl- 40529-66-647 10
341,1'-Biphenyl, Methyl- 28652-72-485 19
351,1'-Biphenyl, 3-Methyl- 643-93-693 21
369H-Carbazole 86-74-8172 38
37Cyclohexane 110-82-7279 62
38Cyclohexane, 1,1-Dimethyl- 590-66-976 17
39Cyclohexane, 1,2-Dimethyl- 583-57-369 15
40Cyclohexane, 1,3-Dimethyl- 591-21-967 15
41Cyclohexane, 1,4-Dimethyl- 589-90-273 16
42Cyclohexane, Methyl- 108-87-2188 42
43Dibenz[a,h]anthracene 53-70-3157 35
44Ethane,1,1,2-Trichloro-1,2,2,-trifluoro- 76-13-1151 33
45Fluoranthene 206-44-0207 46
469H-Fluorene 86-73-7169 37
47Hexadecane 544-76-3196 43
48Methanone, Diphenyl- 119-61-9222 49
49Naphthalene 91-20-3267 59
50Naphthalene, 1-Chloro- 90-13-1143 32
51Naphthalene, 2-Chloro- 91-58-7128 28
52Naphthalene, Dimethyl- 28804-88-892 20
53Naphthalene, 1,3-Dimethyl- 575-41-776 17
54Naphthalene, 2,6-Dimethyl- 581-42-0104 23
55Naphthalene, 2-Ethyl- 939-27-578 17
56Naphthalene, Heptachloro- 32241-08-040 9
57Naphthalene, 1-Methyl- 90-12-0168 37
58Naphthalene, 2-Methyl- 91-57-6168 37
59Naphthalene, Trichloro- 1321-65-971 16
60Phenanthrene 85-01-8209 46
61Phenol, 4-(1,1-dimethylethyl)- 98-54-4143 32
62Phenol, 4-Dodecyl- 104-43-850 11
63Phenol, 4,4'-(1-Methylethylidene)bis- 80-05-7228 50
64Phenol, 4-Nonyl- 104-40-5142 31
65Phenol, 4-(1,1,3,3-Tetramethylbutyl)- 140-66-9107 24
66Phenol, 2,4,5-Trichloro- 95-95-4190 42
67Pyrene 129-00-0260 58
681,1',3',1''-Terphenyl,5'-Phenyl- 612-71-580 18

Erläuterungen siehe Text

Die Chemikalien sind unter ihrer englischen Bezeichnung aufgeführt, da der überwiegende Anteil der zu betrachtenden Datenbanken in englischer Sprache aufgebaut sind. Es wird deutlich, daß die Liste eine ganze Reihe von unterschiedlichen z.T. sehr bekannten Umweltchemikalien enthält z.B. Polycyclische Aromaten, halogenierte Aromaten, Biphenyle etc. enthält.

4.1.2.2 Klassifikation nach Strukturen bzw. funktionellen Gruppen

Tabelle 4: Chemische Klassifikation der Testdatensatz Stoffe (Erläuterungen siehe Text)

chemische Klassifikation Anzahl der Testdatensatz Stoffe
Kohlenwasserstoffe 38
Alkane 1
Monocyclische Kohlenwasserstoffe 6
Monocyclische Aromatische Kohlenwasserstoffe 14
Polycyclische Aromaten 17
Bicyclische Aromaten 7
Tricyclische Aromaten 6
Höhere Polycyclische Aromaten 4
Ether 1
Alkohole 5
Ketone 1
Stickstoff enthaltende Organische Verbindungen 3
Halogen enthaltende Organische Verbindungen 20

Die einzelnen Stoffe des Testdatensatzes von 68 umweltrelevanten organischen Chemikalien werden in der Tabelle 4 nach einer von Graedel vorgeschlagenen Einteilung der Chemikalien [Graedel 1986] zugeordnet. Den größten Anteil haben die Kohlenwasserstoffe mit einer Anzahl von 38 Stoffen. Hier überwiegen die Aromaten und die Polycyclischen Aromaten. Eine weitere starke Vertretung haben die Testdatensatz Stoffe mit einer Anzahl von 20 in der Gruppe der Halogen enthaltenden organischen Verbindungen. Diese Verbindungsklassen sollen nochmals beispielhaft in folgender Abbildung skizziert werden:


Monocyclische Kohlenwasserstoffe: Substituierte Cyclohexane





Monocyclische Aromatische Kohlenwasserstoffe







Substituierte Biphenyle







Polycyclische Aromaten: Bicyclen





(52) Gemisch nicht-definierter Dimethyl-Naphthalene

(53) und (54) definierte Dimethyl-Naphthalene





Polycyclische Aromaten: Tricyclen







Höhere Polycyclische Aromaten







Halogenierte Benzolderivate







Halogenierte Naphthalin-Derivate



Abbildung 4: Strukturen einiger ausgewählter Chemikalien des Testdatensatzes
(Testdatensatz Nummern von Tabelle 3 sind in Klammern gesetzt)

Die oben aufgeführten und klassifizierten Umweltchemikalien umfassen nicht nur industriell hergestellte Stoffe (Industriechemikalien) sondern auch Stoffe, die nicht industriell produziert werden. Beispielsweise entstehen die Polycyclischen Aromatischen Kohlenwasserstoffe (Polycyclische Aromaten) bei der unvollständigen Verbrennung von praktisch allen organischen Stoffen, z.B. durch Waldbrand, Großfeuerungsanlagen, Grillen, Räuchern und Rauchen [Larson 1994, S. 30] [Falbe 1992, S. 3521].

Bei den Halogenkohlenwasserstoffen handelt es sich um Kohlenwasserstoffe, bei denen H-Atome durch Halogene ersetzt sind [Falbe 1993, S. 1717]. Sie sind nützliche Zwischenprodukte für die organische Synthese, z.B. für Grignard-Reaktionen, für nucleophile Substitutionen, für Eliminierungen und für elektrophile Substitutionen. Außerdem finden sie Verwendung als Lösemittel, Anästhetika, Feuerlöschmittel, Kältemittel und Treibmittel. Besonders die Chlorfluorkohlenwassserstoffe (FCKWs) sind wegen ihrer wahrscheinlichen Umweltbelastung insbesondere wegen der schädlichen Einflüsse auf die Ozonschicht der Atmosphäre in Mißkredit gekommen [Falbe 1992, S. 1717], [Hulpke 1994, S. 326]. Das Auftreten von Halogenkohlenwasserstoffen ist aufgrund der zahlreichen Verwendungen und der Persistenz dieser Chemikalienklasse praktisch ubiquitär. Hinsichtlich des Umweltverhaltens ist die Persistenz der hochhalogenierten Vertreter (z.B. Hexachlorbenzol Stoff Nr. 19) bedeutungsvoll, die zur Anreicherung dieser Stoffe in der unbelebten Natur und auch zur Bioakkumulation führt. Die Dichlorbenzole (Stoffe Nr. 13,14,15) werden ebenso als Zwischenprodukt für die chemische Industrie, sowie als Lösemittel eingesetzt [Hulpke 1994, S. 326]. Fünf der im Testdatensatz aufgeführten Chemikalien gehören zu den höchstproduzierten Chemikalien in den USA [Kirschner 1996]. Es handelt sich dabei um Bisphenol A ( Nr. 63), Cumol (Nr. 21), Cyclohexan (Nr. 37), Ethylbenzol (Nr. 18) und Styrol (Nr. 17).

Eine eindeutige Zuordnung von Chemikalien zu einem Anwendungsgebiet ist in der Regel demnach nicht möglich, da Chemikalien entweder nicht durch die chemische Industrie produziert werden oder falls sie hergestellt werden, meist nicht nur eine sondern mehrere Anwendungen haben. Man spricht in diesem Zusammenhang dann von einem Anwendungsmuster einer Chemikalie. Solche Anwendungsmuster ändern sich ständig und werden aus diesem Grund von verantwortlicher Seite aus selten publiziert. Ein nennenswerter Ansatz zur Einteilung von Chemikalien in Anwendungsbereiche wurde jedoch vor dem Hintergrund der Abschätzung der Eintragungen von Chemikalien in die Umwelt vorgenommen. Es wurden hier 25 Anwendungsklassen von Chemikalien herausgearbeitet [Brüggemann 1989, 1992].

4.1.3 Parameter-Testdatensatz

Zur inhaltlichen Auswertung von Chemie- und Umweltschutz-Datenbanken wird neben einem Chemikalien-Testdatensatz auch noch ein Parameter-Testdatensatz benötigt. Dieser Testdatensatz soll Aufschluß darüber geben, welche Umwelt- und Chemikalien-relevanten Parameter in den einzelnen Datenbanken zu finden sind.

4.1.3.1 Auswahlverfahren

Die Auswahl der Parameter erfolgt in Anlehnung an die für die Anmeldung von Chemikalien geforderten Angaben nach dem Chemikaliengesetz [ChemG 1994].

Im Gesetz werden folgende Punkte aufgeführt:

Die Prüfnachweise erstrecken sich auf:

Neben der Aufarbeitung dieser im Chemikaliengesetz genannten Parameter wurde der Umweltthesaurus des Umweltbundesamtes zur Aufstellung des Parameter-Testdatensatzes mit herangezogen [Umweltbundesamt 1991]. Dieser Thesaurus dient als Grundlage zur inhaltlichen Auswertung der Dokumente, die in der Umweltliteraturdatenbank (ULIDAT), der umfangreichsten deutschsprachigen Umweltdatenbank enthalten sind.

Es handelt sich hierbei um einen hierarchischen Thesaurus, der in den Begriff, dessen Oberbegriff (OB) und Unterbegriffe (UB) unterteilt ist.

Für den Begriff "Schadstoffbewertung" findet man hier folgende Einteilung:

Schadstoffbewertung

OB: Schadstoff

UB: Chemikalienprüfung, Hautverträglichkeit, Ökotoxikologische Bewertung, Toxikologische Bewertung, Pflanzenverträglichkeit

für den Begriff "Chemikalienprüfung" ist vermerkt:

Chemikalienprüfung

OB: Schadstoffbewertung, Umweltchemikalien

UB: In-vitro, In-vivo, Karzinogenitätsprüfung, Mutagenitätsprüfung, Teratogenitätsprüfung, Life-cycle-Toxizitätstest, Miti-Test, Pflanzenschutzmittelprüfung.

Die oben aufgeführten Begriffe des Umweltthesaurus sind im Vergleich zum Gesetzestext lückenhaft. Hier wird nur auf die ökotoxikologische Bewertung und auf die toxikologische Bewertung, nicht aber auf Identitätsmerkmale, Produktionsmengen, Verwendungsarten, physikalisch-chemische Eigenschaften, Arbeitsschutzaspekte etc. eingegangen. Im gesamten Umweltthesaurus des Umweltbundesamtes sind diese Begriffe jedoch verzeichnet.

4.1.3.2 Einteilung der Parameter in Anlehnung an das Chemikaliengesetz

Der Parameter-Testdatensatz umfaßt über 100 Begriffe, die im Zusammenhang mit dem Umweltschutz, Arbeitsschutz und Gesundheitsschutz von Chemikalien zu sehen sind. Neben den oben aufgeführten Begriffen kommen als wichtige Schwerpunkte noch die Parameter zum Vorkommen von Chemikalien in Umweltmedien hinzu.

Die zum Teil vom Gesetzestext abweichende Bezeichnungsweise ist dadurch zu erklären, daß in der Literatur meist die nachstehend aufgeführten Bezeichnungen zu finden sind.

Die gewählten Parameter des Testdatensatzes lassen sich somit in folgende in Tabelle 5 aufgelisteten Kategorien A bis J einteilen:

Tabelle 5: Einteilung der Parameter in Kategorien

Kategorie
Parameter
A
Identifikationsmerkmale
B
Angaben zur Verwendung
C
Ökonomische Daten
D
Vorkommen in der Umwelt
E
Physikalisch-chemische Eigenschaften
F
Abbau / Akkumulation
G
Ökotoxizität
H
Toxizität
I
Arbeitsschutz
J
Sonstiges z.B. gesetzliche Regelungen, experimentelle Methoden

Im folgenden werden die ca. 100 Parameter diesen Kategorien zugeordnet.

Tabelle 6: Zuordnung der Testdatensatz Parameter zu Kategorien


A. Identifikationsmerkmale Identifikationsnummern
Beilstein-Nummer, CAS-Nummer, EG-Nummer, RTECS-Nummer, UN-Nummer, WLN Nummer,

Chemikalienname, Synonyma, Handelsname
Molekulargewicht, Summenformel, Strukturformel
Spektraldaten, Stoffbeschaffenheit

B. Angaben zur Verwendung,Entsorgung Abfallaufkommen, Entsorgung
Anwendung / Verwendung
Anwendungsmuster

C. Ökonomische Daten Einfuhr / Ausfuhr, Produktionsvolumen, Vermarktungsmenge

D. Vorkommen in der Umwelt Atmosphäre, Biosphäre, Hydrosphäre (Meer, Süßwasser),
Grundwasser, Klärschlamm, Pedosphäre, Sediment
Lebensmittel, Trinkwasser

E. Physikalisch-chemische Eigenschaften Brechungsindex, Dampfdruck, Dissoziationskonstante, Entzündlichkeit, Explosionspunkt, Flammpunkt, Henry-Konstante, Löslichkeit (Fett, organische Lösungsmittel), Wasserlöslichkeit, Oberflächenspannung, Relative Dichte, Schmelzpunkt, Siedepunkt, Thermodynamische Daten, Verteilungskoeffizienten ( Kow, Koc), Viskosität, Zersetzungspunkt, Zündtemperatur

F. Abbau / Akkumulation Abiotische Abbaubarkeit, Bioabbau, Bioakkumulation, Geoakkumulation, Photoabbau

G. Ökotoxizität Alge, Biene, Bakterien, Daphnia, Fisch, Insekten, Krustazeen
Mollusken, Pflanzen, Photosynthesehemmung, Protozoen, Würmer

H. Toxizität Akute Toxizität
orale, percutane dermale, inhalative, intravenöse, intraperitoneale
Augenreizung, Hautreizung
Carcinogenität, Mutagenität, Teratogenität, Reproduktionstoxizität
Subakute, Subchronische Toxizität, Chronische Toxizität

I. Arbeitsschutz Brand- und Explosionsschutz, Erste Hilfe, Gefahrensymbole, Gefahrenbezeichnung
Grenzwerte: BAT-, MAK-, TLV-, TRK-, TWA-Werte
Löschmittel, Maßnahmen bei Unfällen und Bränden, Maßnahmen nach Verschütten, Auslaufen, Schutzmaßnahmen, Lagerung, Handhabung, R,S-Sätze

J. Sonstiges Experimentelle Methoden, Gesetzliche Regelungen, QSAR, etc.



4.1.4 Auswertung der Metadatenbank der Online Datenbanken (DADB) gemäß der Typisierung der Online Datenbanken

In Kapitel 2.5 wurde auf die Typisierung der Online Datenbanken gemäß Chemikalien- und Umweltschutzaspekten eingegangen. An dieser Stelle folgt nun die Auswertung der DADB - Metadatenbank der Online Datenbanken in bezug auf die Datenbanktypen. Von den in der Metadatenbank der Online Datenbanken und der Metadatenbank der CD-ROMs im Januar 1997 bearbeiteten und gespeicherten 453 Online Datenbanken und 347 CD-ROMs ist die Verteilung auf die einzelnen bereits näher erläuterten Typen in der Tabelle 7 angegeben. Neben der Anzahl der Datenquellen ist der prozentuale Anteil in bezug auf die Gesamtzahl der Dokumente in der korrespondierenden Metadatenbank aufgeführt.

Es zeigt sich allerdings, daß die textbasierten Datenbanken mit einer Anzahl von 269 Datenbanken (bei DADB) deutlich den 179 faktenbasierten Datenbanken und den integrierten Datenbanken mit einer Anzahl von 5 überlegen sind. Prozentual ausgedrückt gibt es in DADB 59 % textbasierte Datenbanken, 40 % faktenbasierte Datenbanken und nur 1 % integrierte Datenbanken. Bei den textbasierten Datenbanken liegt das Schwergewicht deutlich auf den bibliographische Datenbanken und bei den faktenbasierten Datenbanken sind die Faktendatenbanken (numerische Datenbanken) am Stärksten vertreten.

Tabelle 7: Typen von Datenbanken in DADB und DACD

OberbegriffAkronym Datenbank TypDokumente in DADB / % Dokumente in DACD / %

faktenbasierte Datenbanken

NU

Faktendatenbanken (numerische Datenbanken)

106 / 29

88 / 25
CNChemikaliennamen-Verzeichnisse 13 / 3-
VZFirmenverzeichnisse und sonstige Verzeichnisse 16 / 4 12 / 3
FDForschungsdatenbanken 20 / 5 7 / 2
STStrukturdatenbanken 6 / 1 2 / 1
MDMetadatenbanken 18 / 4 7 / 2

textbasierte Datenbanken

BI

Bibliographische Datenbanken

230 / 51

177 / 51
VTVolltextdatenbanken 39 / 8 47 / 13

integrierte Datenbanken

RE

Reaktionsdatenbanken

5 / 1

10 / 3
MMMulti-Media Discs 0 / 0 1 / 0

Dokumentenstand (Februar 1997): DADB: 453 Dokumente, DACD: 347 Dokumente

Erläuterungen siehe Text

4.2 Metadatenbank der CD-ROMs - DACD

Die Metadatenbank der CD-ROMs wurde ebenfalls mit der kommerziellen Software LARS aufgebaut. Der Dokumentenstand beträgt 347 Einträge (Stand: 31.01.97). Auch stimmen viele Datenfelder mit denen in DADB überein. Die Unterschiede zu dem Aufbau der Metadatenbank der Online Datenbanken DADB (vgl. hierzu 4.1) werden im folgenden herausgearbeitet.

4.2.1 Datenbankdefinition von DACD

Die Datenbankdefinition von DACD ist analog strukturiert wie die bereits beschriebene Metadatenbank der Online Datenbanken - DADB (vgl. Tabelle 2).

Unter dem Feld Sprache ist die Sprache zu verstehen, in der die Datenbank aufgebaut wurde. Über 80 % der in DACD inkorporierten Datenbanken sind auf englisch. Da einige deutsche Standardwerke als CD-ROM publiziert werden, z.B. das Römpp Chemie Lexikon [CD-Römpp 1995], die Sicherheitstechnischen Kenndaten chemischer Stoffe [Gefahrstoff CD 1995] das Handbuch der Gefährlichen Güter Hommel [Gefahrgut CD-ROM 1995] ist der Anteil an deutschen Datenquellen auf CD-ROM deutlich höher als bei den Online Datenbanken. Unter dem Begriff Retrievalsprache ist die jeweilige Abfragesprache für die CD-ROMs zu verstehen. In der Regel handelt es sich hierbei um menügestützte Retrievalsoftware, wie bereits in Kapitel 2.6 beschrieben wurde. Die Frequenz der Pflege der Datenbank wird im Datenfeld Update vermerkt. CD-ROMs werden in der Regel alle drei bis sechs Monate gepflegt. Die Aktualisierungsfrequenz unterscheidet die CD-ROMs daher deutlich von den Online Datenbanken. Erstere werden in der Regel häufiger gewartet und sind damit aktueller. Im Gegensatz zu den Recherchen in Online Datenbanken, ist in CD-ROMs die Dauer und Häufigkeit der Recherche, die Anzahl der ausgegebenen Dokumente, der Ausdruck der Dokumente unabhängig vom Preis. Der Preis einer CD-ROM umfaßt den einmaligen Anschaffungspreis und den Preis für die Aktualisierungen.

4.3.2 Auswertung der Metadatenbank der CD-ROMs (DACD) gemäß der Typisierung der CD-ROMs

Von den in der Metadatenbank der CD-ROMs im Januar 1997 bearbeiteten und gespeicherten 347 CD-ROMs ist die Typisierung in Tabelle 7 (rechte Spalte) angegeben.

Auch bei den CD-ROMs überwiegen die textbasierten Datenbanken mit einer Anzahl von 224 gegenüber den faktenbasierten Datenbanken mit einer Anzahl von 116 und den integrierten Datenbanken mit nur 11 Einträgen. Prozentual ausgedrückt, gibt es in DACD 64 % textbasierte Datenbanken gegenüber 33 % faktenbasierten Datenbanken und 3 % integrierten Datenbanken.

Nur sehr wenige Chemiedatenbanken verfügen über Strukturformeln und über die Möglichkeiten der Struktursuche und der Substruktursuche. In einer weiteren Publikation zum Thema Chemiedatenbanken werden das Chapman & Hall CHCD Dictionary of Natural Products on CD-ROM und die Beilstein Current Facts in Chemistry on CD-ROM vorgestellt und erläutert. Da es sich hierbei um zwei CD-ROMs handelt, die auch über chemische Strukturen verfügen, wird besonders auf die Recherche nach diesen Merkmalen eingegangen. Es handelt sich bei den CD-ROMs nicht nur um Strukturdatenbanken sondern auch um Faktendatenbanken, die darüber hinaus auch noch bibliographische Informationen enthalten. Auch diese Autorin kommt zu der Schlußfolgerung, daß es eine zunehmend größere Nachfrage nach CD-ROMs mit Strukturinformation gibt [Warr 1994a]. In einem weiteren Artikel von W. Warr geht die Autorin auf Strukturdatenbanken und Reaktionsdatenbanken ein. Sie beschreibt die Reaktionsdatenbank CD-Select, eine der wenigen Reaktionsdatenbanken auf CD-ROM [Warr 1994b].

Die in den oben betrachteten Publikationen dargelegten Tatsache nach dem zunehmenden Interesse nach Struktur- und Reaktioneninformationen auf CD-ROM läßt sich ebenfalls in der Aufstellung der Tabelle 7 bestätigen. Es ist eine deutliche Verbesserung in dem Bereich der Reaktionsdatenbanken zu vermerken. Auch ist eine Zunahme der CD-ROMs, die Struktursuchen ermöglichen, zu verzeichnen.

4.3 Gegenüberstellung der Datenbanken-Typen in DADB und DACD

Von zusätzlichem Interesse ist der Vergleich der Online Datenbanken mit den Datenbanken auf CD-ROM in bezug auf die Aufteilung der einzelnen Quellen auf die diskutierten Datenbank Typen. Aus Tabelle 7 läßt sich erkennen, daß sowohl bei Online Datenbanken als auch bei CD-ROMs die textbasierten Datenbanken deutlich gegenüber den faktenbasierten Datenbanken und integrierten Datenbanken überwiegen. Über die Hälfte der betrachteten Quellen sind bibliographischer Art. Bei den CD-ROMs überwiegen die Volltextdatenbanken mit einem Prozentsatz von 13 gegenüber 8 % bei den Online Datenbanken. Faktenbasierte Datenbanken kommen im Medium Online mehr vor als im Medium CD-ROM. Dieses bezieht sich vor allem auf Chemikaliennamen-Verzeichnisse (nicht bei CD-ROMs vertreten), Forschungsdatenbanken und Metadatenbanken. Hingegen dominieren die Faktendatenbanken (numerische Datenbanken) bei den CD-ROMs.

Bei den integrierten Datenbanken ist die Situation bei den CD-ROMs mit einem 3 %igen Anteil an der Gesamtheit gegenüber dem 1 %igen Anteil bei den Online Datenbanken deutlich positiver.




[Inhaltsverzeichnis] [Home DissOnline] [Anfang] [Vorheriges Kapitel] [Nächstes Kapitel] [Ende]