Wie schon oben erwähnt, wurden Metadatenbanken zu den Fragestellungen
Chemikalien und Umweltschutz entwickelt, gepflegt und ausgebaut
[Voigt 1992]. Eine dieser Metadatenbanken ist die Metadatenbank
der Online Datenbanken DADB. Der Dokumentenstand beträgt
453 Einträge (Stand 31.01.97) von nationalen und internationalen
Datenbanken auf dem Gebiet der Informationen über Chemie
und Umweltschutz.
Diese Metadatenbank wurde mit der kommerziellen Software LARS erstellt. Die Abkürzung LARS steht für "Leistungsstarkes Archivierungs- und Recherchesystem" [WEKA, 1992]. Es werden folgende Feldwerte unterschieden: Alphanumerisch, Text, ganze Zahl, Volltext, Kommazahl, Formel (zum Rechnen), Datum, Zeit und Betrag.
In der Tabelle 2 ist die Datenbankdefinition von DADB festgehalten.
Als Feldwerte sind für diese Datenbank "alphanumerisch", "ganze Zahl", "Datum", "Betrag" und "Volltext" gewählt worden.
Neben den administrativen Datenfeldern (1-4) unterscheidet man die bibliographischen Felder (5-26) und die inhaltserschließenden Datenfelder (fettgedruckt).
Unter den bibliographischen Datenfeldern findet man die Kurzbezeichnung
und die Bezeichnung der Online Datenbank. Danach
schließen sich die Felder Host und sonstige
Hosts an. Auf die Hosts (Datenbankanbieter) wurde bereits
im Kapitel 2.4.2 eingegangen.
Tabelle 2: Datenbankdefinition DADB (inhaltserschließende
Datenfelder fett gedruckt)
Position | Feldname | Feldwerte | |
01 | Dokumentennummer | ganze Zahl | |
02 | Datum | Datum | |
03 | Standort | alphanumerisch | |
04 | Bearbeiter | alphanumerisch | |
05 | Kurzbezeichnung | alphanumerisch | |
06 | Bezeichnung | alphanumerisch | |
07 | Host (Datenbankanbieter) | alphanumerisch | |
08 | sonstige Hosts | alphanumerisch | |
09 | Produzent (Datenbankhersteller) | Volltext | |
10 | Typ der Datenbank | alphanumerisch | |
11 | Typ 2 | alphanumerisch | |
12 | Sachgebiet | alphanumerisch | |
13 | Quellen | alphanumerisch | |
14 | Sprache | alphanumerisch | |
15 | Retrievalsprache | alphanumerisch | |
16 | ab wann (sind Einträge vorhanden) | ganze Zahl | |
17 | bis wann (sind Einträge vorhanden) | ganze Zahl | |
18 | Aktualisierung (Update) | alphanumerisch | |
19 | Umfang | ganze Zahl | |
20 | Zuwachs/Jahr | ganze Zahl | |
21 | Kosten/h | Betrag | |
22 | Online Kosten | Betrag | |
23 | Offline Kosten | Betrag | |
24 | SDI Kosten | Betrag | |
25 | sonstige Kosten | Betrag | |
26 | Arbeitsunterlagen | alphanumerisch | |
27 | Informationstyp | alphanumerisch | |
28 | Anwendung der Chemikalien | alphanumerisch | |
29 | Anzahl der Stoffe | ganze Zahl | |
30 | Deskriptoren (Parameter-Testdatensatz) | alphanumerisch | |
31 | Chemikalien-Testdatensatz | ganze Zahl | |
32 | Sonstiges | alphanumerisch | |
33 | Pflege der DADB | alphanumerisch |
In DADB werden Datenbanken der folgenden Hosts ausgewertet: CDP, CIS (Chemical Information Service), DATASTAR, DIALOG, DIMDI (Deutsches Institut für Medizinische Dokumentation und Information), ECHO (European Communities Host Organization), ESA (European Space Agency), FIZ Technik, GBI (German Business Information), ICSTI (International Centre for Scientific and Technical Information), ORBIT, Questel, STN (Scientific and Technical Information Network), VINITI (The All Russian Institute of Scientific and Technical Information) und einige kleinere Hosts, die nur ein oder zwei Datenbanken anbieten. Es zeichnet sich auf dem Datenbankanbieter-Markt eine Konzentrierung ab. Beispielsweise sind DIALOG und DataStar in der Firma Knight-Ridder Information zusammengefaßt. Ebenso fand ein Zusammenschluß von ORBIT und QUESTEL statt. BRS wird seit kurzem unter dem Namen CDP Technologies geführt. Da jedoch die früheren Strukturen, u.a. auch unterschiedliche Retrievalsprachen bestehen blieben, werden die Hosts weiter getrennt aufgeführt.
Der Produzent oder auch Datenbankhersteller wird in DADB mit der vollständigen Adresse angegeben. Zu diesem Feld wurden bereits in Kapitel 2.4.1 Ausführungen gemacht. Ebenso wurde im Kapitel 2. 5 die Typisierung der Datenbanken ausführlich besprochen. Zwei Datenfelder, Typ der Datenbank und Typ 2 wurden eingerichtet. Oftmals ist eine eindeutige Zuordnung zu einem einzigen Typ nicht möglich. Beispielsweise ist die Datenbank BEILSTEIN nicht nur als eine Faktendatenbank, sondern auch als eine Strukturdatenbank und als Reaktionsdatenbank eingestuft.
Im Feld Sachgebiet werden die Hauptthemen der Datenbank im Freitext wiedergegeben. Im Feld Quellen findet man die Art der erschlossenen Publikationen. Beispiele hierfür sind: Fachzeitschriften, Fachbücher, Forschungsberichte, Proceedingsbände, Dissertationen, Patente, Firmenberichte, graue Literatur etc. Es folgen die Datenfelder Sprache und Retrievalsprache, die deutlich voneinander zu unterscheiden sind. Unter dem Feld Sprache ist die Sprache zu verstehen, in der die Datenbank aufgebaut wurde. Über 90 % der in DADB inkorporierten Datenbanken sind auf englisch. Unter dem Begriff Retrievalsprache ist die jeweilige Abfragesprache für die Datenbanken zu verstehen. Für die Suche in Online Datenbanken muß der Host Retrievalprogramme bereitstellen. Jeder Host verfügt über seine eigene Retrievalsprache. Der Rechercheur benutzt für seine Suche einen Satz von Kommandos, die als Retrievalsprache bezeichnet werden. Trotz Bemühungen einiger europäischer Hosts gibt es bisher keine allgemein verbindliche Retrievalsprache, so daß der Rechercheur mehrere Retrievalsprachen beherrschen muß [Kind 1991]. Einige Hosts bieten die Möglichkeit der menügesteuerten Abfrage in einigen ihrer angebotenen Datenbanken. In diesen Fällen entfällt das Erlernen der Retrievalsprache.
In den Datenfeldern ab wann und bis wann wird die Zeitspanne vermerkt, seit wann die Datenbank aufgebaut wird und bis wann sie weiter gepflegt wird. In der Regel ist keine Eintragung im Feld bis wann zu finden. Es gibt jedoch einige Datenbanken, die nicht weiter gepflegt werden, aber dennoch weiter online verfügbar sind. In diesen Fällen ist im Datenfeld bis wann ein Eintrag des Termins der Schließung der Datenbank vermerkt. Es schließt sich das Datenfeld Aktualisierung (Update) an. Hier wird die Frequenz der Pflege der Datenbank vermerkt. Online Datenbanken werden unterschiedlich häufig gepflegt. Die Aktualisierungsfrequenz reicht von täglich bis jährlich. Einige Datenbanken werden auch unregelmäßig gepflegt. Das Feld Nr. 33 Pflege der DADB bezieht sich hingegen auf die Pflege der Metadatenbank. Umfang und Zuwachs pro Jahr beziehen sich auf die Anzahl der Dokumente, die in der betreffenden Online Datenbank zu finden sind und auf die Anzahl der jährlich hinzukommenden Einträge. Es schließen sich fünf Datenfelder, die sich mit den Kosten der Recherche befassen, an. Zunächst einmal handelt es sich um die Kosten/h, d.h. die Anschaltkosten, die man für die Verbindung mit dem Host in der Datenbank zahlt. Die Bezeichnungen Online Kosten und Offline Kosten beziehen sich auf die Preise für die Ausgabe der einzelnen Dokumente online, d. h. am eigenen Rechner inklusive. des Herunterladens der Dokumente bzw. offline, d.h. bei der Übersendung der Dokumente durch den Host. Unter dem Begriff SDI (Selective Dissemination of Information) bezieht sich auf die selektive Informationsverbreitung. Es handelt sich um einen besonderen Vorgang zur regelmäßigen Ermittlung von Informationen aus Online Datenbanken. Der Nutzer formuliert ein Suchprofil in einer Datenbank als SDI-Suche. Diese Suche wird von einem Informationsretrieval-System bei jeder Aktualisierung der betreffenden Datenbank durchgeführt. Als Resultat erhält der Nutzer nach jeder Aktualisierung die gewünschten Antworten zu seinem Suchprofil [Barth 1992, S. 412]. Die Preise für die SDI Suche werden unter SDI Kosten aufgeführt. Für die Recherche in Online Datenbanken werden verschiedene Arbeitsunterlagen hergestellt. Dieses sind zunächst einmal die kurzen Datenbankbeschreibungen, die in Form von sog. Datenbankblättern, auch "fact sheets", "cream sheets" etc. genannt, herausgegeben werden. Auch gibt es für viele Datenbanken umfassende Manuals. Darüber hinaus ist für die inhaltliche Recherche in Datenbanken die Konsultation von Thesauri und Deskriptorenlisten zu empfehlen. In dem Datenfeld Arbeitsunterlagen werden diese vermerkt.
Es schließen sich die sog. inhaltserschließenden Datenfelder (27-31) an. Letztere sind in bezug auf die Thematik "Informationen über Chemie und Umweltschutz" oder "Umweltchemikalien" von übergeordneter Bedeutung. Die Eintragungen in diesen Feldern werden für den im weiteren beschriebenen Bewertungsansatz im besonderen herangezogen.
Unter dem Begriff Informationstyp oder Informationsparameter versteht man beispielsweise physikalisch-chemische Eigenschaften oder Strukturmerkmale. Es gibt Online Datenbanken, deren Schwerpunkte auf einzelnen Informationstypen liegen. Ebenso sind einige Datenbanken für spezielle Anwendungen von Chemikalien (z.B. Pestizide) ausgelegt. Darüber hinaus dient das Datenfeld Anzahl der Chemikalien als grobe Einstufung der Bedeutung der entsprechenden Online Datenbanken für das Thema. Es gibt Datenbanken, die zu über 100.000 Chemikalien Informationen vorhalten; bei anderen Quellen liegt die Anzahl der Stoffe bei einigen Hundert. Für das wichtigste inhaltserschließende Datenfeld, das Datenfeld Deskriptoren (Parameter-Testdatensatz), wurde ein Thesaurus entwickelt, der ca. 100 Schlagwörter oder Suchbegriffe aus den Fachgebieten des Umwelt-, Gesundheits- und Arbeitsschutzes enthält.
Das Datenfeld Testdatensatz Chemikalien dient zur Darstellung, welcher Stoff aus der Testchemikalien-Liste mit 68 umweltrelevanten Chemikalien in der entsprechenden Online Datenbank enthalten ist.
Beide Testdatensätze werden in den Kapiteln 4.1.2 und 4.1.3 näher erläutert.
Für die pragmatische Vorgehensweise im Zusammenhang mit der
Problematik der Umweltchemikalien wird versucht, die Anzahl der
zu betrachtenden Stoffe einzugrenzen. National und international
existieren hierzu einige Auswahlverfahren von prioritären
Stoffen [GDCh 1986, Walker 1993, Hushon 1984]. Solche Auswahlsysteme
für Chemikalien sind nützlich bei frühen Stufen
in der Bewertung von neuen Stoffen und bei der Überprüfung
von großen Chemikalienlisten an alten Stoffen z.B. des European
Inventory of Existing Commercial Chemical Substances (EINECS)
[Klöppfer 1994]. Es wurde in Deutschland in einem mehrstufigen
Selektierungsprozeß eine Stoffliste von 512 Stoffen erarbeitet
[GDCh 1992].
Die Liste der 512 Stoffe wurde weiter stufenweise eingegrenzt. Ziel war es, durch selektives Anlegen spezifischer Stoffkriterien, potentielle Lebensmittelkontaminanten zu erhalten. Unter Berücksichtigung des Vorkommens in der Umwelt, des Bioakkumulationspotentials und der Abbaubarkeit (Kriterien, die insbesondere auch potentielle Lebensmittelkontaminanten qualifizieren) wurden schließlich 68 Stoffe ausgewählt [Mücke 1987, Mücke 1989].
Diese Stoffliste, die als Grundlage für die weiteren Arbeiten
dient, ist in Tabelle 3, alphabetisch geordnet nach dem systematischen
Chemikaliennamen aufgelistet. Darüber hinaus werden die laufende
Nummer (Testdatensatz Nummer) und die Chemical Abstracts Service
Registry Number (CAS-Nummer) aufgeführt. In den letzten beiden
Spalten werden die Anzahl der Treffer in DADB, d.h. in wievielen
Online Datenbanken die einzelnen Chemikalien abgedeckt sind und
deren prozentualer Anteil an der Gesamtheit der in DADB enthaltenen
Datenbanken (Dokumentenstand: 453 Januar 1997) aufgeführt.
Hierauf wird in Kapitel 6.4.2.3 noch näher eingegangen.
Tabelle 3: Chemikalien-Testdatensatz (68 Stoffe
Testdatensatz)
Nr. | Name der Substanz | CAS-Nummer | Anzahl der Treffer in DADB | Anteil der Treffer in % |
01 | Acenaphthylene | 208-96-8 | 171 | 38 |
02 | Anthracene | 120-12-7 | 280 | 62 |
03 | Benz[a]anthracene | 56-55-3 | 190 | 42 |
04 | Benzo[k]fluoranthene | 207-08-9 | 140 | 31 |
05 | Benzene, 1,3-Bis(1-methylethyl)- | 99-62-7 | 91 | 20 |
06 | Benzene, 1-Chloro-2,4-dinitro- | 97-00-7 | 134 | 30 |
07 | Benzene, 1-Chloro-2-methyl- | 95-49-8 | 120 | 27 |
08 | Benzene, 1-Chloro-3-methyl- | 108-41-8 | 97 | 21 |
09 | Benzene, 1-Chloro-4-methyl- | 106-43-4 | 11 | 24 |
10 | Benzene, 1-Chloro-2-methyl-3-nitro- | 83-42-1 | 56 | 12 |
11 | Benzene, 4-Chloro-1-methyl-2-nitro- | 89-59-8 | 47 | 10 |
12 | Benzene, 1,4-Dibromo- | 106-37-6 | 125 | 28 |
13 | Benzene, 1,2-Dichloro- | 95-50-1 | 209 | 46 |
14 | Benzene, 1,3-Dichloro- | 541-73-1 | 180 | 40 |
15 | Benzene, 1,4-Dichloro- | 106-46-7 | 222 | 49 |
16 | Benzene, 1,2-Dichloro-3-nitro- | 3209-22-1 | 76 | 16 |
17 | Benzene, Ethenyl- | 100-42-5 | 307 | 67 |
18 | Benzene, Ethyl- | 100-41-4 | 256 | 57 |
19 | Benzene, Hexachloro- | 118-74-1 | 266 | 59 |
20 | Benzene, Methylbis(phenylmethyl)- | 26898-17-9 | 34 | 8 |
21 | Benzene, (1-Methylethyl)- | 98-82-8 | 210 | 46 |
22 | Benzene, (1-Methylethenyl)- | 98-83-9 | 142 | 31 |
23 | Benzene, 1,1'-Oxybis(methyl)- | 28299-41-4 | 45 | 10 |
24 | Benzene, Propyl- | 103-65-1 | 160 | 35 |
25 | Benzene, 1,2,4-Trichloro- | 120-82-1 | 200 | 44 |
26 | Benzene, 1,2,4-Trimethyl- | 95-63-6 | 174 | 38 |
27 | Benzeneamine, 2-Chloro,4-nitro- | 121-87-9 | 81 | 18 |
28 | Benzeneamine, N,N-Diethyl- | 91-66-7 | 144 | 32 |
29 | Benzeneamine, N-Phenyl- | 122-39-4 | 216 | 48 |
30 | Benzo[a]pyrene | 50-32-8 | 221 | 49 |
31 | 1,1'-Biphenyl,3,3'-Dimethyl- | 612-75-9 | 60 | 13 |
32 | 1,1'-Biphenyl,4,4'-Dimethyl- | 631-33-2 | 54 | 12 |
33 | 1,1'-Biphenyl, Ethyl- | 40529-66-6 | 47 | 10 |
34 | 1,1'-Biphenyl, Methyl- | 28652-72-4 | 85 | 19 |
35 | 1,1'-Biphenyl, 3-Methyl- | 643-93-6 | 93 | 21 |
36 | 9H-Carbazole | 86-74-8 | 172 | 38 |
37 | Cyclohexane | 110-82-7 | 279 | 62 |
38 | Cyclohexane, 1,1-Dimethyl- | 590-66-9 | 76 | 17 |
39 | Cyclohexane, 1,2-Dimethyl- | 583-57-3 | 69 | 15 |
40 | Cyclohexane, 1,3-Dimethyl- | 591-21-9 | 67 | 15 |
41 | Cyclohexane, 1,4-Dimethyl- | 589-90-2 | 73 | 16 |
42 | Cyclohexane, Methyl- | 108-87-2 | 188 | 42 |
43 | Dibenz[a,h]anthracene | 53-70-3 | 157 | 35 |
44 | Ethane,1,1,2-Trichloro-1,2,2,-trifluoro- | 76-13-1 | 151 | 33 |
45 | Fluoranthene | 206-44-0 | 207 | 46 |
46 | 9H-Fluorene | 86-73-7 | 169 | 37 |
47 | Hexadecane | 544-76-3 | 196 | 43 |
48 | Methanone, Diphenyl- | 119-61-9 | 222 | 49 |
49 | Naphthalene | 91-20-3 | 267 | 59 |
50 | Naphthalene, 1-Chloro- | 90-13-1 | 143 | 32 |
51 | Naphthalene, 2-Chloro- | 91-58-7 | 128 | 28 |
52 | Naphthalene, Dimethyl- | 28804-88-8 | 92 | 20 |
53 | Naphthalene, 1,3-Dimethyl- | 575-41-7 | 76 | 17 |
54 | Naphthalene, 2,6-Dimethyl- | 581-42-0 | 104 | 23 |
55 | Naphthalene, 2-Ethyl- | 939-27-5 | 78 | 17 |
56 | Naphthalene, Heptachloro- | 32241-08-0 | 40 | 9 |
57 | Naphthalene, 1-Methyl- | 90-12-0 | 168 | 37 |
58 | Naphthalene, 2-Methyl- | 91-57-6 | 168 | 37 |
59 | Naphthalene, Trichloro- | 1321-65-9 | 71 | 16 |
60 | Phenanthrene | 85-01-8 | 209 | 46 |
61 | Phenol, 4-(1,1-dimethylethyl)- | 98-54-4 | 143 | 32 |
62 | Phenol, 4-Dodecyl- | 104-43-8 | 50 | 11 |
63 | Phenol, 4,4'-(1-Methylethylidene)bis- | 80-05-7 | 228 | 50 |
64 | Phenol, 4-Nonyl- | 104-40-5 | 142 | 31 |
65 | Phenol, 4-(1,1,3,3-Tetramethylbutyl)- | 140-66-9 | 107 | 24 |
66 | Phenol, 2,4,5-Trichloro- | 95-95-4 | 190 | 42 |
67 | Pyrene | 129-00-0 | 260 | 58 |
68 | 1,1',3',1''-Terphenyl,5'-Phenyl- | 612-71-5 | 80 | 18 |
Erläuterungen siehe Text
Die Chemikalien sind unter ihrer englischen Bezeichnung aufgeführt,
da der überwiegende Anteil der zu betrachtenden Datenbanken
in englischer Sprache aufgebaut sind. Es wird deutlich, daß
die Liste eine ganze Reihe von unterschiedlichen z.T. sehr bekannten
Umweltchemikalien enthält z.B. Polycyclische Aromaten, halogenierte
Aromaten, Biphenyle etc. enthält.
Tabelle 4: Chemische Klassifikation der Testdatensatz
Stoffe (Erläuterungen siehe Text)
chemische Klassifikation | Anzahl der Testdatensatz Stoffe | ||
Kohlenwasserstoffe | 38 | ||
Alkane | 1 | ||
Monocyclische Kohlenwasserstoffe | 6 | ||
Monocyclische Aromatische Kohlenwasserstoffe | 14 | ||
Polycyclische Aromaten | 17 | ||
Bicyclische Aromaten | 7 | ||
Tricyclische Aromaten | 6 | ||
Höhere Polycyclische Aromaten | 4 | ||
Ether | 1 | ||
Alkohole | 5 | ||
Ketone | 1 | ||
Stickstoff enthaltende Organische Verbindungen | 3 | ||
Halogen enthaltende Organische Verbindungen | 20 |
Die einzelnen Stoffe des Testdatensatzes von 68 umweltrelevanten
organischen Chemikalien werden in der Tabelle 4 nach einer von
Graedel vorgeschlagenen Einteilung der Chemikalien [Graedel 1986]
zugeordnet. Den größten Anteil haben die Kohlenwasserstoffe
mit einer Anzahl von 38 Stoffen. Hier überwiegen die Aromaten
und die Polycyclischen Aromaten. Eine weitere starke Vertretung
haben die Testdatensatz Stoffe mit einer Anzahl von 20 in der
Gruppe der Halogen enthaltenden organischen Verbindungen. Diese
Verbindungsklassen sollen nochmals beispielhaft in folgender Abbildung
skizziert werden:
Monocyclische Kohlenwasserstoffe: Substituierte Cyclohexane
(52) Gemisch nicht-definierter Dimethyl-Naphthalene
(53) und (54) definierte Dimethyl-Naphthalene
Abbildung 4: Strukturen einiger ausgewählter
Chemikalien des Testdatensatzes
(Testdatensatz Nummern von
Tabelle 3 sind in Klammern gesetzt)
Die oben aufgeführten und klassifizierten Umweltchemikalien umfassen nicht nur industriell hergestellte Stoffe (Industriechemikalien) sondern auch Stoffe, die nicht industriell produziert werden. Beispielsweise entstehen die Polycyclischen Aromatischen Kohlenwasserstoffe (Polycyclische Aromaten) bei der unvollständigen Verbrennung von praktisch allen organischen Stoffen, z.B. durch Waldbrand, Großfeuerungsanlagen, Grillen, Räuchern und Rauchen [Larson 1994, S. 30] [Falbe 1992, S. 3521].
Bei den Halogenkohlenwasserstoffen handelt es sich um Kohlenwasserstoffe, bei denen H-Atome durch Halogene ersetzt sind [Falbe 1993, S. 1717]. Sie sind nützliche Zwischenprodukte für die organische Synthese, z.B. für Grignard-Reaktionen, für nucleophile Substitutionen, für Eliminierungen und für elektrophile Substitutionen. Außerdem finden sie Verwendung als Lösemittel, Anästhetika, Feuerlöschmittel, Kältemittel und Treibmittel. Besonders die Chlorfluorkohlenwassserstoffe (FCKWs) sind wegen ihrer wahrscheinlichen Umweltbelastung insbesondere wegen der schädlichen Einflüsse auf die Ozonschicht der Atmosphäre in Mißkredit gekommen [Falbe 1992, S. 1717], [Hulpke 1994, S. 326]. Das Auftreten von Halogenkohlenwasserstoffen ist aufgrund der zahlreichen Verwendungen und der Persistenz dieser Chemikalienklasse praktisch ubiquitär. Hinsichtlich des Umweltverhaltens ist die Persistenz der hochhalogenierten Vertreter (z.B. Hexachlorbenzol Stoff Nr. 19) bedeutungsvoll, die zur Anreicherung dieser Stoffe in der unbelebten Natur und auch zur Bioakkumulation führt. Die Dichlorbenzole (Stoffe Nr. 13,14,15) werden ebenso als Zwischenprodukt für die chemische Industrie, sowie als Lösemittel eingesetzt [Hulpke 1994, S. 326]. Fünf der im Testdatensatz aufgeführten Chemikalien gehören zu den höchstproduzierten Chemikalien in den USA [Kirschner 1996]. Es handelt sich dabei um Bisphenol A ( Nr. 63), Cumol (Nr. 21), Cyclohexan (Nr. 37), Ethylbenzol (Nr. 18) und Styrol (Nr. 17).
Eine eindeutige Zuordnung von Chemikalien zu einem Anwendungsgebiet
ist in der Regel demnach nicht möglich, da Chemikalien entweder
nicht durch die chemische Industrie produziert werden oder falls
sie hergestellt werden, meist nicht nur eine sondern mehrere Anwendungen
haben. Man spricht in diesem Zusammenhang dann von einem Anwendungsmuster
einer Chemikalie. Solche Anwendungsmuster ändern sich ständig
und werden aus diesem Grund von verantwortlicher Seite aus selten
publiziert. Ein nennenswerter Ansatz zur Einteilung von Chemikalien
in Anwendungsbereiche wurde jedoch vor dem Hintergrund der Abschätzung
der Eintragungen von Chemikalien in die Umwelt vorgenommen. Es
wurden hier 25 Anwendungsklassen von Chemikalien herausgearbeitet
[Brüggemann 1989, 1992].
Zur inhaltlichen Auswertung von Chemie- und Umweltschutz-Datenbanken
wird neben einem Chemikalien-Testdatensatz auch noch ein Parameter-Testdatensatz
benötigt. Dieser Testdatensatz soll Aufschluß darüber
geben, welche Umwelt- und Chemikalien-relevanten Parameter in
den einzelnen Datenbanken zu finden sind.
Die Auswahl der Parameter erfolgt in Anlehnung an die für die Anmeldung von Chemikalien geforderten Angaben nach dem Chemikaliengesetz [ChemG 1994].
Im Gesetz werden folgende Punkte aufgeführt:
Die Prüfnachweise erstrecken sich auf:
Neben der Aufarbeitung dieser im Chemikaliengesetz genannten Parameter wurde der Umweltthesaurus des Umweltbundesamtes zur Aufstellung des Parameter-Testdatensatzes mit herangezogen [Umweltbundesamt 1991]. Dieser Thesaurus dient als Grundlage zur inhaltlichen Auswertung der Dokumente, die in der Umweltliteraturdatenbank (ULIDAT), der umfangreichsten deutschsprachigen Umweltdatenbank enthalten sind.
Es handelt sich hierbei um einen hierarchischen Thesaurus, der in den Begriff, dessen Oberbegriff (OB) und Unterbegriffe (UB) unterteilt ist.
Für den Begriff "Schadstoffbewertung" findet man hier folgende Einteilung:
Schadstoffbewertung
OB: Schadstoff
UB: Chemikalienprüfung, Hautverträglichkeit, Ökotoxikologische Bewertung, Toxikologische Bewertung, Pflanzenverträglichkeit
für den Begriff "Chemikalienprüfung" ist vermerkt:
Chemikalienprüfung
OB: Schadstoffbewertung, Umweltchemikalien
UB: In-vitro, In-vivo, Karzinogenitätsprüfung, Mutagenitätsprüfung, Teratogenitätsprüfung, Life-cycle-Toxizitätstest, Miti-Test, Pflanzenschutzmittelprüfung.
Die oben aufgeführten Begriffe des Umweltthesaurus sind im
Vergleich zum Gesetzestext lückenhaft. Hier wird nur auf
die ökotoxikologische Bewertung und auf die toxikologische
Bewertung, nicht aber auf Identitätsmerkmale, Produktionsmengen,
Verwendungsarten, physikalisch-chemische Eigenschaften, Arbeitsschutzaspekte
etc. eingegangen. Im gesamten Umweltthesaurus des Umweltbundesamtes
sind diese Begriffe jedoch verzeichnet.
Der Parameter-Testdatensatz umfaßt über 100 Begriffe, die im Zusammenhang mit dem Umweltschutz, Arbeitsschutz und Gesundheitsschutz von Chemikalien zu sehen sind. Neben den oben aufgeführten Begriffen kommen als wichtige Schwerpunkte noch die Parameter zum Vorkommen von Chemikalien in Umweltmedien hinzu.
Die zum Teil vom Gesetzestext abweichende Bezeichnungsweise ist dadurch zu erklären, daß in der Literatur meist die nachstehend aufgeführten Bezeichnungen zu finden sind.
Die gewählten Parameter des Testdatensatzes lassen sich somit in folgende in Tabelle 5 aufgelisteten Kategorien A bis J einteilen:
Tabelle 5: Einteilung der Parameter in Kategorien
Parameter | |
Identifikationsmerkmale | |
Angaben zur Verwendung | |
Ökonomische Daten | |
Vorkommen in der Umwelt | |
Physikalisch-chemische Eigenschaften | |
Abbau / Akkumulation | |
Ökotoxizität | |
Toxizität | |
Arbeitsschutz | |
Sonstiges z.B. gesetzliche Regelungen, experimentelle Methoden |
Im folgenden werden die ca. 100 Parameter diesen Kategorien zugeordnet.
Tabelle 6: Zuordnung der Testdatensatz Parameter
zu Kategorien
A. Identifikationsmerkmale | Identifikationsnummern |
Beilstein-Nummer, CAS-Nummer, EG-Nummer, RTECS-Nummer, UN-Nummer, WLN Nummer,
| |
Chemikalienname, Synonyma, Handelsname | |
Molekulargewicht, Summenformel, Strukturformel | |
Spektraldaten, Stoffbeschaffenheit
| |
B. Angaben zur Verwendung,Entsorgung | Abfallaufkommen, Entsorgung |
Anwendung / Verwendung | |
Anwendungsmuster
| |
C. Ökonomische Daten | Einfuhr / Ausfuhr, Produktionsvolumen, Vermarktungsmenge
|
D. Vorkommen in der Umwelt | Atmosphäre, Biosphäre, Hydrosphäre (Meer, Süßwasser), |
Grundwasser, Klärschlamm, Pedosphäre, Sediment | |
Lebensmittel, Trinkwasser
| |
E. Physikalisch-chemische Eigenschaften | Brechungsindex, Dampfdruck, Dissoziationskonstante, Entzündlichkeit,
Explosionspunkt, Flammpunkt, Henry-Konstante,
Löslichkeit (Fett, organische Lösungsmittel), Wasserlöslichkeit,
Oberflächenspannung, Relative Dichte, Schmelzpunkt, Siedepunkt,
Thermodynamische Daten, Verteilungskoeffizienten ( Kow,
Koc), Viskosität, Zersetzungspunkt, Zündtemperatur
|
F. Abbau / Akkumulation | Abiotische Abbaubarkeit, Bioabbau, Bioakkumulation, Geoakkumulation,
Photoabbau
|
G. Ökotoxizität | Alge, Biene, Bakterien, Daphnia, Fisch, Insekten, Krustazeen |
Mollusken, Pflanzen, Photosynthesehemmung, Protozoen, Würmer
| |
H. Toxizität | Akute Toxizität |
orale, percutane dermale, inhalative, intravenöse, intraperitoneale | |
Augenreizung, Hautreizung | |
Carcinogenität, Mutagenität, Teratogenität, Reproduktionstoxizität | |
Subakute, Subchronische Toxizität, Chronische Toxizität
| |
I. Arbeitsschutz | Brand- und Explosionsschutz, Erste Hilfe, Gefahrensymbole, Gefahrenbezeichnung |
Grenzwerte: BAT-, MAK-, TLV-, TRK-, TWA-Werte | |
Löschmittel, Maßnahmen bei Unfällen und Bränden,
Maßnahmen nach Verschütten, Auslaufen, Schutzmaßnahmen,
Lagerung, Handhabung, R,S-Sätze
| |
J. Sonstiges | Experimentelle Methoden, Gesetzliche Regelungen, QSAR, etc. |
In Kapitel 2.5 wurde auf die Typisierung der Online Datenbanken gemäß Chemikalien- und Umweltschutzaspekten eingegangen. An dieser Stelle folgt nun die Auswertung der DADB - Metadatenbank der Online Datenbanken in bezug auf die Datenbanktypen. Von den in der Metadatenbank der Online Datenbanken und der Metadatenbank der CD-ROMs im Januar 1997 bearbeiteten und gespeicherten 453 Online Datenbanken und 347 CD-ROMs ist die Verteilung auf die einzelnen bereits näher erläuterten Typen in der Tabelle 7 angegeben. Neben der Anzahl der Datenquellen ist der prozentuale Anteil in bezug auf die Gesamtzahl der Dokumente in der korrespondierenden Metadatenbank aufgeführt.
Es zeigt sich allerdings, daß die textbasierten Datenbanken
mit einer Anzahl von 269 Datenbanken (bei DADB) deutlich den 179
faktenbasierten Datenbanken und den integrierten Datenbanken mit
einer Anzahl von 5 überlegen sind. Prozentual ausgedrückt
gibt es in DADB 59 % textbasierte Datenbanken, 40 % faktenbasierte
Datenbanken und nur 1 % integrierte Datenbanken. Bei den textbasierten
Datenbanken liegt das Schwergewicht deutlich auf den bibliographische
Datenbanken und bei den faktenbasierten Datenbanken sind die Faktendatenbanken
(numerische Datenbanken) am Stärksten vertreten.
Tabelle 7: Typen von Datenbanken in DADB und
DACD
Oberbegriff | Akronym | Datenbank Typ | Dokumente in DADB / % | Dokumente in DACD / % |
faktenbasierte Datenbanken | NU | Faktendatenbanken (numerische Datenbanken) | 106 / 29 | 88 / 25 |
CN | Chemikaliennamen-Verzeichnisse | 13 / 3 | - | |
VZ | Firmenverzeichnisse und sonstige Verzeichnisse | 16 / 4 | 12 / 3 | |
FD | Forschungsdatenbanken | 20 / 5 | 7 / 2 | |
ST | Strukturdatenbanken | 6 / 1 | 2 / 1 | |
MD | Metadatenbanken | 18 / 4 | 7 / 2 | |
textbasierte Datenbanken | BI | Bibliographische Datenbanken | 230 / 51 | 177 / 51 |
VT | Volltextdatenbanken | 39 / 8 | 47 / 13 | |
integrierte Datenbanken | RE | Reaktionsdatenbanken | 5 / 1 | 10 / 3 |
MM | Multi-Media Discs | 0 / 0 | 1 / 0 |
Dokumentenstand (Februar 1997): DADB: 453 Dokumente, DACD: 347 Dokumente
Erläuterungen siehe Text
Die Metadatenbank der CD-ROMs wurde ebenfalls mit der kommerziellen
Software LARS aufgebaut. Der Dokumentenstand beträgt 347
Einträge (Stand: 31.01.97). Auch stimmen viele Datenfelder
mit denen in DADB überein. Die Unterschiede zu dem Aufbau
der Metadatenbank der Online Datenbanken DADB (vgl. hierzu 4.1)
werden im folgenden herausgearbeitet.
Die Datenbankdefinition von DACD ist analog strukturiert wie die bereits beschriebene Metadatenbank der Online Datenbanken - DADB (vgl. Tabelle 2).
Unter dem Feld Sprache ist die Sprache zu verstehen, in der die Datenbank aufgebaut wurde. Über 80 % der in DACD inkorporierten Datenbanken sind auf englisch. Da einige deutsche Standardwerke als CD-ROM publiziert werden, z.B. das Römpp Chemie Lexikon [CD-Römpp 1995], die Sicherheitstechnischen Kenndaten chemischer Stoffe [Gefahrstoff CD 1995] das Handbuch der Gefährlichen Güter Hommel [Gefahrgut CD-ROM 1995] ist der Anteil an deutschen Datenquellen auf CD-ROM deutlich höher als bei den Online Datenbanken. Unter dem Begriff Retrievalsprache ist die jeweilige Abfragesprache für die CD-ROMs zu verstehen. In der Regel handelt es sich hierbei um menügestützte Retrievalsoftware, wie bereits in Kapitel 2.6 beschrieben wurde. Die Frequenz der Pflege der Datenbank wird im Datenfeld Update vermerkt. CD-ROMs werden in der Regel alle drei bis sechs Monate gepflegt. Die Aktualisierungsfrequenz unterscheidet die CD-ROMs daher deutlich von den Online Datenbanken. Erstere werden in der Regel häufiger gewartet und sind damit aktueller. Im Gegensatz zu den Recherchen in Online Datenbanken, ist in CD-ROMs die Dauer und Häufigkeit der Recherche, die Anzahl der ausgegebenen Dokumente, der Ausdruck der Dokumente unabhängig vom Preis. Der Preis einer CD-ROM umfaßt den einmaligen Anschaffungspreis und den Preis für die Aktualisierungen.
Von den in der Metadatenbank der CD-ROMs im Januar 1997 bearbeiteten und gespeicherten 347 CD-ROMs ist die Typisierung in Tabelle 7 (rechte Spalte) angegeben.
Auch bei den CD-ROMs überwiegen die textbasierten Datenbanken mit einer Anzahl von 224 gegenüber den faktenbasierten Datenbanken mit einer Anzahl von 116 und den integrierten Datenbanken mit nur 11 Einträgen. Prozentual ausgedrückt, gibt es in DACD 64 % textbasierte Datenbanken gegenüber 33 % faktenbasierten Datenbanken und 3 % integrierten Datenbanken.
Nur sehr wenige Chemiedatenbanken verfügen über Strukturformeln und über die Möglichkeiten der Struktursuche und der Substruktursuche. In einer weiteren Publikation zum Thema Chemiedatenbanken werden das Chapman & Hall CHCD Dictionary of Natural Products on CD-ROM und die Beilstein Current Facts in Chemistry on CD-ROM vorgestellt und erläutert. Da es sich hierbei um zwei CD-ROMs handelt, die auch über chemische Strukturen verfügen, wird besonders auf die Recherche nach diesen Merkmalen eingegangen. Es handelt sich bei den CD-ROMs nicht nur um Strukturdatenbanken sondern auch um Faktendatenbanken, die darüber hinaus auch noch bibliographische Informationen enthalten. Auch diese Autorin kommt zu der Schlußfolgerung, daß es eine zunehmend größere Nachfrage nach CD-ROMs mit Strukturinformation gibt [Warr 1994a]. In einem weiteren Artikel von W. Warr geht die Autorin auf Strukturdatenbanken und Reaktionsdatenbanken ein. Sie beschreibt die Reaktionsdatenbank CD-Select, eine der wenigen Reaktionsdatenbanken auf CD-ROM [Warr 1994b].
Die in den oben betrachteten Publikationen dargelegten Tatsache
nach dem zunehmenden Interesse nach Struktur- und Reaktioneninformationen
auf CD-ROM läßt sich ebenfalls in der Aufstellung der
Tabelle 7 bestätigen. Es ist eine deutliche Verbesserung
in dem Bereich der Reaktionsdatenbanken zu vermerken. Auch ist
eine Zunahme der CD-ROMs, die Struktursuchen ermöglichen,
zu verzeichnen.
Von zusätzlichem Interesse ist der Vergleich der Online Datenbanken mit den Datenbanken auf CD-ROM in bezug auf die Aufteilung der einzelnen Quellen auf die diskutierten Datenbank Typen. Aus Tabelle 7 läßt sich erkennen, daß sowohl bei Online Datenbanken als auch bei CD-ROMs die textbasierten Datenbanken deutlich gegenüber den faktenbasierten Datenbanken und integrierten Datenbanken überwiegen. Über die Hälfte der betrachteten Quellen sind bibliographischer Art. Bei den CD-ROMs überwiegen die Volltextdatenbanken mit einem Prozentsatz von 13 gegenüber 8 % bei den Online Datenbanken. Faktenbasierte Datenbanken kommen im Medium Online mehr vor als im Medium CD-ROM. Dieses bezieht sich vor allem auf Chemikaliennamen-Verzeichnisse (nicht bei CD-ROMs vertreten), Forschungsdatenbanken und Metadatenbanken. Hingegen dominieren die Faktendatenbanken (numerische Datenbanken) bei den CD-ROMs.
Bei den integrierten Datenbanken ist die Situation bei den CD-ROMs
mit einem 3 %igen Anteil an der Gesamtheit gegenüber dem
1 %igen Anteil bei den Online Datenbanken deutlich positiver.