Die folgende Link-Auswahl ist als Einstieg in das Thema “Linguistik und Semantic Web” gedacht. Auf den Webseiten erhaltet Ihr grundlegende Informationen darüber, worin das Ziel der Semantic Web-Forschung besteht, welche Web-Standards existieren, wonach sie entwickelt werden und wie man HTML lernen kann. Weiterhin könnt Ihr Euch über Projekte informieren, in denen eine Art Hintergrundwissen für die automatische Verarbeitung von Sprache erstellt wird. Dazu gehören lexikalisch-semantische Wortnetze und es wird auch auf ein Projekt zur Modellierung des gesamten Weltwissens hingewiesen.
Viel Spaß und danke für jeden Kommentar zu Euren Erfahrungen und Erkenntissen!
Alle Links sind auch in der gesamten Linkliste aufgeführt.
The Semantic Web, ein Semantic Web-Artikel von Tim Berners-Lee, James Hendler und Ora Lassila (2001)
In der Scientific American ist 2001 der mittlerweile sehr bekannte Semantic Web-Artikel The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities von Tim Berners-Lee, James Hendler und Ora Lassila erschienen. Hier wird ein alltägliches Szenario in naher Zukunft beschrieben, das demonstrieren soll, wie das Leben mit dem Semantic Web sein könnte.
Link zur Scientific American
Link zum Semantic Web-Artikel in der Scientific American
Link zur Webseite von Tim Berners-Lee
Link zur Webseite von James Hendler
Link zur Webseite von Ora Lassila
W3C
Das W3C wurde 1994 zur Förderung der Web-Entwicklung gegründet und ist diejenige Institution, über die Spezifikationen und Richtlinien für Web-Standards entwickelt und herausgegeben werden. Alle W3C-Empfehlungen entsprechen den Hauptmaximen des Web, wozu unter anderem Dezentralität, Zugriff auf Daten von jeder/-em auf alles von jedem Ort und allen Arten von Benutzerschnittstellen aus und die ständige Erweiterbarkeit des Webs gehören. Die W3C-Empfehlungen gelten in der Web-Gemeinde und der Industrie als allgemein gültige Standards. Auf der Internetseite sind alle bisher empfohlenen Standards zu Web-Technologien beschrieben. Weiterhin sind hier Informationen zu den W3C-Aktivitäten, Publikationen, sowie Manuals und Tutorials verfügbar. Arbeitsgruppen, wie zum Beispiel W3C-Semantic Web, spezialisieren sich auf bestimmte Bereiche.
Link zum W3C
Link zu den W3C-Reports, Publikationen und Empfehlungen
Link zu den W3C-Aktivitäten
Link zum W3C-Semantic Web
Selfhtml, Web-Tutorial, u.a. für HTML
Über das Web-Tutorial Selfhtml sind sowohl Grundzüge als auch Spezialkenntnisse zu HTML erlernbar bzw. auch immer wieder zum Nachschlagen geeignet. Der Aufbau ist übersichtlich und enthält viele Beispiele, die in der Code- und Layout-Ansicht angeschaut werden können. Auch weitere Web-Technologien, wie XHTML, XML, Style Sheets (CSS), Java Script, Perl oder PHP werden behandelt. Mit Selfhtml zu lernen, führt sehr schnell zu ersten Erfolgen und ist daher eine überaus motivierende Methode.
Link zum Web-Tutorial Selfhtml (deutsch)
Berkeley FrameNet
Das lexikalisch-semantische Wortnetz FrameNet ist eine Datenbank, die unter anderem auf der Basis des British National Corpus erstellt wurde. Theoretische Grundlage für die Modellierung der Datenbank bildet die Framesemantik nach Charles J. Fillmore. Frames sind konzeptuelle Rahmen für Personen, Ereignisse, Situationen und ähnliches. FrameNet enthält syntaktische und semantische Annotationen, die die lexikalischen Eigenschaften von Lexemen, ihre Kasusrollen, ihre Zugehörigkeit zu Begriffen und die Relationen dieser Begriffe untereinander widerspiegeln. Über die Internetseite des Projektes ist es möglich, diverse Publikationen bezüglich der FrameNet-Forschung herunterzuladen. Weiterhin sind die Spezifikationen der neusten Version des FrameNet enthalten und ein Online-Zugriff auf die Datenbank ist möglich.
Link zu FrameNet
Link zur Webseite von Charles J. Fillmore
Link zu British National Corpus
Princeton WordNet
WordNet wurde unter der Leitung von George A. Miller entwickelt und ist ein lexikalisch-semantisches Wortnetz, das auf der Basis von englischen Textkorpora entstanden ist. Die Struktur der Datenbank wurde in Anlehnung an psycholinguistische Erkenntnisse über die mentale Organisation des Wortschatzes gewählt. Die Wortklassen Nomen, Verben, Adjektive und Adverbien werden jeweils in Synsets innerhalb der Datenbank abgespeichert. Spezifische Relationen bestehen innerhalb der Synsets und auch zwischen den Synsets. Eine grundlegende Beschreibung bieten die “5 Papers” von George A. Miller, Christiane Fellbaum, Katherine J. Miller u. a. WordNet stellt die Grundlage für weitere Projekte dar, wie zum Beispiel das EuroWordNet-Projekt. Obwohl dieses bereits eingestellt wurde, werden viele einzelsprachliche Projekte weitergeführt, wie z. B. das deutsche Wortnetz GermaNet. Über die Internetseite von WordNet ist ein Online-Zugriff auf die Datenbank möglich. Weiterhin werden Versionen zum freien Download angeboten.
Link zu WordNet
Link zur Webseite von George A. Miller
Link zur Webseite von Christiane Fellbaum
Link zu EuroWordNet
Link zu GermaNet
Cyc-Projekt und Open-Cyc
Cyc, entwickelt von Cycorp in Austin, Texas, ist das derzeit umfangreichste Projekt, das der Modellierung des gesamten Weltwissens gewidmet ist. Hierbei werden detailliert Teilbereiche des Alltagswissens erfasst und miteinander in Beziehung gesetzt. Die formale Sprache CycL wurde eigens für diesen Zweck entwickelt. Die umfangreiche Datenbank dient als Hintergrundwissen für Sprachverarbeitungssysteme. Die Entwickler/-innen versprechen sich durch die Implementierung von Cyc, dass maschinelle Inferenzenbildung und damit die Auflösung von Mehrdeutigkeiten sprachlicher Äußerungen auch auf Alltagssituationen bezogen möglich ist. Zur Verwendung innerhalb der Semantic Web-Technologie wird Cyc von vielen Autoren/-innen aber als ungeeignet eingeschätzt. Frei verfügbar ist ein Auszug der Datenbank - OpenCyc.
Link zu Cycorp
Link zu Cyc
Link zu OpenCyc