Herzlich Willkommen!

von jk

Willkommen im Weblog zu Linguistik und Semantic Web! Ins Leben gerufen wurde dieses Blog, um das linguistische Proseminar “Semantic Web aus linguistischer Perspektive” im Fachgebiet Anglistische und Allgemeine Linguistik an der TU Berlin im WS 2005/06 zu begleiten.

In Kürze soll das Blog in mehr oder weniger akademischer Form erfrischt und neugierig zu den Themen “Semantik”, “Web” und “Semantic Web” wieder aufleben - eventuell integriert in ein anderes Blog. Bis sich das entschieden hat und es endlich weiter geht, stehen hier ein paar Einstiegs-Hinweise zur Verfügung.

Kategorie: In eigener Sache | 3 Kommentare »

Berliner XML-Tage, 25.-27.9.2006

07.09.2006 von jk

Wie es der Titel verspricht, stehen die XML-Tage in Berlin ganz im Zeichen von XML-Technologien. Der wissenschaftliche Bereich befasst sich u.a. mit Semantic Web-Lösungen. Außerdem wird es wieder das Wirtschaftsforum (mit E-Learning-Forum, E-Justiz-Forum, Forum Portale), den W3C-Tag, verschiedene Tutorials, ausstellende Firmen, Empfänge und weiteres geben.

Als Neuheit findet dieses Jahr erstmalig ein Infotag Web 2.0 statt.

Link zu den Berliner XML-Tagen 2006
Link zum Infotag Web 2.0

Weitere Links können folgen.

Kategorie: Semantic Web, Web 2.0, Konferenzen | 1 Kommentar »

Das World Wide Web Consortium: Link-Tipps

06.01.2006 von jk

Die nachfolgenden Links findet Ihr auch in der gesamten Linkliste.

Das World Wide Web Consortium
Das World Wide Web Consortium (W3C) ist eine Instanz, die Standards für Web-Technologien entwickelt und herausgibt. Auf der Webseite des W3C sind alle Informationen zu den einzelnen Aktivitätsbereichen und die genauen Formulierungen und Angaben der Standards zu finden. Das W3C hat sich der zukunftsträchtigen Entwicklung des Web verschrieben. Dazu zählen u.a., dass das Web für alle - egal mit welchem Wissen, Sprache, Nutzungszielen - unabhängig von den Hard- und Softwarevoraussetzungen und mit Hinblick auf zukünftige Erweiterbarkeit entwickelt werden soll.

Link zur Hauptseite des W3C

W3C - Semantic Web Activity
Das Semantic Web soll eine Erweiterung des derzeitigen Web darstellen. Die Semantic Web Activities sind einerseits den technologischen Weiterentwicklungen gewidmet, andererseits wird das Semantic Web unter gesellschaftlichen Aspekten betrachtet. Auf der Webseite sind Beschreibungen von Standards, Forschungsbereichen, Interessensgruppen und eine Vielzahl von Links zu Publikationen und Tutorials zu finden.

Link zu W3C - Semantic Web Activity

Kategorie: Semantic Web | 1 Kommentar »

Von linguistischer Semantik zum Semantic Web - Literatur zum Brückenschlag

17.12.2005 von jk

Eine Auswahl zum genaueren Nachlesen.

Wenn Ihr den Zusammenhang unserer Seminar-Themen noch besser nachvollziehen möchtet, empfehle ich Euch die folgenden Werke. Es handelt sich um sehr gut lesbare Bücher (auch die beiden englischen Tipps), die geeignet sind, um Euren interdisziplinären Blick auf die Thematik noch weiter zu schärfen. Wenn Ihr in die Bücher hineingeschaut habt, interessiert mich Eure Meinung: Wie kommt Ihr mit diesen Büchern klar? Gefallen sie Euch? Helfen sie Euch beim Studium? Über jeden noch so kurzen Kommentar dazu freue ich mich.

Alle Angaben findet Ihr auch in der gesamten Literaturliste.

Linguistic Semantics von John Lyons (1995)

Lyons, John (1995). Linguistic Semantics. An Introduction. Cambridge: Cambridge University Press.

Linguistic Semantics

Ein äußerst anregender Überblick über die Bereiche der Semantik und ihren Zusammenhang untereinander.

Computerlinguistik und Sprachtechnologie von Kai-Uwe Carstensen et al. (2004)

Carstensen, Kai-Uwe; Ebert, Christian; Endriss, Cornelia; Jekat, Susanne; Klabunde, Ralf; Langer, Hagen (Hrsg.) (2004). Computerlinguistik und Sprachtechnologie. Eine Einführung. München: Elsevier GmbH.

Computerlinguistik und Sprachtechnologie

Das Buch hält, was der Titel verspricht - es wird auf (fast) alle linguistischen Bereiche eingegangen, die sich mit automatischer Verarbeitung von Sprache beschäftigen.

Weaving the Web von Tim Berners-Lee (1999)

Berners-Lee, Tim (1999). Weaving the Web. The Past, Present and Future of the World Wide Web by its Inventor. London: Orion Business Books.

Weaving the Web

Im Romanstil berichtet der “Erfinder” des WWW Tim Berners-Lee über die Beweggründe und Zusammenhänge zum Aufbau des WWW. Auch schreibt er über seine Zukunftsvisionen bezogen auf das Semantic Web.

Schön zu lesen, dass es sich auch nur um Menschen handelt, die an all dem arbeiten!

Kategorie: Semantic Web, Semantik, Sprachtechnologie | Kommentieren »

Trennung von Inhalt und Layout - CSS Zengarden

15.12.2005 von jk

Um das Prinzip der Trennung von Inhalt und Layout besser zu verstehen und auch noch Webdesign-Freuden zu erleben, lohnt sich ein Besuch bei CSS Zengarden. Alle Seiten, die man hier anschauen kann, enthalten den selben Inhalt. Cascading Style Sheets (CSS) dienen ausschließlich dazu, anzugeben, mit welchem Design dieser Inhalt präsentiert wird.

Link zu CSS Zengarden
Link zur Einführung in CSS bei Selfhtml

Kategorie: Schönes Web, Visualisierung | Kommentieren »

Online Nachschlagewerke: Link-Tipps

von jk

Leo Dictionary
Dieses Online Wörterbuch gibt es für Deutsch-Englisch und für Deutsch-Französisch - jeweils in beiden Richtungen. Ein Forum für Wortschatzdiskussionen und Vokabeltrainer stehen ebenfalls zur Verfügung. Inzwischen sind auch eine große Anzahl von Phrasen und Redewendungen enthalten.

Alle Links findet Ihr auch in der gesamten Linkliste.

Link zu Leo Dictionary

Openthesaurus
Synonyme sind in einem Wortnetz miteinander in Verbindung gesetzt und können abgefragt werden. Außerdem steht es allen offen, an der Erweiterung von Openthesaurus mitzuarbeiten, wie es auch bei Wikipedia möglich ist.

Link zu Openthesaurus

Wikipedia
Das Wikipedia Projekt lebt von der begeisterten Mitarbeit aus unterschiedlichen Wissenshintergründen und Interessen heraus. Das Projekt gibt es in weiteren Sprachen. Wenn Ihr Euch mit einem Bereich gut auskennt - vielleicht habt Ihr ja Lust, bei Wikipedia mitzuwirken. Es gibt ein paar einfache Regeln, die man beachten sollte und schon kann es los gehen. Und es funktioniert!

Link zu Wikipedia, deutsch

Wortschatz Lexikon, Uni Leipzig
Hierbei handelt es sich um ein umfangreiches linguistisches Projekt. Über die Online-Abfrage sind Informationen zur Morphologie, Syntax und Semantik, wie auch Relationen in grafischer Darstellung zu anderen Wörtern erhältlich. Außerdem werden u.a. Dokumente und Wortlisten zum Download angeboten.

Link zu Wortschatz Lexikon der Uni Leipzig

Kategorie: Wortnetze, Wörterbücher | 1 Kommentar »

Das Semantic Web auf dem Weg in die Praxis (Heise Newsticker)

30.11.2005 von jk

Die “Semantics 2005″ fand vom 23.-25.11.05 in Wien statt. Im Heise Newsticker “Das Semantic Web auf dem Weg in die Praxis” vom 27.11.05 werden vor allem Praxisbeispiele für Semantic Web-Technologien genannt. Die Integration in Web Services wird ein wichtiger Bereich sein. Aber Ruhe bewahren - es braucht alles noch seine Zeit.

Link zur “Semantics 2005″
Link zum Heise Newsticker zur “Semantics 2005″

Kategorie: Semantic Web | Kommentieren »

Wortnetze, WWW und Semantic Web - Links zum Einstieg

06.11.2005 von jk

Die folgende Link-Auswahl ist als Einstieg in das Thema “Linguistik und Semantic Web” gedacht. Auf den Webseiten erhaltet Ihr grundlegende Informationen darüber, worin das Ziel der Semantic Web-Forschung besteht, welche Web-Standards existieren, wonach sie entwickelt werden und wie man HTML lernen kann. Weiterhin könnt Ihr Euch über Projekte informieren, in denen eine Art Hintergrundwissen für die automatische Verarbeitung von Sprache erstellt wird. Dazu gehören lexikalisch-semantische Wortnetze und es wird auch auf ein Projekt zur Modellierung des gesamten Weltwissens hingewiesen.

Viel Spaß und danke für jeden Kommentar zu Euren Erfahrungen und Erkenntissen!

Alle Links sind auch in der gesamten Linkliste aufgeführt.

The Semantic Web, ein Semantic Web-Artikel von Tim Berners-Lee, James Hendler und Ora Lassila (2001)

In der Scientific American ist 2001 der mittlerweile sehr bekannte Semantic Web-Artikel The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities von Tim Berners-Lee, James Hendler und Ora Lassila erschienen. Hier wird ein alltägliches Szenario in naher Zukunft beschrieben, das demonstrieren soll, wie das Leben mit dem Semantic Web sein könnte.

Link zur Scientific American
Link zum Semantic Web-Artikel in der Scientific American
Link zur Webseite von Tim Berners-Lee
Link zur Webseite von James Hendler
Link zur Webseite von Ora Lassila

W3C

Das W3C wurde 1994 zur Förderung der Web-Entwicklung gegründet und ist diejenige Institution, über die Spezifikationen und Richtlinien für Web-Standards entwickelt und herausgegeben werden. Alle W3C-Empfehlungen entsprechen den Hauptmaximen des Web, wozu unter anderem Dezentralität, Zugriff auf Daten von jeder/-em auf alles von jedem Ort und allen Arten von Benutzerschnittstellen aus und die ständige Erweiterbarkeit des Webs gehören. Die W3C-Empfehlungen gelten in der Web-Gemeinde und der Industrie als allgemein gültige Standards. Auf der Internetseite sind alle bisher empfohlenen Standards zu Web-Technologien beschrieben. Weiterhin sind hier Informationen zu den W3C-Aktivitäten, Publikationen, sowie Manuals und Tutorials verfügbar. Arbeitsgruppen, wie zum Beispiel W3C-Semantic Web, spezialisieren sich auf bestimmte Bereiche.

Link zum W3C
Link zu den W3C-Reports, Publikationen und Empfehlungen
Link zu den W3C-Aktivitäten
Link zum W3C-Semantic Web

Selfhtml, Web-Tutorial, u.a. für HTML

Über das Web-Tutorial Selfhtml sind sowohl Grundzüge als auch Spezialkenntnisse zu HTML erlernbar bzw. auch immer wieder zum Nachschlagen geeignet. Der Aufbau ist übersichtlich und enthält viele Beispiele, die in der Code- und Layout-Ansicht angeschaut werden können. Auch weitere Web-Technologien, wie XHTML, XML, Style Sheets (CSS), Java Script, Perl oder PHP werden behandelt. Mit Selfhtml zu lernen, führt sehr schnell zu ersten Erfolgen und ist daher eine überaus motivierende Methode.

Link zum Web-Tutorial Selfhtml (deutsch)

Berkeley FrameNet

Das lexikalisch-semantische Wortnetz FrameNet ist eine Datenbank, die unter anderem auf der Basis des British National Corpus erstellt wurde. Theoretische Grundlage für die Modellierung der Datenbank bildet die Framesemantik nach Charles J. Fillmore. Frames sind konzeptuelle Rahmen für Personen, Ereignisse, Situationen und ähnliches. FrameNet enthält syntaktische und semantische Annotationen, die die lexikalischen Eigenschaften von Lexemen, ihre Kasusrollen, ihre Zugehörigkeit zu Begriffen und die Relationen dieser Begriffe untereinander widerspiegeln. Über die Internetseite des Projektes ist es möglich, diverse Publikationen bezüglich der FrameNet-Forschung herunterzuladen. Weiterhin sind die Spezifikationen der neusten Version des FrameNet enthalten und ein Online-Zugriff auf die Datenbank ist möglich.

Link zu FrameNet
Link zur Webseite von Charles J. Fillmore
Link zu British National Corpus

Princeton WordNet

WordNet wurde unter der Leitung von George A. Miller entwickelt und ist ein lexikalisch-semantisches Wortnetz, das auf der Basis von englischen Textkorpora entstanden ist. Die Struktur der Datenbank wurde in Anlehnung an psycholinguistische Erkenntnisse über die mentale Organisation des Wortschatzes gewählt. Die Wortklassen Nomen, Verben, Adjektive und Adverbien werden jeweils in Synsets innerhalb der Datenbank abgespeichert. Spezifische Relationen bestehen innerhalb der Synsets und auch zwischen den Synsets. Eine grundlegende Beschreibung bieten die “5 Papers” von George A. Miller, Christiane Fellbaum, Katherine J. Miller u. a. WordNet stellt die Grundlage für weitere Projekte dar, wie zum Beispiel das EuroWordNet-Projekt. Obwohl dieses bereits eingestellt wurde, werden viele einzelsprachliche Projekte weitergeführt, wie z. B. das deutsche Wortnetz GermaNet. Über die Internetseite von WordNet ist ein Online-Zugriff auf die Datenbank möglich. Weiterhin werden Versionen zum freien Download angeboten.

Link zu WordNet
Link zur Webseite von George A. Miller
Link zur Webseite von Christiane Fellbaum
Link zu EuroWordNet
Link zu GermaNet

Cyc-Projekt und Open-Cyc

Cyc, entwickelt von Cycorp in Austin, Texas, ist das derzeit umfangreichste Projekt, das der Modellierung des gesamten Weltwissens gewidmet ist. Hierbei werden detailliert Teilbereiche des Alltagswissens erfasst und miteinander in Beziehung gesetzt. Die formale Sprache CycL wurde eigens für diesen Zweck entwickelt. Die umfangreiche Datenbank dient als Hintergrundwissen für Sprachverarbeitungssysteme. Die Entwickler/-innen versprechen sich durch die Implementierung von Cyc, dass maschinelle Inferenzenbildung und damit die Auflösung von Mehrdeutigkeiten sprachlicher Äußerungen auch auf Alltagssituationen bezogen möglich ist. Zur Verwendung innerhalb der Semantic Web-Technologie wird Cyc von vielen Autoren/-innen aber als ungeeignet eingeschätzt. Frei verfügbar ist ein Auszug der Datenbank - OpenCyc.

Link zu Cycorp
Link zu Cyc
Link zu OpenCyc

Kategorie: Semantic Web, Wortnetze, Ontologien | Kommentieren »

4. Semantic Web Conference: 06.-10. November 2005, in Galway

05.11.2005 von jk

Vom 6. bis 10. November findet die 4. Semantic Web Conference statt. Nach Sardinia (Italien, 2002), Sundial Ressort in Florida (USA, 2003) und Hiroshima (Japan, 2004) ist der diesjährige Ort der Konferenz Galway (Irland). Diese Hauptaustauschplattform zum Thema Semantic Web verbindet theoretische grundlegende Forschungsansätze mit praktischen Lösungen und Erfahrungen.

Link zur 4. Semantic Web Conference 2005, Galway
Link zur 3. Semantic Web Conference 2004, Hiroshima
Link zur 2. Semantic Web Conference 2003, Sundial Ressort in Florida
Leider scheint der Link von der 1. Semantic Web Conference nicht mehr aktiv zu sein.

Kategorie: Semantic Web, Konferenzen | 1 Kommentar »