Fakultät für Informatik
Lehrstuhl für Algorithm Engineering (Ls11)
Home Kontakt Deutsch English
menu
Günter Rudolph: Proseminar Computerlinguistik

Computerlinguistik

(Proseminar 040605)

Sommersemester 2011

Prof. Dr. Günter Rudolph



Termin:    
Dienstag 16:15 - 18:00 OH 14, R. E02
Beginn: 05. April 2011


Anmeldung: ist abgeschlossen.

Vorbesprechung: war am 17.1.2011.

Bibliotheksschulung:
Freitag, 18. Februar 2011, 10:00-11:30 Uhr, Zentralbibliothek, Raum Z 11 (im 1.UG)

Beschreibung:
»Die Computerlinguistik ist das Fachgebiet, das sich mit der maschinellen Verarbeitung natürlicher Sprache beschäftigt. Sie ist im Überschneidungsbereich von Informatik und Linguistik angesiedelt, aber die Wurzeln der Computerlinguistik reichen bis in die fünfziger Jahre zurück. In diesem halben Jahrhundert seit ihrem Entstehen hat sie sich mittlerweile national und international erfolgreich etabliert, so dass auf dem Wissen aus der Informatik und der Linguistik aufbauend neue und eigenständige Methoden für die maschinelle Verarbeitung gesprochener und geschriebener Sprache entwickelt wurden. (...)
Der Einfluss der Computerlinguistik (CL) auf das tägliche Leben in unserer „Informationsgesellschaft” wächst. Es ist fast unvermeidlich, dass man mit den aus dieser relativ neuen Wissenschaft entstandenen Produkten in Kontakt kommt, sei es beim Surfen im Internet oder beim normalen Gebrauch des Computers. Ein Achtklässler, der am Computer einen Hausaufsatz schreibt, benutzt morphologische Prozesse (Rechtschreibkorrektur), grammatische Analyse (Grammatiküberprüfung), eventuell auch statistische Informationen über den geschriebenen Text (Häufigkeitsanalysen) oder Lexikographie (Thesaurus). Kommt eine Internet-Recherche dazu, erweitert sich der Kreis der Methoden um Informationserschließung und möglicherweise vollautomatische maschinelle Übersetzung. Aber selbst wenn man keinen Computer benutzt, wird man mit Anwendungen der Computerlinguistik konfrontiert, etwa beim Lesen der halbautomatisch übersetzten Bedienungsanleitung für den neuen Toaster oder beim Telefonat mit der Bank, an dessen Beginn eine freundliche Maschine nach der Kontonummer fragt.
Diese wenigen Beispiele machen deutlich, welche Bedeutung die Computerlinguistik in den letzten Jahren erfahren hat: Sie erschließt Informationsquellen, erleichtert den Umgang mit Maschinen und hilft, Grenzen zwischen verschiedenen Sprachen zu überwinden.«
[Entnommen aus S. 1 in K.-U. Carstensen u.a. (Hrsg.): Computerlinguistik und Sprachtechnologie. 3. Auflage. Spektrum: Heidelberg 2010]

Das oben genannte Buch ist in der Universitätsbibliothek als Online-Ressource vorhanden. Es wird uns als Grundlage dienen, um allgemeines Basiswissen aufzubauen (Kapitel 1+2) und die Einzelthemen zu definieren (Kapitel 3+4+5).

Anforderungen:
Formal keine; sinnvoll sind jedoch Kenntnisse aus den ersten beiden Fachsemestern.

Vergabe der Themen:
Kapitel Arbeitsthema / Folien bearbeitet von Vortragstermin
3.1 Phonetik und Phonologie Martin Grisard 05.04.2011
3.2 Verarbeitung gesprochener Sprache David Reher 12.04.2011
3.3 Morphologie Andreas Schmidt 19.04.2011
3.4 Flache Satzverarbeitung Alexander Wernicke 26.04.2011
3.5 Syntax und Parsing Suzana Mitkovska 03.05.2011
3.6 Semantik Michael Jugovac 10.05.2011
3.7 Pragmatik Fabian Wollnowski 17.05.2011
3.8 Textgenerierung Andreas Goldmann 31.05.2011
5.1 Korrektursysteme Daniel Schaefers 31.05.2011
5.2 Computergestützte Lexikographie Sabrina Grünke 14.06.2011
5.3 Textbasiertes Informationsmanagement Sarah Gillet 14.06.2011
5.4 Spracheingabe und -ausgabe Nadine Bierkemper-Kachallek 21.06.2011
5.5 Multimodale Dialogsysteme Nina Hesse 28.06.2011
5.6 Natürlichsprachliche Auskunftsysteme Matthias Wisniewski 05.07.2011
5.7 Maschinelle Übersetzung Maren Geske 12.07.2011

Ausarbeitung:
Verwenden Sie LaTeX.

Als Vorlage sollten Sie die angegebene Datei vorlage.tex nehmen. Dazu brauchen Sie auch das Logo der TU Dortmund. Das Titelblatt sollte in etwa so aussehen. Bitte ersetzen Sie die gesperrt gedruckten Teile durch den Titel Ihrer Ausarbeitung und Ihren Namen (nicht gesperrt).

Abgabe: Freitag, 1. Juli 2011. Per email als pdf-Datei.

Sie erhalten bis zum 23. Juli 2011 eine kommentierte Version Ihrer Ausarbeitung zurück. Bei Bedarf gibt es dazu einen individuellen Besprechungstermin.

Bis zum 31. August 2011 haben Sie dann Zeit die endgültige Version abzugeben. Diese wird benotet! Die Benotung erfolgt im September 2011.




 
<webmaster  ls11.cs.tu-dortmund.de>
Die Universität übernimmt keine Haftung für den Inhalt verlinkter externer Internetseiten