Günter Rudolph: Proseminar Computerlinguistik
Termin: |
|
|
Dienstag |
16:15 - 18:00 |
OH 14, R. E02 |
Beginn: |
05. April 2011 |
Anmeldung: ist abgeschlossen.
Vorbesprechung: war am 17.1.2011.
Bibliotheksschulung:
Freitag, 18. Februar 2011, 10:00-11:30 Uhr, Zentralbibliothek, Raum Z 11 (im 1.UG)
Beschreibung:
»Die Computerlinguistik ist das Fachgebiet, das sich mit der maschinellen Verarbeitung
natürlicher Sprache beschäftigt. Sie ist im Überschneidungsbereich von
Informatik und Linguistik angesiedelt, aber die Wurzeln der Computerlinguistik
reichen bis in die fünfziger Jahre zurück. In diesem halben Jahrhundert
seit ihrem Entstehen hat sie sich mittlerweile national und international erfolgreich
etabliert, so dass auf dem Wissen aus der Informatik und der Linguistik
aufbauend neue und eigenständige Methoden für die maschinelle Verarbeitung
gesprochener und geschriebener Sprache entwickelt wurden. (...)
Der Einfluss der Computerlinguistik (CL) auf das tägliche Leben in unserer „Informationsgesellschaft”
wächst. Es ist fast unvermeidlich, dass man mit den aus
dieser relativ neuen Wissenschaft entstandenen Produkten in Kontakt kommt,
sei es beim Surfen im Internet oder beim normalen Gebrauch des Computers.
Ein Achtklässler, der am Computer einen Hausaufsatz schreibt, benutzt morphologische
Prozesse (Rechtschreibkorrektur), grammatische Analyse (Grammatiküberprüfung),
eventuell auch statistische Informationen über den geschriebenen
Text (Häufigkeitsanalysen) oder Lexikographie (Thesaurus). Kommt eine
Internet-Recherche dazu, erweitert sich der Kreis der Methoden um Informationserschließung
und möglicherweise vollautomatische maschinelle Übersetzung.
Aber selbst wenn man keinen Computer benutzt, wird man mit Anwendungen
der Computerlinguistik konfrontiert, etwa beim Lesen der halbautomatisch übersetzten
Bedienungsanleitung für den neuen Toaster oder beim Telefonat mit der
Bank, an dessen Beginn eine freundliche Maschine nach der Kontonummer fragt.
Diese wenigen Beispiele machen deutlich, welche Bedeutung die Computerlinguistik
in den letzten Jahren erfahren hat: Sie erschließt Informationsquellen,
erleichtert den Umgang mit Maschinen und hilft, Grenzen zwischen verschiedenen
Sprachen zu überwinden.«
[Entnommen aus S. 1 in K.-U. Carstensen u.a. (Hrsg.): Computerlinguistik und Sprachtechnologie. 3. Auflage.
Spektrum: Heidelberg 2010]
Das oben genannte Buch ist in der Universitätsbibliothek als Online-Ressource vorhanden.
Es wird uns als Grundlage dienen, um allgemeines Basiswissen aufzubauen (Kapitel 1+2)
und die Einzelthemen zu definieren (Kapitel 3+4+5).
Anforderungen:
Formal keine; sinnvoll sind jedoch Kenntnisse aus den ersten beiden Fachsemestern.
Vergabe der Themen:
Ausarbeitung:
Verwenden Sie LaTeX.
Als Vorlage sollten Sie die angegebene Datei vorlage.tex nehmen.
Dazu brauchen Sie auch das Logo der TU Dortmund. Das Titelblatt sollte in etwa
so aussehen. Bitte ersetzen Sie die gesperrt gedruckten Teile durch den Titel Ihrer Ausarbeitung und Ihren Namen (nicht gesperrt).
Abgabe: Freitag, 1. Juli 2011. Per email als pdf-Datei.
Sie erhalten bis zum 23. Juli 2011 eine kommentierte Version Ihrer Ausarbeitung zurück.
Bei Bedarf gibt es dazu einen individuellen Besprechungstermin.
Bis zum 31. August 2011 haben Sie dann Zeit die endgültige Version abzugeben. Diese wird benotet!
Die Benotung erfolgt im September 2011.
|