Titel: Text-Indexierung und Information Retrieval (englisch: Text Indexing and Information Retrieval) vorläufige Modulnr (bereits von FTB mitgeteilt): INF-MSc-613 Turnus: immer im WS Dauer: 1 Semester CP: 6 Aufwand: 180h (60/120) 1. Modulstruktur Nr. Element / Lehrveranstaltung Typ CP SWS 1 Text-Indexierung und Information Retrieval V 3 2 2 Ü zu ... Ü 3 2 2. Lehrveranstaltungssprache: Deutsch oder nach Bedarf Englisch 3. Lehrinhalte: In dieser Vorlesung beschäftigen wir uns mit dem Problem, einen (oft sehr langen) Text so vorzuverarbeiten, dass im Anschluss effiziente Suchanfragen darin ausgeführt werden können. Beispiele solcher Anfragen reichen von einfachen Pattern-Matching Anfragen (“kommt ein Suchmuster im Text vor?”) bis hin zu komplexen Data-Mining-Anfragen, z.B. die Suche nach repetitiven Mustern. Im einzelnen behandeln wir die folgenden Themen: - Textindizes: Suffixbäume, Suffix-Arrays, Suffix-Trays, Inverted Indexes - exakte und approximative Mustersuche mit Hilfe von Textindizes - Funktionalität von Suchmaschinen: schnelle Berechnung und Sortierung aller Dokumente, die ein Suchmuster enthalten - Textkompression: Burrows-Wheeler-Transformation und LZ-Komprimierung Diese Vorlesung eignet sich zur Vorbereitung einer Abschlussarbeit im Bereich Algorithmen und Datenstrukturen auf Texten. 4. Kompetenzen: Die Studierenden - lernen grundlegende Techniken der Text-Indexierung kennen - vertiefen die in den Grundvorlesungen erworbenen algorithmischen Fähigkeiten - erfahren, wie große Datenmengen platzeffizient gespeichert und verarbeitet werden können 5./6. Prüfungen: Modulprüfung: mündliche Prüfung (20 Minuten) Studienleistung: - Aktive Mitarbeit in der Übung (inkl. Präsentation eigener Lösungen) - vom Veranstalter zu Beginn bekanntgegebene Zusatzleistung, z.B. Erstellung/Verbesserung von Wikipedia-Artikeln (o.ä.) oder kleinere Projektarbeiten Die Studienleistung ist Voraussetzung für die Teilnahme an der Modulprüfung. 7. Teilnahmevoraussetzungen Erfolgreich abgeschlossen: keine Vorausgesetzte Kenntnisse: Basismodul „Algorithmen und Datenstrukturen“ 8. Modultyp und Verwendbarkeit des Moduls Vertiefungsmodul in den Masterstudiengängen Informatik und Angewandte Informatik Forschungsbereich: Algorithmen und Komplexität 9. Beauftragter: Prof. Dr. Johannes Fischer