====== Proseminar Information Retrieval ====== ===== Inhalt ===== Wir beschäftigen uns mit den Algorithmen, die hinter Internet-Suchmaschinen stehen. Hierbei spielen Aspekte wie Text-Indexierung, Text-Kompression etc. eine wichtige Rolle. Wir benutzen die folgenden 3 Lehrbücher: * Moffat, A. & Bell, T. C. (1999). //Managing gigabytes: compressing and indexing documents and images.// Morgan Kaufmann. [**MB**] * Manning, C. D., Raghavan, P., & Schütze, H. (2008). //Introduction to information retrieval.// Cambridge: Cambridge University Press. [**MRS**] * Baeza-Yates, R. & Ribeiro-Neto, B. (2nd edition, 2011). //Modern information retrieval.// Person Education Limited. [**MIR**] **Das Buch ist bei [[staff:koeppl|Dominik Köppl]] gegen Vorlage Ihres Personalausweises ausleihbar** ===== Lehrpersonen ===== * [[staff:fischer|Prof. Dr. Johannes Fischer]] * [[staff:koeppl|Dominik Köppl]] (Email: **dominik.koeppl@ls11.cs.tu-dortmund.de**) ===== Allgemeine Hinweise ===== Alle TN müssen in der ersten Woche vor Vorlesungsbeginn das [[fischer:teaching:pk-ss2014|Seminar Präsentationstechniken]] erfolgreich absolvieren. Bitte beachten Sie die wichtigen Hinweise in diesem {{:fischer:teaching:allgemeine_proseminarhinweise.pdf|Merkblatt}}. ===== Themenliste ===== 9.4.14: Introduction to Information Retrieval [MG1, MIR1, MRS1]: Wüstefeld -----: Term Vocabulary and Postings Lists [MRS2]: Jakob **fällt aus** 23.4.14: Dictionaries and Tolerant Retrieval [MIR9.5.6, MRS3]: Schulz 30.4.14: Inverted Index Construction [MIR9.2.5, MRS4]: Röß 7.5.14: Alternative Indices [MIR9.4]: Werner 14.5.14: Huffman Codes, Dense Codes [MG2.3, MIR6.8.4]: Hilalovic 21.5.14: Symbolwise Compression [MG2.5, MIR 6.8.6]: Hard 28.5.14: Text Compression by Dictionary Methods [MG2.6, MIR6.8.5]: Dinklage 4.6.14: Postings Lists Compression [MIR9.2.6, MRS5.3]: Fuhr -----: Dictionary Compression [MG4.1]: Adrian **fällt aus** 18.6.14: Scoring and Term Weighting [MIR 3.2.1-3.2.6, MRS6]: Marx 25.6.14: Evaluation of IR Systems [MRS8]: Klocke 2.7.14: Relevance Feedback and Query Expansion [MIR5]: Kamradt 9.7.14: Text Classification [MRS13]: Kramer -----: Parallel and Distributed IR [MIR10]: Yildiz ** fällt aus ** ===== Zeitlicher Ablauf ===== **Spätestens** 2 Wochen vor dem Vortrag sollen Sie in einem halbstündigen Treffen mit Ihrem Betreuer die bis auf Feinkosmetik **fertigen** Folien zeigen und erklären können. Bitte vereinbaren Sie dieses Treffen **rechtzeitig**, also mindestens 4 Wochen vor dem Vortrag. Spätestens 2 Wochen nach dem Vortrag müssen Sie die schriftliche Ausarbeitung abgeben (per Email als pdf). Die formalen Voraussetzungen zur schriftlichen Ausarbeitung sind dem o.g. Hinweisblatt zu entnehmen. Beide Deadlines sind hart. ===== Voraussetzungen ===== Sie sollten Spaß an algorithmischen Problemen und deren effizienter Lösung haben. ===== Ort und Zeit ===== Mi 10 c.t. - 12, R202 (OH14). Erster Termin am 9.4.2014. Es findet eine **Vorbesprechung mit Themenvergabe** in der letzten VL-Woche des WS'13/14 statt, und zwar am 4.2.2014 von 14 c.t. bis 16 Uhr im Raum 202 (OH14).