Das Suffix-Array ist einer der bekanntesten Textindizes. Es kann unter anderem zur Suche in Texten genutzt werden. Im Rahmen dieser Bachelorarbeit soll das Suffix-Array für die deutschsprachige Wikipedia konstruiert und anschließend zum Auffinden von Plagiaten in anderen Texten (z.B. Bachelorarbeiten) genutzt werden. Die Qualität der Treffen muss anschließend analysiert werden. Zudem soll der Ansatz mit existierende Lösungen (z.B. Apache Lucene) verglichen werden.
Bachelorarbeit.
Die Arbeit wird betreut von Johannes Fischer und Patrick Dinklage.