Aufbereitung wissenschaftlicher Paper

Beschreibung

Die Bibliographie bildet den Schluß der meisten Paper in der Informatik. Diese referenziert meist Literatur, die als PDF Dokumente im Netz zur Verfügung stehen. Im Zuge dieser Arbeit soll ein Kommandozeilenprogramm geschrieben werden, das eine Sammlung von wissenschaftlichen Dokumenten im PDF Format verwaltet. Zentrale Schnittstelle soll eine Bibtex-Datei sein, in der die PDF-Dateien beschrieben werden. Das Hinzufügen einer neuen Datei soll ohne Angabe weiterer Parameter mit einem einfachen Programmaufruf erfolgen. Die PDF Datei wird mit Hilfe einer PDF-Manipulationsbibliothek geparst und dessen Bibliographie analysiert. Anhand eines Dumps der DBLP Datenbank können die meisten Referenzen mit Papern aus der DBLP in Verbindung gebracht werden. Die Bibliographie der PDF-Datei wird mit Hyperlinks erweitert, sodass ein einfacher Klick auf einen Eintrag die referenzierte Literatur öffnet. Da die Bibliographieangaben manchmal unvollständig oder sogar fehlerhaft sind, ist beim Vergleich mit der DBLP Datenbank Vorsicht geboten. Programmiersprache und Entwicklungsumgebung sind beliebig wählbar, ein Interesse an Indizierung und String-Matching sollte vorhanden sein.

Typ

Bachelorarbeit

Betreuer

Bei Interesse wenden Sie sich bitte an Dominik Köppl.

 
Last modified: 2016-10-21 13:12 (external edit)
DokuWikiRSS-Feed