Plagiate erkennen - Technische Möglichkeiten
Das Internet als schnelle Quelle für "Vorlagen" und die Form einer Arbeit als Datei mit den Möglichkeiten des Copy & Paste vereinfachen die Übernahme fremder Inhalte enorm. Wünschenswert wäre, wenn die Entdeckung solcher Übernahmen im Sinne eines Plagiats (oder zumindest als Mangel an Eigenleistung) ebenso einfach möglich sein könnte, bspw. als Abgleich einer einzelnen Arbeit mit der Sammlung von existierenden Arbeiten im Internet oder der Analyse einer Datei. Die entsprechenden technischen Möglichkeiten und Grenzen sollen hier kurz skizziert werden.
Plagiate im Allgemeinen
Die Problematik von Plagiaten hat in den vergangenen Jahren Popularität, aber nicht unbedingt Klarheit gewonnen: ab wann etwas als Plagiat gilt und ab wann es nicht mehr als fachliche Unzulänglichkeit des Plagiaterstellers, sondern als gezielter Betrug zu werten ist, kann von vielerlei kontextuellen, fachlichen und persönlichen Faktoren abhängen. Diese bereits für einen menschlichen Prüfer profunde Aufgabe kann von einer Software oder einem allgemeinen (fachunspezifischen) automatischen Prozess naheliegenderweise nur eingeschränkt gelöst werden.
Plagiaterkennung als Plagiatverschleierung
Eine einfache und schnelle Erkennung von Plagiaten z.B. durch eine Software hat ein grundlegendes Problem: sie kann vom Ersteller eines Plagiats selbst angewendet werden, so dass dieser letztlich genau weiß, ob sein Plagiat erkannt werden wird. Ein halbwegs professioneller Plagiator wird kaum ein Plagiat in Umlauf bringen, das durch eine einfache Methodik als solches erkennbar ist, vielmehr noch wird ihm diese Methodik behilflich sein, sich auf die minimal erforderlichen Änderungen seiner Vorlage beschränken zu können und so noch effektiver Plagiate zu erstellen.
Plagiat und Auftragserstellung ("Ghostwriter")
Zumeist wird von Plagiaten gesprochen, wenn fremde Inhalte in eine andere Arbeit übernommen werden. Hier entstehen u.U. direkte Auffälligkeiten in plötzlichen Wechseln des Schreibstils, die theoretisch auch durch eine Software ermittelbar sein könnten (Stw. Stilometrie). Bei einem vollständigen Plagiat, in dem eine komplette Arbeit als eigene Arbeit ausgegeben wird, müssen für einen Stilvergleich andere Arbeiten des selben (vorgeblichen) Autors herangezogen werden, was oftmals nicht möglich ist. Erschwert wird dieser Vergleich, wenn das Plagiat als Auftragsarbeit erstellt wurde, bei der ein professioneller Plagiator den Stil des angeblichen Autors gezielt nachahmt.
Automatisierter Quellenvergleich ("Googlen")
Der klassische Weg bei einem Plagiats-Verdacht ist der Vergleich mit einer möglichen Quelle - klassisch unter Rückgriff auf gedruckte Arbeiten, heute via Google, Bing und andere Suchdienste, ggf. auch spezialisierte Fach-Suchdienste bzw. -Datenbanken. Problematisch ist hierbei eine große Zahl falscher Treffer, die häufig dadurch entstehen, dass WWW-Suchdienste die Suchanfrage umformen bzw. mit internen Indexen vergleichen, deren genauer Aufbau intransparent ist. Verglichen werden kann auch nur mit Quellen, die im WWW entsprechend zugänglich sind - dies scheitert oft an rechtlichen bzw. Lizenz-Fragen, aber auch am gezielten Aussperren von Suchdiensten, so dass z.B. spezielle Tauschbörsen für vorgefertigte Hausarbeiten nur durch Kenntnis einer bestimmten Adresse erreichbar sind, die möglicherweise nur von Plagiator zu Plagiator weitergegeben wird.
Spezialisierte Plagiatsermittlungsdienste können den genannten Problemen professionell begegnen, nicht zuletzt auch durch eigene Datenbanken, mit denen potentielle Plagiate verglichen werden. Hierdurch ergeben sich aber wiederum grundsätzliche rechtliche Probleme hinsichtlich der Speicherung von Daten in solchen Datenbanken und der Übermittlung von zu prüfenden Daten an Dienstleister.
Einzelfall- vs. Massenvergleich
Die gegenwärtig verfügbaren Software- und Online-Angebote für die Prüfung etwaiger Plagiate zielen auf intensive Einzefall-Prüfungen mit entsprechendem individuellen Aufwand ab und bieten sich für bereits bestehende Verdachtsfälle an. Eine Software, die den umgekehrten Weg geht, indem sie - mit weniger Detailtiefe, aber dafür schneller - pauschal eine Massenprüfung durchführt (bspw. über alle eingegangenen Hausarbeiten in einem Seminar) und diejenigen herausfiltert, die durch weitere (detallierte) Schritte auf einen Plagiatsverdacht untersucht werden sollten, ist derzeit nicht in Sicht (eine Alternative hierzu wäre die Abstellung eines "Plagiats-Beauftragten", welcher mit entsprechendem Zeitaufwand eine Masse von Texten einzeln "vor"-prüft). Für eine Einzelfallprüfung, für die bereits ein von einem Menschen gewonnener Verdacht vorliegt, ist der Einsatz einer Software aber derzeit nur von geringem Wert.
Datei-Eigenschaften von Word und OpenOffice / LibreOffice
Für gedruckte Dokumente existieren klassische Methoden, mit denen - aus historischem oder forensischem Interesse - Informationen über die Autorschaft gewonnen werden können, bspw. durch das verwendete Papier, Drucker / Schreibmaschine usw., die bspw. Anhaltspunkte dafür liefern können, dass nicht alle Teile einer Arbeit von der selben Person verfasst sind.
Wenn eine Arbeit als Word-DOCX-Datei (oder OpenOffice- / LibreOffice-ODT-Datei) erstellt wurde, dann können die automatisch von Word (bzw. OpenOffice / LibreOffice) geführten Dokument- bzw. "Meta"-Informationen herangezogen werden, um Anhaltspunkte hinsichtlich der Entstehung des Dokuments zu gewinnen. Gedacht sind diese Informationen primär für eine professionelle oder wissenschaftliche Veröffentlichung eines Textes, sowohl hinsichtlich der schnellen und korrekte Aufnahme in Suchindexe (vgl. die prägende Dublin Core Metadata Initiative), zur Kollaboration bei der gemeinsamen Erstellung oder Weiterverarbeitung von Texten und auch zur Absicherung der Urheberschaft an einem Text. Versierte Plagiat-Ersteller werden sich natürlich auch hier bemühen, die Dokumentinformationen entsprechend zu manipulieren - dementsprechend können die Details einer möglichen Analyse hier nicht genannt werden. Ein Vorteil einer Prüfung der Dokumentinformationen besteht auch darin, dass er prinzipiell ohne die Involvierung personenbezogener Daten möglich ist und entsprechende Implikationen entfallen. Sollten Sie Anlass zu einer technischen Prüfung eines Dokuments haben, dann wenden Sie sich per E-Mail an die IKM-Services der Philosophischen Fakultät (ikm@phil.hhu.de).
Indizien vs. Beweise
Technische oder automatisierte Verfahren für die Aufspürung von Plagiaten können in jedem Fall lediglich Indizien liefern, ob möglicherweise ein Plagiat vorliegt, aber keinesfalls einen Beweis - weder im wissenschaftlichen noch (bzw. keinesfalls) im rechtlichen Sinne. Eine technische Prüfung, die Anhaltspunkte für einen Plagiats-Verdacht liefert, kann Anlass für eine fundierte inhaltliche (fachliche) Prüfung sein.
Quellen und Verweise
Die Thematik "Plagiate" und daran anknüpfend die Ermittlung einer Autorenschaft ist ein weites Feld, das in verschiedenen Disziplinen behandelt wird, nicht zuletzt als Forschungsgegenstand selbst. Einen guten Überblick gibt der Wikipedia-Eintrag zum Thema, der reichhaltigste und etablierteste deutschsprachige Fundus ist das "Plagiat-Portal" der Hochschule für Technik und Wirtschaft Berlin, das direkt auf die "Plagiats-Pionierin" Debora Weber-Wulff zurückgeht: