Wer Software programmiert, hinterlässt Spuren im Code, quasi eine Art digitalen Fingerabdruck, ein Abbild der eigenen Coding-Handschrift. Anhand dieser Spuren lässt sich der Autor einer Software identifizieren, allerdings ist das eher mühselig. Doch jetzt haben Forscher eine KI entwickelt, die genau diese Aufgabe übernehmen kann, wie Endgadget berichtet.

Rachel Greenstadt, Assistenzprofessorin für Computerwissenschaften an der Drexel Universität, und Alyin Caliskan, ebenfalls Assistenzprofessor an der George Washington Universität, haben im Rahmen eines stylometrischen Forschungsprojekts diese Künstliche Intelligenz präsentiert. In einem Testlauf fütterten sie die KI mit jeweils acht kurzen Code-Beispielen von insgesamt 600 unterschiedlichen Programmierern. Dabei lag die KI in 83 Prozent der Fälle richtig.

Um den Autor eines bestimmten Code-Schnipsels zu identifizieren, identifiziert der zugehörige Algorithmus zunächst die einzelnen Bestandteile des Codes und deren Charakteristika, etwa verwendete Begriffe, Reihenfolgen von Befehlen und ähnliches. Dazu erstellten die Forscher spezifische Syntax-Bäume, die etwa 50 spezifische Merkmale der Programmiersprache einzelner Programmierer beinhalteten.

Die Möglichkeiten, die sich durch die KI ergeben, lassen sich sowohl positiv als auch negativ bewerten: Die KI ließe sich nutzen, um Code-Plagiate zu identifizieren oder die Autoren von Malware aufzuspüren. Auf der anderen Seite bestünde aber eine Bedrohung für die Privatsphäre der Programmierer und auch der Missbrauch der KI als Zensur-Tool wäre denkbar.