Effiziente Fehlerlokalisierung: TU Graz präsentiert Debugging-Software
Forschende der TU Graz haben ein neues Debugging-System entwickelt, das durch Natural Language Processing und Metriken das Auffinden von Fehlern in großen Codebasen beschleunigt.
Moderne Software-Anwendungen bestehen meist aus zahlreichen Dateien und mehreren Millionen Codezeilen. Aufgrund dieser Menge gestaltet sich das Finden und Beheben von Fehlern, das sogenannte Debugging, als schwierig. In vielen Softwarefirmen suchen Entwickler derzeit noch manuell nach Fehlern, was einen großen Teil ihrer Arbeitszeit beansprucht – Studien geben hier zwischen 30 und 90 Prozent als Anteil an der gesamten Entwicklungszeit an. Birgit Hofer und Thomas Hirsch vom Institut für Softwaretechnologie der TU Graz haben auf Basis bestehender Natural-Language-Processing-Methoden und vorhandener Metriken eine Lösung erarbeitet, die das Finden der fehlerhaften Codestellen und damit das Debugging stark beschleunigen kann.
Fehlersuche kostet am meisten Zeit
„Als ersten Schritt haben wir bei bei Befragungen unter Entwicklerinnen herausgearbeitet, was der größte Zeitfresser beim Debugging ist. Dabei hat sich gezeigt, dass die eigentliche Fehlerbehebung gar nicht das große Problem ist, sondern die Programmiererinnen hauptsächlich bei der Lokalisierung feststecken, also der Eingrenzung der Suche auf den richtigen Bereich im Programmcode“, erklärt Birgit Hofer. Auf Basis dieser Erkenntnis machten sich die Forschenden daran, für dieses Problem eine Lösung zu finden, die auch auf Anwendungen mit viel Code skalierbar ist. So gibt es zwar gut funktionierende, modellbasierte Ansätze, bei denen ein Programm in eine logische Darstellung (bezeichnet als Modell) umgewandelt wird, doch dies funktioniert nur für kleine Programme. Das liegt daran, dass mit der Zunahme an Code der Rechenaufwand exponentiell ansteigt. Der von Birgit Hofer und Thomas Hirsch aufgegriffene Ansatz bildet bestimmte Software-Eigenschaften in Zahlen ab – beispielsweise die Lesbarkeit oder Komplexität von Code – und ist auch für große Codemengen anwendbar, da der Rechenaufwand nur linear zunimmt.
Bug Report hilft bei Fehlersuche
Ausgangspunkt bei der Fehlersuche ist der Bug Report, für den Testeroder Anwender ein Formular ausfüllen, in dem sie den Fehler beschreiben und Angaben zur Softwareversion, ihrem Betriebssystem, ihren Arbeitsschritten vor dem Fehler und andere relevante Informationen eintragen. Auf Basis dieses Bug Reports analysiert die Kombination aus Natural Language Processing und Metriken den gesamten Code hinsichtlich Klassen sowie der Namen für Variablen, Dateien, Methoden oder Funktionen und der Aufrufe von Methoden sowie Funktionen. Dabei identifiziert die Anwendung Code-Abschnitte, die am besten der Fehlerbeschreibung entsprechen. Die Entwickler bekommen als Ergebnis eine Liste mit fünf bis zehn Dateien, die nach der Wahrscheinlichkeit gereiht sind, dass sie für den beobachteten Fehler verantwortlich sein könnten. Zusätzlich erhalten die Entwicklerinnen noch die Information, um welche Art von Fehler es sich am ehesten handelt. Anhand dieser Daten kann der Fehler schneller aufgespürt und behoben werden.
Debugging-System steht fei zur Verfügung
„Die Arbeitszeit von Software-Entwicklern ist teuer, dennoch verbringen sie oft mehr dieser teuren Zeit damit, Fehler zu suchen und zu beheben, als neue Features zu entwickeln“, sagt Hofer. „Da es bereits einige Ansätze gibt, um diesen Umstand auszumerzen, haben wir untersucht, wie wir diese kombinieren und verbessern können, damit es eine Basis für die wirtschaftliche Anwendung gibt“. Die Grundlage dafür, haben sie jetzt geschaffen und das System ist funktionstauglich. Damit es in Unternehmen integriert werden kann, müsse es jedoch noch an die jeweiligen Bedürfnisse angepasst werden. Das Debugging-System steht über die Plattform „GitHub“ frei zur Verfügung.