Please use this identifier to cite or link to this item:
http://elea.unisa.it/xmlui/handle/10556/2566
Title: | Code smells: relevance of the problem and novel detection techniques |
Authors: | Palomba, Fabio De Lucia, Andrea De Lucia, Andrea |
Keywords: | Code smells;Software maintenance;Mining software repositories |
Issue Date: | 21-Apr-2017 |
Publisher: | Universita degli studi di Salerno |
Abstract: | Software systems are becoming the core of the business of several industrial companies
and, for this reason, they are getting bigger and more complex. Furthermore,
they are subject of frantic modifications every day with regard to the implementation
of new features or for bug fixing activities. In this context, often developers
have not the possibility to design and implement ideal solutions, leading to
the introduction of technical debt, i.e., “not quite right code which we postpone
making it right”.
One noticeable symptom of technical debt is represented by the bad code smells,
which were defined by Fowler to indicate sub-optimal design choices applied in
the source code by developers. In the recent past, several studies have demonstrated
the negative impact of code smells on the maintainability of the source
code, as well as on the ability of developers to comprehend a software system.
This is the reason why several automatic techniques and tools aimed at discovering
portions of code affected by design flaws have been devised. Most of them
rely on the analysis of the structural properties (e.g., method calls) mined from the
source code.
Despite the effort spent by the research community in recent years, there are
still limitations that threat the industrial applicability of tools for detecting code
smells. Specifically, there is a lack of evicence regarding (i) the circustamces leading
to code smell introduction, (ii) the real impact of code smells on maintainability,
since previous studies focused the attention on a limited number of software
projects. Moreover, existing code smell detectors might be inadeguate for
the detection of many code smells defined in literature. For instance, a number
xi
of code smells are intrinsically characterized by how code elements change over
time, rather than by structural properties extractable from the source code.
In the context of this thesis we face these specific challenges, by proposing a
number of large-scale empirical investigations aimed at understanding (i) when
and why smells are actually introduced, (ii) what is their longevity and the way
developers remove them in practice, (iii) what is the impact of code smells on
change- and fault-proneness, and (iv) how developers perceive code smells. At
the same time, we devise two novel approaches for code smell detection that rely
on alternative sources of information, i.e., historical and textual, and we evaluate
and compare their ability in detecting code smells with respect to other existing
baseline approaches solely relying structural analysis.
The findings reported in this thesis somehow contradicts common expectations.
In the first place, we demonstrate that code smells are usually introduced
during the first commit on the repository involving a source file, and therefore
they are not the result of frequent modifications during the history of source code.
More importantly, almost 80% of the smells survive during the evolution, and
the number of refactoring operations performed on them is dramatically low. Of
these, only a small percentage actually removed a code smell. At the same time,
we also found that code smells have a negative impact on maintainability, and in
particular on both change- and fault-proneness of classes. In the second place, we
demonstrate that developers can correctly perceive only a subset of code smells
characterized by long or complex code, while the perception of other smells depend
on the intensity with which they manifest themselves.
Furthermore, we also demonstrate the usefulness of historical and textual analysis
as a way to improve existing detectors using orthogonal informations. The
usage of these alternative sources of information help developers in correctly diagnose
design problems and, therefore, they should be actively exploited in future
research in the field.
Finally, we provide a set of open issues that need to be addressed by the research
community in the future, as well as an overview of further future applications
of code smells in other software engineering field. [edited by author] I sistemi software stanno diventando il cuore delle attivit`a di molte aziende e, per questa ragione, sono sempre pi `u grandi e complessi. Inoltre, sono frequentemente soggetti a modifiche che riguardano l’implementazione di nuove funzionalit`a o la risoluzione di difetti. In questo contesto, spesso gli sviluppatori non hanno la possibilit`a di progettare ed implementare soluzioni ideali, introducendo quindi technical debt, ovvero codice non ben progettato, la cui ri-progettazione viene postposta nel futuro. Un notevole sintomo della presenza di technical debt `e rappresentato dai bad code smell, che sono stati definiti da Fowler per indicare scelte di progettazione e/o implementazione sub-ottimali applicati dai programmatori durante lo sviluppo di un progetto software. Nel recente passato, molti studi hanno dimostrato l’impatto negativo dei code smell sulla manutenibilit`a e comprensibilit`a del codice sorgente. Per questa ragione, molte tecniche sono state proposte per l’identificazione di porzioni di codice affetto da problemi di progettazione. Molte di queste tecniche si basano sull’analisi delle propriet strutturali (ad esempio, chiamate a metodi esterni) estraibili dal codice sorgente. Nonostante lo sforzo che la comunit`a di ricerca ha profuso negli anni recenti, ci sono ancora limitazioni che precludono l’applicabilit`a industriale di tool per l’identificazione di smell. Nello specifico, c’`e una mancanza di evidenza empirica riguardo (i) le circostanze che portano all’introduzione degli smell, e (ii) il reale impatto degli smell sulla manutenibilit`a, in quanto studi precedenti hanno focalizzato l’attenzione su un numero limitato di progetti software. Inoltre, le tecii niche esistenti per l’identificazione di smell sono inadeguate per quanto concerne l’identificazione di molti dei code smell definiti in letteratura. Ad esempio, molti code smell sono intrinsecamente caratterizzati da come gli elementi nel codice cambiano nel tempo, piuttosto che da propriet`a strutturali estraibili dal codice sorgente. Nel contesto di questa tesi abbiamo affrontato queste sfide specifiche, proponendo diversi studi empirici su larga scala aventi come obiettivo quello di capire (i) quando e perch`e i code smell sono realmente introdotti, (ii) qual `e la loro longevit`a e come gli sviluppatori li rimuovono, (iii) qual `e l’impatto degli smell sulla propensione ai difetti e ai cambiamenti, e (iv) come gli sviluppatori percepiscono gli smell. Allo stesso tempo, abbiamo proposto due nuovi approcci per la rilevazione di code smell che si basano sull’utilizzo di sorgenti alternative di informazioni, ovvero storiche e testuali, e abbiamo valutato e confrontato la loro capacit`a nella identificazione rispetto alle altre tecniche basate su analisi strutturale. I risultati riportati in questa tesi contraddicono le aspettative comuni. Ad esempio, abbiamo dimostrato che i code smell sono spesso introdotti durante il primo commit che introduce l’artefatto affetto dal problema di progettazione. Dall’altro lato, abbiamo dimostrato l’utilit`a dell’analisi storica e testuale come un modo aggiuntivo per migliorare tecniche esistenti con informazioni ortogonali. Inoltre, forniamo un insieme di problemi aperti che necessitato di ulteriore attenzione in futuro, cos`ı come una panoramica di ulteriori applicazioni future dei code smell in altri contesti nel campo dell’ingegneria del software. [a cura dell'autore] |
Description: | 2015 - 2016 |
URI: | http://hdl.handle.net/10556/2566 http://dx.doi.org/10.14273/unisa-965 |
Appears in Collections: | Management and Information Technology |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
tesi F. Palomba.pdf | tesi di dottorato | 12,28 MB | Adobe PDF | View/Open |
abstract in inglese F. Palomba.pdf | abstract in inglese a cura dell'autore | 228,12 kB | Adobe PDF | View/Open |
abstract in italiano F. Palomba.pdf | abstract in italiano a cura dell'autore | 204,21 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.