发布于 

使用词嵌入和增强型卷积神经网络提高bug定位

  • 论文下载地址: 下载链接
  • 作者: Yan Xiao, Jacky Keung, Kwabena E. Bennin, Qing Mi
  • 学校: 香港城市大学计算机科学系
  • 发表: Information and Software Technology
  • 发表年份: 2019年
  • 关键词: Bug localization, Convolutional neural network, Word embedding, TF-IDF, Deep learning, Semantic information

摘要

在软件维护的背景下,自动化Bug定位是提高软件质量保证团队效率和生产力的重要任务。本文探讨了如何改进Bug定位性能,特别关注了传统方法中未充分利用的语义信息。我们引入了词嵌入技术,将Bug报告和源代码转化为向量表示,并采用增强型卷积神经网络来提取特征,以更好地捕捉语义关联。通过在不同设置下对模型性能进行评估,我们的实验结果表明,这种方法在Bug定位任务中取得了显著的改进,为提高软件维护效率和生产力提供了有力支持。

创新点与借鉴点

  1. 引入词嵌入技术: 本文的创新之一是引入了词嵌入技术,将Bug报告和源代码转化为向量表示。这种方法允许文章捕捉文本之间的语义关系,而不仅仅是表面的文本相似性。
  2. 增强型卷积神经网络: 作者使用了增强型卷积神经网络(CNN)来提取Bug报告和源代码的特征,并关联它们。这个增强型CNN考虑了线性和非线性关系,这在传统方法中通常被忽略。
  3. 性能改进: 实验结果表明,这种方法在Bug定位任务中取得了显著的性能改进。这意味着作者的方法可以更准确地定位软件中的缺陷,从而提高了软件维护的效率和生产力。

总结

  • (1): 本文研究背景是提高Bug定位的自动化,以提高软件质量保证团队的效率和生产力。该任务是在软件维护中找到和修复Bug,特别是在大型项目中,这涉及查看大量的源代码文件和Bug报告。
  • (2): 过去的方法通常侧重于分析Bug报告和源代码中的文本相似性,但忽略了语义信息。这些方法的问题在于它们未能充分利用语义信息,导致性能不佳。本文的方法受到深度学习技术的启发,采用词嵌入和增强型卷积神经网络来提取语义特征,以解决这些问题。
  • (3): 本文提出的方法使用词嵌入技术将Bug报告和源代码转化为向量表示,然后使用卷积神经网络(CNN)来提取特征。增强型CNN用于关联Bug报告和有缺陷的文件,包括线性和非线性关系。
  • (4): 本文方法的性能在不同设置下进行了评估,实验结果表明,与传统方法相比,它在Bug定位任务中取得了更好的性能,支持了提高软件维护效率和生产力的目标。