发布于 

利用深度神经网络改进软件缺陷特定命名实体识别

  • 论文下载地址: 下载链接
  • 作者: Cheng Zhou, Bin Li, Xiaobing Sun
  • 学校: 扬州大学信息工程学院
  • 发表: The Journal of Systems and Software
  • 发表年份: 2019年
  • 关键词: Software bug analysis ,Named entity recognition,Software bug corpus

摘要

本研究旨在改进软件缺陷特定命名实体识别的方法。传统方法主要使用线性统计模型,如SVM、HMM和CRF,来提取命名实体信息,但它们忽略了软件缺陷报告的结构和语义信息,导致提取的准确性不高。为了解决这一问题,本文提出了一种基于深度神经网络的方法,使用BiLSTM-CRF模型,并引入了注意机制。通过实验验证,该方法在软件缺陷报告上取得了良好的性能,证明了其有效性。这一研究有望提高软件缺陷报告信息提取的准确性和效率。

创新点与借鉴点

  1. 引入深度神经网络:采用了基于深度学习的BiLSTM-CRF模型,相对于传统的线性统计模型,这是一个重大的创新。
  2. 结合了注意机制:通过引入注意机制,提高了命名实体识别的准确性,有效地捕捉文本中的命名实体信息。
  3. 针对软件缺陷特定实体的识别:专注于软件缺陷报告中特定实体的识别,解决了现有方法在这方面的局限性。

总结

  • (1): 这篇论文的研究背景是软件缺陷报告的信息提取,特别是命名实体的识别。软件缺陷报告包含了大量的信息,但传统方法在从中提取有关命名实体的信息方面存在限制。
  • (2): 过去的方法主要使用线性统计模型如SVM、HMM和CRF来进行命名实体识别,但这些方法忽略了软件缺陷报告的结构和语义信息,导致提取的准确性有限。因此,本文提出了一种基于深度神经网络的方法来改进软件缺陷特定命名实体识别,以提高准确性和性能。
  • (3): 论文提出的研究方法是使用注意机制的BiLSTM-CRF模型,用于命名实体识别。该模型结合了深度学习和条件随机场,能够更好地捕捉文本中的命名实体信息,并提高了识别的准确性。
  • (4): 论文在软件缺陷报告上进行了命名实体识别任务的实验,并通过交叉验证等方法进行了性能评估。通过实验,他们取得了良好的性能,证明了提出方法的有效性。