【杉达大讲堂】第13期:从文字嵌入到文档相似性对软件中的信息检索的改进

发布时间:2016-05-10浏览次数:69

讲座主题:从文字嵌入到文档相似性对软件中的信息检索的改进

时 间:2016年5月13日(周五)13:00-14:00

地 点:3号楼205室

主讲人:刘 畅 博士(俄亥俄大学)

主讲人简介:

  2006年10月至今 主任,VITAL(虚拟仿真技术和艺术)实验室,俄亥俄大学

  2004年5月至今 副主任, 智能中心、分布式和结合式的系统,俄亥俄大学

  2002年8月至今 副教授,电子工程与计算机学院,俄亥俄大学

  2002年 博士,信息与计算机科学,美国加利福尼亚大学

  1994年 硕士,计算机科学,复旦大学

  1991年 学士,计算机科学,复旦大学

主要内容:

  由于查询词条(通常表述为自然语言,如英语)和检索到的文档(通常表述为代码,如程序语言)之间的词汇空缺现象,使得在软件工程中应用信息检索技术查询任务 变得困难。在软件项目中,错误和特征定位、群体问答、或者更普遍的技术人员和非技术的利益相关者之间的交流往往就会遇到这种情况。在这篇论文中,我们提出 在一个共享的表述空间中,用一个平均矢量来搭建自然语言表述和代码片段之间词汇空缺的桥梁。在提出的架构中,为了评估文档之间语义的相似性,在API文档、教程和参考文档中,单词嵌入被训练并且进行汇总。经验评价显示,习得的矢量空间嵌入改进了先前开发的错误定位任务和最新的链接API文档到电脑程序问题的任务。

本演讲内容本年度在ICSE获奖http://2016.icse.cs.txstate.edu/program/awards

主 办:信息科学与技术学院

欢迎师生前去聆听!