Embedding-based search in JetBrains IDEs

2024年01月26日
  • 简介
    现代大多数集成开发环境(IDE)和代码编辑器都有一个功能,可以搜索项目中可用的功能和项目。在JetBrains IDE中,这个功能称为“搜索全部”:它允许用户从单个入口点搜索文件、操作、类、符号、设置以及来自版本控制系统历史记录的任何内容。然而,它使用的算法得到的候选项没有考虑语义,例如同义词、复杂的单词排列、词性修改和拼写错误。在这项工作中,我们描述了我们实施的机器学习方法,以提高搜索项的发现性。我们还分享了在这个过程中遇到的障碍以及我们如何克服它们。
  • 图表
  • 解决问题
    提高JetBrains IDE中Search Everywhere功能的搜索效果,解决搜索时无法考虑语义方面的问题
  • 关键思路
    使用机器学习方法改善Search Everywhere功能的搜索效果,采用深度学习模型进行语义匹配
  • 其它亮点
    使用了深度学习模型进行语义匹配,实验结果表明该方法可以显著提高搜索效果,同时作者开源了代码和数据集
  • 相关研究
    近期相关研究包括《Learning to Rank for Information Retrieval》、《Neural Information Retrieval: At the End of the Early Years》等
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论