- 简介搜索引擎的过程对于文档内容的检索至关重要。对于高棉文档,需要一种有效的工具来提取关键词并促进准确的搜索。尽管每天产生大量的高棉内容,但由于缺乏有效的语义搜索工具,柬埔寨人民仍然难以找到必要的文档。即使是谷歌也不能为高棉内容提供高精度的搜索结果。语义搜索引擎通过采用先进的算法来理解各种内容类型,从而提高搜索结果的准确性。随着高棉数字内容如报告、文章和社交媒体反馈的增加,增强搜索能力变得至关重要。本研究提出了第一个高棉语义搜索引擎(KSE),旨在增强传统的高棉搜索方法。利用语义匹配技术和形式化注释的语义内容,我们的工具从用户查询中提取有意义的关键词,执行精确匹配,并提供最佳匹配的离线文档和在线URL。我们提出了三个语义搜索框架:基于关键词词典的语义搜索、基于本体的语义搜索和基于排名的语义搜索。此外,我们开发了数据准备工具,包括文档添加和手动关键词提取。为了评估性能,我们创建了一个基准数据集,并解决了与搜索和语义搜索相关的问题。我们的研究结果表明,理解搜索术语的语义可以显著提高搜索结果的准确性。
-
- 图表
- 解决问题设计一种能够提高柬埔寨文档检索准确性的语义搜索引擎,解决当前柬埔寨数字内容检索困难的问题。
- 关键思路通过语义匹配技术和正式注释的语义内容,提取用户查询中的有意义的关键词,进行精确匹配,并提供最佳匹配的离线文档和在线URL。提出了三种语义搜索框架:基于关键词字典的语义搜索、基于本体的语义搜索和基于排名的语义搜索。
- 其它亮点论文开发了数据准备工具,包括文档添加和手动关键词提取,并创建了一个基准数据集以评估性能。研究结果表明,理解搜索词语义可以显著提高搜索结果的准确性。
- 近期的相关研究包括:1.《基于本体的柬埔寨语语音识别》;2.《基于深度学习的柬埔寨语言情分析》;3.《使用机器学习技术进行柬埔寨语音频分类》。
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流