Scopus、Dimensions和Web of Science正在引入对话式人工智能搜索
8月1日,荷兰出版巨头爱思唯尔为其Scopus数据库的一些用户发布了一个由ChatGPT驱动的人工智能接口,而英国公司Digital Science宣布为其Dimensions数据库提供人工智能大型语言模型(LLM)助手的闭门试验。与此同时,美国公司Clarivate表示,它也在努力将大模型引入其Web of Science数据库。
用于科学搜索的大模型并不新鲜:Elicit、Scite和Consensus等初创公司已经拥有这样的人工智能系统,这些系统有助于总结一个领域的发现或确定顶级研究,依靠免费的科学数据库或(在Scite的情况下)通过与出版商合作访问付费墙的研究文章。但拥有大型科学摘要和参考资料专有数据库的公司现在正加入人工智能热潮。
监督该工具开发的Elsevier伦敦高管Maxim Khan说,爱思唯尔的聊天机器人名为Scopus AI,作为试点推出,旨在作为一个轻松、有趣的工具,帮助研究人员快速获得他们不熟悉的研究主题的摘要。为了回答自然语言问题,机器人使用LLM GPT-3.5版本返回有关研究主题的流畅摘要段落,以及引用的参考资料和进一步的问题进行探索。
对用于搜索的大模型(特别是科学搜索)的一个担忧是它们不可靠。LLM不理解他们产生的文本;他们只是通过吐出风格上合理的单词来工作。他们的输出可能包含事实错误和偏见,正如学者们很快发现的那样,可以构成不存在的参考资料。
因此,Scopus AI受到限制:仅通过参考五到十份研究摘要来提示它生成答案。Khan解释说,人工智能本身找不到这些摘要:相反,在用户键入查询后,传统的搜索引擎会返回与问题相关的摘要。
虚假事实
新加坡管理大学图书馆员Aaron Tay指出,许多其他人工智能搜索引擎系统也采用了类似的策略,他遵循人工智能搜索工具。这有时被称为检索增强生成,因为LLM仅限于总结另一个搜索引擎检索的相关信息。Tay说:“大模型仍然偶尔会产生幻觉或编造事情,”他指出了对互联网搜索AI聊天机器人的研究,如Bing和Perplexity,这些机器人使用类似的技术。
爱思唯尔将其人工智能产品仅限于搜索自2018年以来发表的文章,以便获取最近的论文,并指示其聊天机器人在其回复中适当引用返回的摘要,以避免不安全或恶意查询,并说明其收到的摘要中是否有相关信息。这不能避免错误,但会将错误最小化。爱思唯尔还通过为机器人的“温度”选择一个低设置来降低其人工智能的不可预测性——这是衡量它在回应中选择偏离最合理词语的频率。
用户是否可以简单地将机器人的段落复制并粘贴到自己的文件中,有效地抄袭该工具?Khan说,这是一种可能性。他说,到目前为止,爱思唯尔已经通过指导来解决这个问题,该指导要求研究人员负责任地使用摘要。Khan指出,资助者和出版商也发布了类似的指南,要求透明地披露LLM是否用于,例如,撰写论文或进行同行评审,或者在某些情况下声明根本不应该使用LLM。
目前,该工具仅向大约15,000名用户推出,这些用户是Scopus订阅者的子集,其他研究人员如果想尝试的话,可以联系爱思唯尔。该公司表示,预计将在2024年初全面推出。
同样在8月1日,数字科学宣布将为其大型Dimensions科学数据库引入人工智能助理,目前仅适用于选定的beta测试人员。与Scopus AI一样,在用户输入问题后,搜索引擎首先检索相关文章,然后Open AI GPT模型围绕已检索的排名靠前的摘要生成摘要段落。
该公司首席产品官Christian Herzog说:“这非常相似,足够有趣。”(数字科学是Holtzbrinck出版集团的一部分,Holtzbrinck出版集团是Nature出版商Springer Nature的大股东。)
Dimensions还使用LLM提供有关论文的更多细节,包括其调查结果的简短改述摘要。
Herzog表示,该公司希望在年底前更广泛地发布其工具,但目前正与科学家、资助者和其他使用Dimensions来测试LLM可能有用的地方的人合作——这仍有待观察。他说:“这是关于逐渐放松到新技术并建立信任。”
Tay说,他期待着在论文全文上使用大模型的工具,而不仅仅是摘要。他指出,Elicit等网站已经允许用户使用LLM来回答有关论文全文的详细问题——当机器人可以访问它时,就像一些开放访问的文章一样。
与此同时,在Clarivate,该公司所谓的“学术和政府部门”总裁Bar Veinstein表示,该公司正在“致力于在Web of Science中添加LLM驱动的搜索”,指的是与总部位于以色列特拉维夫的AI21实验室签署的战略伙伴关系,该公司于6月宣布。然而,Veinstein没有给出发布基于大模型的Web of Science工具的时间表。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢