通过跟老刘说nlp公众号文章进行互动,追踪大模型以及知识图谱融合前沿,每日分享前沿论文进展以及开源项目,同步相关开源技术资料,社区问答互动等不同形式的线上交流,力图从原理根本上解决问题,培养一批更落地的人。
1、RAG检索增强落地都如何进行评估?包括RAGAS等;2、ToolAGENT如何进行训练,微调数据在哪儿?3、RAG如何组合多策略召回模型,缓解幻觉的策略有哪些?4、如何构造及评估SFT微调数据集?不同组合配比的影响?6、知识图谱与事理图谱中的数据处理及开源数据?7、知识图谱与大模型如何进行融合?8、关于大模型落地目前有哪些有趣应用?9、目前大模型研发有哪些研发实践分享,例如chatglm2-6b,chatglm3-6b?本月初,10月份社区分享材料已汇总完毕,共有43个有效分享资料。值得读的几个工作:100个有意思的大模型AI应用、大模型技术白皮书、AIGC产业链。以及用于因果事理图谱构建的标注数据集:
11月份,我们将聚焦在长文本研发,包括长文本如何进行评估,长文本数据如何构造?微调数据集在不同模型下的构造组织细节、大模型与实际场景的结合等更贴合细节的主流话题。未来我们将进一步通过老刘说NLP技术公众号、开源项目、前沿论文、产品观点等四个方面的并行,进行更为深入和持续的话题讨论,欢迎更多社区朋友加入共同建设,一同学习与进步。一、会员群介绍与入群公告
一、关于老刘说NLP技术会员群
为了营造高质量的垂直技术社区,老刘说NLP技术会员群已经开通几个月,目前已经陆续有一些同学加入进来,社区的形式多样:
1、每日论文前沿与开源项目、话题讨论
2、技术前沿资料共享
因此,我们也记录了整个成长的路径,将积累的线上交流、文章、开源报告都保存至网盘中:
1)不定时线上交流报告分享
过去,我们成功地举行了8次线上技术社区交流活动,包括知识图谱的构建与情报分析应用、kBQA、行业微调大模型等多个方面:
评论
沙发等你来抢