如何评价语言模型是个非常重要的问题,今天,Google发布语言模型评价新基准BIG-bench,204个任务全面评价语言模型能力,旨在超越图灵测试,更加准确地实现语言模型落地。
论文地址:https://arxiv.org/abs/2206.04615
项目地址:https://github.com/google/BIG-bench/#creating-a-programmatic-task
内容中包含的图片若涉及版权问题,请及时与我们联系删除
如何评价语言模型是个非常重要的问题,今天,Google发布语言模型评价新基准BIG-bench,204个任务全面评价语言模型能力,旨在超越图灵测试,更加准确地实现语言模型落地。
论文地址:https://arxiv.org/abs/2206.04615
项目地址:https://github.com/google/BIG-bench/#creating-a-programmatic-task
内容中包含的图片若涉及版权问题,请及时与我们联系删除
沙发等你来抢
评论
沙发等你来抢