每周编辑精选｜免费使用 Sora 平替、在线运行 Python 基础教程、MCFEND 中国假新闻检测数据集上线

继 ChatGPT 后，OpenAI 又发布了爆炸级产品——Sora 文生视频模型，当其他模型还在努力突破几秒内的连贯性问题时，Sora 已经将视频时长拉到了 60s。不过，目前 Sora 模型仅对小部分研究人员和创意人士开放访问权限。

别担心，HyperAI超神经为大家提供了开源 AI 生成视频方案：Stable Diffusion + Prompt Travel + AnimateDiff 组合，一键启动，免费使用！1 秒享受视觉盛宴，Sora 开源平替等你来！现已在 hyper.ai 官网提供在线运行教程，快来体验！

3 月 25 日-3 月 29 日，hyper.ai 官网更新速览：

* 优质公共数据集：10 个

* 优质教程精选：2 个

* 社区文章精选：4 篇

* 热门百科词条：5 条

访问官网：hyper.ai

公共数据集精选

1. MCFEND 中国假新闻检测的多源基准数据集

MCFEND 数据集是香港浸会大学、香港中文大学等机构联合构建的一个多源中文虚假新闻检测基准数据集。该数据集收集了来自社交平台、即时通讯应用和传统在线新闻媒体等多样化来源的新闻，共计 23,974 条，均经过 14 家国际权威事实核查机构的核实。

直接使用：

https://my5353.com/30429

2. Fin-Eva Version 1.0 金融领域中文语言专业数据评测集

Fin-Eva Version 1.0 数据集是由蚂蚁集团、上海财经大学联合推出的金融领域评测集。覆盖财富管理、保险、投资研究等多个金融场景以及推出金融专业主题学科，总评测题数目超过 1.3w。

直接使用：

https://my5353.com/30472

3. VidProM ⼤规模⽂本到视频提示数据集

VidProM 数据集是由悉尼科技大学与浙江大学联合研发的首个大规模真实用户文本到视频提示数据集，包含 167 万个独特的文本到视频提示和 669 万个由四种最先进的扩散模型生成的视频。

直接使用：

https://my5353.com/30372

4. FindingEmo 图像情感识别数据集

FindingEmo 是由鲁汶大学等机构构建的全新图像数据集，专门用于情感识别任务。该数据集包含了 25,000 张图片的注释。

直接使用：

https://my5353.com/30470

5. GPD 人群流量和交通速度数据集

清华大学电子工程系城市科学与计算研究中心最新成果「Spatio-Temporal Few-Shot Learning via Diffusive Neural Network Generation」被 ICLR2024 接收，该研究提出 GPD (Generative Pre-Trained Diffusion) 模型，实现数据稀疏场景下的时空学习。该数据集为论文的开源数据及代码。

直接使用：

https://my5353.com/30453

6. AlgoPuzzleVQA 多模态算法谜题数据集

AlgoPuzzleVQA 数据集是由新加坡科技设计大学构建的一个多模态推理数据集，旨在挑战和评估多模态语言模型在解决需要视觉理解、语言理解和复杂算法推理的算法谜题方面的能力。

直接使用：

https://my5353.com/30402

7. UltraSafety 大模型安全评价数据集

UltraSafety 数据集由人民大学、清华大学和腾讯联合创建，旨在评估和提升大模型安全性。该数据集是从 AdvBench 和 MaliciousInstruct 导出 1,000 条安全种子指令，并使用 Self-Instruct 引导另外 2,000 条指令。

直接使用：

https://my5353.com/30468

8. NAIP-S2 美国超分遥感数据集

NAIP-S2 是艾伦人工智能研究所发布的一个超分辨率遥感数据集，包含了美国大陆地区的 NAIP 和 Sentinel-2 成对影像。该数据集在遥感科学领域具有广泛应用，特别是在地表监测、资源管理和环境变化评估等方面，提供了高精度的数据支持。

直接使用：

https://my5353.com/30427

9. CLIcK 韩语文化与语言智能数据集

CLIcK 数据集由韩国科学技术院创建，旨在填补韩语大模型在文化与语言知识评估方面的空白。该数据集包含 1,995 对问答样本，源自官方韩国考试与教科书，覆盖语言和文化两大类，细分为 11 个子类别，每个样本都提供了细粒度的注释，指明回答问题所需的文化和语言知识。

直接使用：

https://my5353.com/30378

10. TacticAI 研究使用的相关数据

该数据集为「TacticAI：足球战术人工智能助手」研究中收集的相关数据。

直接使用：

https://my5353.com/30375

更多公共数据集，请访问：

https://hyper.ai/datasets

公共教程精选

1. 在 Python 中生成随机数字

真正的随机数在计算机中难以实现，因为计算机只能执行指定操作。伪随机性是可能的，可以通过程序模拟。该教程将逐步演示如何在 Python 中生成随机数字。

在线运行：

https://my5353.com/t30444

2. 使用 PyTorch 逐步开发神经网络

PyTorch 是一个强大的 Python 库，用于构建深度学习模型，简化了定义、训练和推理神经网络的过程。本教程将介绍如何加载 CSV 数据集，定义多层感知器模型，并在 PyTorch 中进行训练和评估，为创建深度学习神经网络模型提供指导。

在线运行：

https://my5353.com/t30446

社区文章精选

1. 在线教程 | 一键启动 Sora 开源平替，俘获 45 万 AI 开发者

该教程为开源 AI 生成视频方案 Stable Diffusion + Prompt Travel + AnimateDiff 组合，可供大家免费使用。一键启动 Sora 开源平替，1 秒即可享受视觉盛宴。

在线运行：

https://my5353.com/n30387

2. 全面挖掘天然药物的药效成分，中南大学刘韶教授团队构建 IMN4NPD 平台

中南大学湘雅医院药学部刘韶教授团队建立了一种可全面挖掘天然药物药效成分的整合分子网络框架 (IMN4NPD)，不仅加快了分子网络中广泛集群的去复制 (dereplication)，而且对现有研究方法中经常被忽略的自循环与成对节点提供标注。相关成果已发表于「Bioinformatics」期刊。

查看完整报道：

https://my5353.com/n30363

3. 老药新用，中南大学团队发布 AdaDR，基于自适应图卷积网络进行药物重定位

来自中南大学的研究人员提出了一种名为 AdaDR 的方法，通过深度集成节点特征和拓扑结构来进行药物重定位，并基于自适应图卷积操作来模拟它们之间的交互信息，增强了模型的表达能力。相关论文已发表于「American Chemical Society」。

查看完整报道：

https://my5353.com/n30434

4. AI 成足球比赛「关键先生」：DeepMind 发布 TacticAI，战术布局实用性高达 90%

角球往往是执行教练战术的绝佳机会，针对于此，谷歌 DeepMind 与利物浦足球俱乐部联合推出 TacticAI，通过使用几何深度学习方法，借助预测与生成模型，为专业人士提供角球战术层面的见解。研究结果表示，TacticAI 提出的战术布局在 90% 的情况下都会受到人类专家评估者的青睐。接球预测准确率高达 74%，射门机会提升 13%。相关成果已发表于「nature」期刊。

查看完整报道：

https://my5353.com/n30454

热门百科词条精选

1. 配对 t 检验 Paired t-Test

2. 表示学习 Representation learning

3. 旋转位置编码 RoPE

4. 认知搜索 Cognitive Search

5. 基于案例的推理 CBR

这里汇编了数百条 AI 相关词条，让你在这里读懂「人工智能」：

https://hyper.ai/wiki

B 站直播预告

日期	时间	内容
4 月 1 日星期一	10:00	哈佛 CS50 课程 (2023)
4 月 2 日星期二	10:00	哈佛 CS50 课程 (2022)
4 月 3 日星期三	10:00	MIT 深度学习课程
4 月 4 日星期四	10:00	英伟达历年发布会
4 月 5 日星期五	10:00 18:00	机器学习编译课程特斯拉 AI 日
4 月 6 日星期六	10:00	谷歌历年 I-O 发布会
4 月 7 日星期日	10:00	斯坦福 HAI 研讨会

超神经电视台 7×24h 不间断直播，点击即可收获 AI 领域的「电子榨菜」：

http://live.bilibili.com/26483094

以上就是本周编辑精选的全部内容，如果你有想要收录 hyper.ai 官方网站的资源，也欢迎留言或投稿告诉我们哦！

下周再见！

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区，致力于成为国内数据科学领域的基础设施，为国内开发者提供丰富、优质的公共资源，截至目前已经：

* 为 1200+ 公开数据集提供国内加速下载节点

* 收录 300+ 经典及流行在线教程

* 解读 100+ AI4Science 论文案例

* 支持 500+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅：

https://hyper.ai/

内容中包含的图片若涉及版权问题，请及时与我们联系删除

每周编辑精选｜免费使用 Sora 平替、在线运行 Python 基础教程、MCFEND 中国假新闻检测数据集上线

评论列表

评论