抗体是当前蛋白质治疗药物中的主力军,全球已有超过 160 种抗体药物获批上市,预计未来 5 年市场规模将高达 4,450 亿美元。尽管抗体药物备受学界与产业界的青睐,但治疗性抗体的开发仍主要依靠动物免疫或从大型抗体库中筛选候选分子。这些方法不仅耗时费力,而且往往难以根据靶点上的特定表位,精准地设计出与之匹配的全新抗体。

基于此,David Baker 团队发布新一代抗体和纳米抗体设计工具 RFantibody,基于 RFdiffusion 进行了精细优化,旨在为科研人员和生物技术工程师提供一种高效的从头设计方法。该工具的核心是利用深度学习生成抗体结构(尤其是 CDR 区域),然后通过 ProteinMPNN 设计序列,再用 RF2 (RoseTTAFold2)验证其是否折叠为预期结构。

作为一种高效的蛋白质设计工具,RFantibody 广泛应用于生物医学研究、药物开发以及疫苗设计等领域,为生物医学研究提供了全新工具。

目前,HyperAI超神经官网已上线了「RFantibody:抗体和纳米抗体设计工具」,快来试试吧~

在线使用:https://go.hyper.ai/sO07A

9 月 15 日-9 月 19 日,hyper.ai 官网更新速览:

* 优质公共数据集:10 个

* 优质教程精选:7 个

* 本周论文推荐:  5 篇

* 社区文章解读:5 篇

* 热门百科词条:5 条

* 9 月截稿顶会:1 个

访问官网:hyper.ai

公共数据集精选

1. ConstructionSite 建筑工地图像数据集

ConstructionSite 是一个面向建筑工地场景的多模态基准数据集,旨在评估与提升视觉 – 语言模型在施工安全环境下的图像理解与推理能力。该数据集具有场景复杂、标注多样、贴近实际施工安全检查的特点,适用于图像描述、视觉问答、目标检测、视觉定位和多模态推理等任务。

直接使用:https://go.hyper.ai/ZRy12

2. HTSC-2025 常压高温超导体基准数据集

HTSC-2025 是一个针对常压高温超导体临界温度预测的基准数据集,旨在为模型提供标准化、可比性强的测试样本,以促进超导体预测任务的进步与验证。该数据集共包含约 140 个材料,以 JSON/Parquet 格式存储,便于处理。

直接使用:https://go.hyper.ai/G2bJB

3. VisualOverload 场景图像理解数据集

VisualOverload 是一个场景图像理解评测数据集,旨在考察模型在不依赖外部知识的情况下,对复杂场景中细节的视觉理解与推理能力。该数据集包含 2,720 条问答对,由公共领域的高分辨率画作构成,这些画作往往包含多个人物、动作、子情节以及复杂的背景。

直接使用:https://go.hyper.ai/Acce1

数据集示例

 

4. WebExplorer-QA 信息检索问答数据集

WebExplorer-QA 是一个针对信息检索与网络浏览任务的数据集,旨在通过系统化生成具有挑战性的查询 – 答案对,提升模型在复杂多步推理与长程网页导航中的表现。适用于训练与评估网络代理或大语言模型在信息搜寻、多跳/复杂上下文推理、长上下文提示处理,以及工具调用与网页导航的能力。

直接使用:https://go.hyper.ai/I58Ry

5. AnonyRAG 经典小说问答数据集

AnonyRAG 是由是由腾讯优图实验室、莫纳什大学以及香港理工大学发布的一个实体匿名化任务的问答数据集,旨在评估检索增强生成(RAG)系统在实体被匿名时,模型是否依赖检索得到证据。

直接使用:https://go.hyper.ai/jzqD9

6. RxnBench 有机化学问答数据集

RxnBench 是一个多模态化学反应图像理解的视觉问答数据集,旨在评估视觉语言模型在化学反应图像理解、多模态推理、科学问答等任务上的能力。该数据集包含 1,525 道有机化学反应理解的多项选择题,提供中英文两个版本。

直接使用:https://go.hyper.ai/Utkdo

7. SceneSplat-7K 室内场景 3D 渲染数据集

SceneSplat-7 是目前规模最大、质量最高的室内场景 3D 高斯点渲染(3D Gaussian Splats, 3DGS)数据集,旨在推动视觉 – 语言预训练模型在真实室内 3D 场景上的理解与语义推理能力。

直接使用:https://go.hyper.ai/HISAa

8SSTQA 半结构表格问答数据集

SSTQA 是由上海交通大学联合 Simon Fraser University 、清华大学等机构发布的一个用于半结构化表格问答任务的基准数据集,旨在检验大型语言模型与表格问答系统在面对真实表格中复杂布局(如合并单元格、层级表头、多级嵌套等)时的理解与回答能力。

直接使用:https://go.hyper.ai/JoZyB

9. OmniSpatial 全景空间推理基准数据集

OmniSpatial 是一个全景空间推理基准数据集,旨在填补视觉 – 语言模型空间理解评测的空白。该数据集适用于训练与评测多模态大模型的空间推理能力,特别是在智能导航、增强/虚拟现实以及复杂场景理解等应用中,是一个全面而具有挑战性的标准化基准数据集。

直接使用:https://go.hyper.ai/a6ep8

10. Urban Issues 城市问题图像数据集

Urban Issues 是一个公共图像分类数据集,旨在帮助自动化与机器视觉系统识别城市环境中的公共基础设施问题与环境问题。该数据集中的图像按类别存储,每张图像均带有单一类别标签,且背景、光照、角度条件多样。

直接使用:https://go.hyper.ai/2id2J

数据集示例

 

公共教程精选

1. HiDream-E1.1:指令式图片编辑器

HiDream-E1.1 模型是由智象未来发布的开源图像编辑模型,基于自研的 Sparse Diffusion Transformer 架构,支持百万像素级分辨率,采用 MIT 开源协议。该模型实现了「所说即所改」的自然语言图像编辑功能,用户无需专业软件操作技能,通过简单语言指令即可完成色彩调整、风格迁移、元素增减等复杂任务。

在线运行:https://go.hyper.ai/P9C3R

效果展示

 

2. RFantibody:抗体和纳米抗体设计工具

RFdiffusion2 是由 David Baker 团队发布的抗体和纳米抗体设计工具,旨在为科研人员和生物技术工程师提供一种高效的从头设计方法。该工具的核心是利用深度学习技术,通过结构信息来预测和设计抗体的三维结构和氨基酸序列,从而开发出针对特定靶点的定制化抗体。

在线运行:https://go.hyper.ai/sO07A

3. FastVLM:极速视觉语言模型

FastVLM 是由 Apple 团队推出的高效的视觉语言模型(VLM),能提升高分辨率图像处理的效率和性能。模型引入 FastViTHD 新型混合视觉编码器,有效减少视觉 token 数量,显著降低编码时间。

在线运行:https://go.hyper.ai/xg8wa

效果展示

 

4. SEED-X-PPO-7B:强化学习优化的多语言翻译模型

SEED-X-PPO-7B 是由字节跳动 Seed 团队发布的新一代多语言翻译大模型,基于近端策略优化(PPO)强化学习算法迭代优化,核心目标是解决跨语言场景下的「高精度语义传递」需求。该模型突破了传统翻译模型在小语种适配、文化语境还原、长文本连贯性上的局限,支持中文、英语、德语等 28 种主流语言互译。

在线运行:https://go.hyper.ai/aw5oS

效果展示

 

5. SRPO:图像生成告别 AI 味!

SRPO 是由腾讯混元团队、香港中文大学(深圳)理学院、清华大学深圳国际研究生院共同推出的文本到图像生成模型,通过将奖励信号设计为文本条件信号,实现对奖励的在线调整,减少对离线奖励微调的依赖。

在线运行:https://go.hyper.ai/8OQxS

效果展示

 

6. ERNIE-4.5-21B-A3B-Thinking:轻量化模型推理能力再升级

ERNIE-4.5-21B-A3B-Thinking 是由百度文心一言团队的发布「思考版」轻量级推理模型。 该模型采用了混合专家(MoE)架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。

在线运行:https://go.hyper.ai/bQmlo

效果展示

 

7. RFdiffusion2:蛋白质设计工具

RFdiffusion2 是由华盛顿大学蛋白质设计研究所发布的深度学习蛋白质设计模型。该模型不仅能够根据简单的化学反应描述,生成具有定制活性位点的酶骨架,还极大地突破了以往设计催化剂的技术瓶颈,为塑料降解等重大应用提供了强有力的技术支持。

在线运行:https://go.hyper.ai/9YInD

💡我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们扫码备注【SD教程】,入群探讨各类技术问题、分享应用效果~

本周论文推荐

1. OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling

本文提出了 OmniWorld ——一个大规模、多领域、多模态的数据集,专为四维世界建模而设计。该数据集由新采集的 OmniWorld-Game 数据集以及若干经过筛选的公共数据集构成,覆盖多种应用场景。

论文链接:https://go.hyper.ai/SbW2Y

2. WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

本文提出了一种新颖的双代理框架 WebWeaver,旨在模拟人类的研究过程。规划代理以动态循环方式运行,通过迭代地交织证据获取与大纲优化,生成一个全面且基于来源的结构化大纲,并与一个证据记忆库相连接。随后,写作代理执行分层检索与撰写流程,逐部分完成报告的构建。

论文链接:https://go.hyper.ai/lqMvM

3. Scaling Agents via Continual Pre-training

本文首次提出将智能体持续预训练(Agentic Continual Pre-training, Agentic CPT)引入深度研究智能体的训练流程,以构建强大的智能体基础模型。基于该方法,研究人员开发出一款深度研究智能体模型——AgentFounder。

论文链接:https://go.hyper.ai/6lyWG

4. WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning

本文提出了一种完整的后训练方法论 WebSailor,通过结构化采样与信息模糊化生成新型高不确定性任务,采用RFT冷启动策略,并结合一种高效的智能体强化学习训练算法——重复采样策略优化(DUPO)。通过这一集成化流程,WebSailor在复杂信息检索任务中显著超越所有现有开源智能体,性能逼近专有智能体水平,有效缩小了能力差距。

论文链接:https://go.hyper.ai/biWLb

5. Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale

本文提出 Hala,一个以阿拉伯语为核心的指令模型与翻译模型系列,其构建基于研究人员自主研发的「翻译-微调」流水线。在面向阿拉伯语的核心基准测试中,Hala 在「纳米」(≤20 亿参数)和「小规模」(70 亿–90 亿参数)两个类别中均取得了当前最优性能,显著优于其基础模型。

论文链接:https://go.hyper.ai/KI73S

更多 AI 前沿论文:https://go.hyper.ai/iSYSZ

社区文章解读

1. IJCAI 2025 丨 7 个数据集验证:scSiameseClu 在无监督单细胞聚类任务中达到 SOTA 性能

来自中国科学院、东北农业大学、澳门大学与吉林大学的研究团队联合提出了一种用于解读单细胞 RNA-seq 数据的新型孪生聚类框架  scSiameseClu,能够有效缓解表征坍塌问题,实现更清晰的细胞群体分类,为 scRNA-seq 数据的分析提供了强大的工具。

查看完整报道:https://go.hyper.ai/hyDFA

2. 在线教程丨ACL机器翻译大赛30个语种摘冠,腾讯Hunyuan-MT-7B支持33种语言翻译

腾讯混元团队于 2025 年 9 月发布轻量级翻译模型 Hunyuan-MT-7B,支持 33 种语种及 5 种民汉语言/方言互译,以仅 70 亿的参数量实现高效精准的翻译。在国际计算语言协会(ACL)WMT2025 比赛中,该模型拿下了 31 种语言比赛中 30 项的冠军,表现可谓令人赞叹。

查看完整报道:https://go.hyper.ai/y2X2L

3. 准确度提升400%!印度季风预测模型基于36个气象站点,实现城区尺度精细预报

近年来,孟买极端降雨频率与强度显著上升,而传统全球预报系统因分辨率不足难以捕捉局地天气特征。为此,印度理工学院孟买分校与马里兰大学合作,开发了基于卷积神经网络与迁移学习的预测模型,实现了对极端降雨事件的提前预报。

查看完整报道:https://go.hyper.ai/wYsSk

4. 训练成本29.4万美元,DeepSeek-R1登Nature封面,首个通过权威期刊同行评审的主流大模型获好评

DeepSeek-R1 的相关研究成果登上 Nature 封面,这一消息迅速在全球学术领域引发热烈讨论。本次公开于 Nature 的意义在于其通过这一权威期刊接受了同行评审。

查看完整报道:https://go.hyper.ai/B12hL

5. 谷歌DeepMind冲击千禧年大奖新进展,利用AI方法在3个流体方程中发现新的不稳定奇点

谷歌 DeepMind 联合纽约大学、斯坦福大学、布朗大学等机构的研究人员,基于机器学习框架以及高精度的高斯-牛顿优化器,在 3 个不同的流体方程中首次系统地发现了新的不稳定奇点,并揭示出一条简洁的经验渐近公式,将爆破速率与不稳定阶数联系起来。

查看完整报道:https://go.hyper.ai/hq5og

热门百科词条精选

1. DALL-E

2. 倒数排序融合 RRF

3. 帕累托前沿 Pareto Front

4. 大规模多任务语言理解 MMLU

5. 对比学习 Contrastive Learning

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

* 为 1800+ 公开数据集提供国内加速下载节点

* 收录 600+ 经典及流行在线教程

* 解读 200+ AI4Science 论文案例

* 支持 600+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai

内容中包含的图片若涉及版权问题,请及时与我们联系删除