本期介绍的是材料化学领域的工具资源:
*Pymatgen:材料分析 Python 库
*PubChemPy:化学工具包
*Bert-loves-chemistry:化学建模
*LAMMPS:大规模原子分子并行模拟器
*NIMS-OS:自动材料探测
*ChemCrow:简化常见化学任务推理
*浦科化学:开源科学大模型
*Open Catalyst Project:挖掘用于可再生能源储存的新催化剂
*Materials Projects:计算材料性质
Pymatgen:材料分析 Python 库
Pymatgen (Python Materials Genomics) 是一个开源的、可用于材料分析的 Python 库,拥有强大的材料分析代码,为结构和分子定义了类别,并支持多种电子结构代码,为材料项目提供动力。
资源地址:
https://github.com/materialsproject/pymatgen
PubChemPy:化学工具包
PubChemPy 依赖于 PubChem 数据库,是一个通过 PUG REST Web 服务的化学工具包,提供了一种在 Python 中与 PubChem 交互的方法,允许用户通过名称、子结构和相似性进行文件格式转换和化学性质检索等功能。
资源地址:
https://github.com/mcs07/PubChemPy
Bert-loves-chemistry:化学建模
Bert-loves-chemistry 是应用于化学 SMILES 数据的 HuggingFace 模型存储库,可用于药物设计、化学建模和特性预测等。
资源地址:
https://github.com/seyonechithrananda/bert-loves-chemistry
LAMMPS:大规模原子分子并行模拟器
Large-scale Atomic/Molecular Massively Parallel Simulator,分子动力学模拟,专注于材料建模。在固态材料(金属、半导体)和软物质(生物分子、聚合物)以及粗粒等方面具有潜力,可用于原子、介观或连续尺度的并行粒子模拟。
资源地址:
https://github.com/lammps/lammps
NIMS-OS:自动材料探测
NIMS-OS (NIMS Orchestration System) 是一个 Python 库,无需人工干预,即可进行自动材料探测。NIMS 自动机器人电化学实验 (NAREE) 系统可用作机器人实验,还能够提供结果可视化工具,允许用户实时检查优化结果。
资源地址:
https://github.com/nimsos-dev/nimsos
ChemCrow:简化常见化学任务推理
ChemCrow 是一个开源软件包,整合了 13 种专家设计的化学工具,旨在简化药物、材料设计和合成等领域中各种常见化学任务的推理过程。模型在合成生成的流程图的独立测试数据集上实现了 80% 的 top-1 准确度和 84% 的 top-5 准确度,可以学习自动更正合成流程图。
资源地址:
https://github.com/ur-whitelab/chemcrow-public
浦科化学:开源科学大模型
上海人工智能实验室开源发布的首个科学大模型浦科化学 (ChemLLM),通过注入海量化学专业数据,使大模型获得了理解和处理化学相关专业任务的知识与能力。同时,研究人员发现,随着化学能力的获得,大模型的数理学科及推理能力也得到增强。
资源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
Open Catalyst Project:挖掘催化剂
Open Catalyst Project 是 Meta AI 的基础人工智能研究部门 (FAIR) 和卡内基梅隆大学化学工程系 (CMU) 合作的研究成果,旨在利用 AI 建模并挖掘可用于可再生能源储存的新催化剂,以应对气候变化。
为了使更多研究人员加入 Open Catalyst Project,该团队发布了 Open Catalyst 2020 (OC20) 和 Open Catalyst 2022 (OC22) 数据集,用于训练机器学习模型。数据集共包含 130 万个分子弛豫 (molecular relaxation),以及超过 2.6 亿次 DFT 计算的计算结果。此外,基础模型和代码也一并在 Github 上开源。
资源地址:
https://github.com/Open-Catalyst-Project
Materials Projects:计算材料性质
Materials Projects 旨在计算所有无机材料的性质,并免费为每位材料研究人员提供数据和相关的分析算法。该项目的最终目标是,通过把重点放在那些在计算上最有前途的化合物上,从而大大减少研发新材料所需的时间。目前,其可以为研究人员提供:
* Pymatgen:用于材料分析的开源 Python 库,研究人员能够访问 Materials API 进一步分析复杂的材料数据集。
* Crystal Toolkit:开源 Web 应用程序框,用于显示常见的材料数据类型,如晶体结构、能带结构等,专门为 Python 用户设计,允许用户开发完整的网络应用程序,而无需学习传统的网络技术。
* FireWorks:免费开源代码,可以用于自动计算任意计算资源,支持在大型计算中心运行高吞吐量计算。
* Atomate:为执行复杂的材料计算提供了「配方」,只需几行代码就能自动执行一系列相互关联的复杂计算。
资源地址:
https://next-gen.materialsproject.org/

戳“阅读原文”,免费获取海量数据集资源!
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢