From 0c46fb2150d70881b5a3a44ad4f6758339e85928 Mon Sep 17 00:00:00 2001
From: Letian88 <91178477+Letian88@users.noreply.github.com>
Date: Fri, 1 Sep 2023 14:08:23 +0800
Subject: [PATCH] chinese_version
---
.../Final/AI for Electrochemistry/README.md | 77 +++++++
.../Final/AI for Life Sciences/README.md | 94 +++++++++
.../README.md | 167 ++++++++++++++++
.../README.md | 83 ++++++++
.../README.md | 188 ++++++++++++++++++
.../AI for Electrochemistry/README.md | 91 +++++++++
.../AI for Life Sciences/README.md | 46 +++++
.../README.md | 41 ++++
.../README.md | 60 ++++++
.../README-en.md | 61 ++++++
.../README.md | 66 ++++++
Chinese_version/README.md | 122 ++++++++++++
12 files changed, 1096 insertions(+)
create mode 100644 Chinese_version/Final/AI for Electrochemistry/README.md
create mode 100644 Chinese_version/Final/AI for Life Sciences/README.md
create mode 100644 Chinese_version/Final/AI4Science Application Scenario Exploration/README.md
create mode 100644 Chinese_version/Final/AI4Science Evangelistic Teaching/README.md
create mode 100644 Chinese_version/Final/AI4Science Hardcore Software Development/README.md
create mode 100644 Chinese_version/First_Round/AI for Electrochemistry/README.md
create mode 100644 Chinese_version/First_Round/AI for Life Sciences/README.md
create mode 100644 Chinese_version/First_Round/AI4Science Application Scenario Exploration/README.md
create mode 100644 Chinese_version/First_Round/AI4Science Evangelistic Teaching/README.md
create mode 100644 Chinese_version/First_Round/AI4Science Hardcore Software Development/README-en.md
create mode 100644 Chinese_version/First_Round/AI4Science Hardcore Software Development/README.md
create mode 100644 Chinese_version/README.md
diff --git a/Chinese_version/Final/AI for Electrochemistry/README.md b/Chinese_version/Final/AI for Electrochemistry/README.md
new file mode 100644
index 0000000..ee37d4e
--- /dev/null
+++ b/Chinese_version/Final/AI for Electrochemistry/README.md
@@ -0,0 +1,77 @@
+## 赛题背景
+
+AI4EC赛道由DeepModeling开源社区、嘉庚创新实验室人工智能应用电化学联合实验室(AI4EC)联合主办,旨在鼓励希望探索各类电池领域相关材料的电化学性质的选手,运用AI4Science相关软件工具,用于开发针对某一体系,或某一环境下,诸如材料氧化还原电位、反应自由能变等性质计算的工作流;也可以用于解决某一特定的问题,总之,如果你渴望用材料来不断定义能源,欢迎你加入AI for Electrochemistry的探索之旅!
+
+本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4EC相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。
+
+## 赛题内容
+
+### 一、自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4EC相关的想法来完成。包括但不限于:
+
+- 场景探索:使用AI4EC的算法或软件,探索一些实际应用场景
+
+- 工作流开发类:围绕一些常见场景,开发AI4EC工作流
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+### 二、如果你没有想法或灵感,可以参考以下方向:
+
+#### 赛题:构建通过机器学习加速的氧化还原电位计算的自动化工作流(第二阶段)
+
+#### 背景 & 问题
+
+ - 基于第一性原理的分子动力学模拟(AIMD) 计算自由能速度慢、效率低。
+
+ - 通过机器学习势能 (MLP) 可以加速 AIMD 模拟。MLP的准确性需要高质量的数据集来保证。 深度势能生成器 (DP-GEN) 可用于产生适合MLP的数据集。
+
+#### 目标
+
+构建DP-GEN与氧化还原电位计算方法相结合的工作流
+
+#### 可能的解决方案
+
+ - 理解氧化还原电位计算:参考*J. Chem. Phys. 157, 024103 (2022)*和其它相关文献
+
+ - 使用DP-GEN:请从github下载DP-GEN的源代码并阅读其主体。
+
+ - 构建工作流:可以通过直接修改DP-GEN的源代码,实现自由能微扰与MLP训练的耦合。
+
+#### 入门(第一阶段,初赛部分)
+
+ - 通过阅读LAMMPS的输入文件了解使用深度势能分子动力学(DPMD)实现自由能计算的过程。并对比常规的DPMD计算文件,分析异同。
+
+ - 阅读论文*J. Chem. Phys. 157, 024103 (2022)*,理解如何计算出垂直能量差(vertical energy gaps)和热力学积分(thermodynamic integration)。
+
+ - 读取LAMMPS输出文件计算垂直能量差并画出统计平均图像。
+
+ - 基于统计平均的垂直能量差,画出热力学积分图像,计算自由能。
+
+#### 数据集 & 材料
+
+ - 2个深度势能模型的数据集 (OH氧化还原电位计算的初始和最终状态),
+
+ - LAMMPS的输入文件、计算输出文件
+
+ - 下载地址:https://dp-public.oss-cn-beijing.aliyuncs.com/community/ai4ec.zip
+
+#### 决赛得分点
+
+ - 理解dpgen自动化生成lammps输入文件的方法,并修改dpgen/generator/lib/lammps.py使其可以生成自由能计算的输入文件,在修改处以注释的形式打上标签。
+
+ - 修改dpgen/generator/run.py文件,构建自由能计算势函数训练自动化工作流,在修改处以注释的形式打上标签。
+
+ - dpgen如何修改的分析报告。
+
+#### 决赛提交格式
+
+ - 修改后的dpgen/generator/lib/lammps.py副本。 (python源文件)(决赛-1)
+
+ - 修改后的dpgen/generator/run.py文件。(python源文件)(决赛-2)
+
+ - dpgen修改分析报告。(word)(决赛-3)
+
+更多赛题详细信息,请[点击此处](https://dptechnology.feishu.cn/docx/UJIwdMKf6oMhMjxRQcfciR8onyc?from=from_copylink)
+
+
diff --git a/Chinese_version/Final/AI for Life Sciences/README.md b/Chinese_version/Final/AI for Life Sciences/README.md
new file mode 100644
index 0000000..87bd962
--- /dev/null
+++ b/Chinese_version/Final/AI for Life Sciences/README.md
@@ -0,0 +1,94 @@
+# 赛题背景
+
+药物发现利用广泛的技术引导了与疾病相关的新型化学实体进入临床环境,以满足患者未得到满足的需求。虽然许多传统技术方法被用于“湿”实验,但最近几十年,计算方法的开发和应用已经被广泛应用。近年来,人工智能,特别是机器学习方法的复兴,加速了药物发现过程,提高了临床前研发效率[1]。
+
+
+AI for Life Sciences赛道鼓励选手针对生物医药领域普遍关心的问题,使用AI4Science相关软件工具尝试解决。希望选手能够可以针对生物医药领域中目前已有的应用场景提出解决方案,如各种性质预测,靶标预测,结合模式探究及分子生成等实际场景;同时鼓励选手尝试使用不同软件与工具,比如Uni-Mol深入探索某个领域——总之只要是和AI4Science与生物医药有关的一切探索在这里都被鼓励!
+
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和生物医药相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+## 赛题内容
+
+### 一、自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择生物医药领域大家关心的问题,使用AI4Science相关算法和工具进行探索。
+
+#### 初赛要求:
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+#### 决赛要求:
+
+我们鼓励您按照proposal进一步落地,并尽可能地展现作品的优势和创新点,同时准备充分的演示和答辩,以便能够向评审团展示作品的价值和实用性。我们将从创新性、技术实现、可扩展性、代码规范、文档完整、团队合作等方面评估您的作品。
+
+#### 您需要提交:
+
+1. 带有规范注释的代码文件
+
+2. 一份说明文档
+
+3. 其他支撑材料(如数据、测试评估结果)
+
+### 二、如果你没有想法或灵感,可以考虑探索以下方向:
+
+#### 背景描述:
+
+定量构效关系(quantitative structure-activity relationships,QSAR),是研究一组化合物的活性、毒性、药代性质与其结构(structural)、物理化学性质(physicochemical)、拓扑结构(topological)等之间的相关关系,并用数理统计模型加以表征的研究方法。近几十年来,随着药物相关数据的大量积累,基于QSAR的药物设计与发现方法已转向利用大规模数据源和分子描述符库,使用更多的机器学习算法自动生成预测模型。然而,QSAR模型的准确性在很大程度上依然受限于分子表示方法。具体来说,分子表示方法包括类机器可读的分子表示、字符串表示、化学表表示、基于特征的表示等,常用的方法一般依赖于2D,导致模型无法学习到三维空间下的配体分子信息。
+
+Uni-Mol是一个用于三维分子表示的多功能框架,在训练过程中直接利用分子的三维信息,极大地增强了模型的表现力和适用性。Uni-Mol包含两个具有相同架构的模型:一个是分子预训练模型,其在一个包含2.09亿个分子构象的数据集上进行训练;一个是口袋预训练模型,在一个包含300万个蛋白质口袋的数据集上进行训练。此外,Uni-Mol的模型架构满足SE(3)等变性。在下游实验中,Uni-Mol不仅在先前研究过的分子性质预测任务中达到了最先进的性能,而且在与药物发现相关的一系列下游任务中表现出色,特别是那些涉及了与三维信息高度相关的任务。这些任务的例子包括高精度分子构象生成、蛋白质-配体结合构象预测和蛋白质口袋属性预测。Uni-Mol在诸如小分子性质预测、蛋白质靶点预测、蛋白质-配体复合物构象预测和量子化学性质预测等任务中表现出优越的性能和强大的泛化能力,超越了现有的解决方案。
+
+现在,我们鼓励选手进一步地探索采用3D分子表示框架Uni-Mol解决更多药物设计与发现具体场景的实际难题,赛题参考如下。
+
+
+#### 赛题一:蛋白质靶点预测
+
+药物候选物与靶蛋白之间物理相互作用的识别是药物发现中的关键环节。根据统计数据,目前关于药物-蛋白质空间的知识相当有限,因此需要新的方法来扩展我们的理解。已经发表的研究表明,蛋白质靶点预测是一个开放性问题,不仅需要新算法,还需要新的表示方法来阐明尚未探索的药物-靶点相互作用(DTI)空间和其他相关任务,典型的例子包括激酶谱预测。
+
+在初赛中,我们鼓励选手基于我们所开发的3D分子表示Uni-Mol框架提出解决方案,Uni-Mol结合了分子和口袋预训练模型,学习基于距离矩阵的评分函数,而后通过采样和优化复合物构象来实现蛋白质-配体结合的预测。
+
+在决赛中,我们鼓励您按照proposal进一步落地,并尽可能地展现作品的优势和创新点,同时准备充分的演示和答辩,以便能够向评审团展示作品的价值和实用性。我们将从创新性、技术实现、可扩展性、代码规范、文档完整、团队合作等方面评估您的作品。
+
+
+#### 赛题二:分子性质预测
+
+分子性质预测的目标是从一组已知化合物中学习一个可泛化的模型,该模型可以应用于新的分子。这通常涉及系统地设计或选择描述符作为监督式机器学习模型训练的输入。例如,Dahl等[2]和Mayr等[3]报告了在tox21挑战数据集上应用深度神经网络(DNNs)成功进行ADMET预测。Uni-Mol也在分子性质预测这一重要任务中进行了实验,吸引了人工智能(AI)从业者的大量关注。它在各种性质和数据集上相较于最先进(SOTA)方法表现出优越的性能。
+
+在初赛中,我们鼓励选手基于Uni-Mol开发面向某一具体场景的分子性质预测模型,或者提出更优的通用解决方案。
+
+在决赛中,我们鼓励您按照proposal进一步落地,并尽可能地展现作品的优势和创新点,同时准备充分的演示和答辩,以便能够向评审团展示作品的价值和实用性。我们将从创新性、技术实现、可扩展性、代码规范、文档完整、团队合作等方面评估您的作品。
+
+
+#### 目标(决赛)
+
+1. 初赛要求提供数据收集、数据清洗、模型构建和评估过程的概述。概述可以包括但不限于各种药物性质预测、蛋白靶点预测(例如激酶谱靶标预测等),以及构象生成。而决赛要求根据初赛的proposal,提供实现过程的代码(含注释及相关说明)及实现结果,要求产出一份逻辑严密的文档。
+
+2. 利用Uni-Mol notebook学习Uni-QSAR案例并撰写使用体验,字数不限。(有关更多详细信息,请参阅“入门”)。
+
+
+#### 入门
+
+https://nb.bohrium.dp.tech/detail/1032
+
+
+#### 得分点
+
+1. 报告中提出的想法的新颖性和可行性。
+
+2. 报告的合理性和完整性。
+
+#### 提交格式
+
+- 压缩文件需包含:
+
+1. 包含应用场景的背景介绍、实际意义以及数据收集、数据清洗、模型构建和模型评估过程概述的报告。该报告着重于提供一个研究框架,不需要具体实现。
+
+2. 通过笔记本运行Uni-QSAR的经验和反馈的报告。此报告没有字数限制。
+
+## 提交方式
+
+- 发送邮件至邮箱:hackathon@deepmodeling.com
+
+- 邮件命名为“赛道_姓名_方向.zip”,如“AI4Science应用场景探索_小明_DMFF.zip,AI for Life Sciences_李华_自由赛道.zip”,若邮件内有附件,附件同邮件名。
+
+- 邮件内容包含参赛者姓名,压缩包/bohrium Notebook链接(具体看赛题要求),以及必要的说明
\ No newline at end of file
diff --git a/Chinese_version/Final/AI4Science Application Scenario Exploration/README.md b/Chinese_version/Final/AI4Science Application Scenario Exploration/README.md
new file mode 100644
index 0000000..fb998cb
--- /dev/null
+++ b/Chinese_version/Final/AI4Science Application Scenario Exploration/README.md
@@ -0,0 +1,167 @@
+## 决赛赛题背景
+
+在本赛道,我们鼓励各位选手们探索并延伸AI4Science在不同场景中的应用,使用但不限于DeePMD-kit、ABACUS、DMFF、Uni-Mol、DeepFlame等软件。
+
+本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4Science相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。
+
+## 一、自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4Science相关的想法来完成。包括但不限于:
+
+- **场景探索**:使用AI4Science的算法或软件,探索一些实际应用场景
+
+- **工作流开发类**:围绕一些常见场景,开发AI4Science工作流(推荐使用dflow搭建相关工作流,但是不强制)
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+- **决赛目标**
+
+ 选手基于初赛的proposal内容,完成决赛项目。
+
+- **提交要求**
+
+ Bohrium Notebook形式或者以附件形式提交完整内容
+
+## 二、如果你没有想法或灵感,可以参考以下应用方向:
+
+### 赛题一:Uni-Mol+X:利用预训练模型探索3D分子表示学习的新应用
+
+ 预训练模型正在席卷多个领域。从大规模无标注数据中提取表征信息,再在小范围标注的下游任务上进行监督学习,正在成为很多领域的事实解决方案。药物与材料设计领域的预训练模型如何构建与应用?2022 年 5 月,一款开源的基于分子三维结构的通用分子表征学习框架 Uni-Mol 正式发表,论文被机器学习顶会 ICLR 2023 接收。与过往的基于一维序列或二维图结构的分子表征框架不同的是,Uni-Mol 直接利用分子三维结构作为模型输入。Uni-Mol 性能优越、模型泛化能力强,在小分子性质预测、蛋白靶点预测、蛋白-配体复合物构象预测、量子化学性质预测、MOF 材料吸附性能预测、OLED 发光材料性能预测等任务上都超越了现有的解决方案。
+
+#### 初赛目标
+
+ 你的任务是使用Uni-Mol框架,开发一个新的下游应用,该应用应能有效地利用Uni-Mol的3D分子表示能力和预训练特性。你可以选择解决一个具体的问题,例如预测分子性质、生成新的分子结构,或者开发一个新的工具或服务。
+
+#### 一些提示
+
+ 在这个挑战中,我们邀请你使用基于分子三维结构的通用分子表征学习框架 Uni-Mol ,结合你自己的创新思维(即“X”),探索分子表示学习的新应用。你可以选择任何你感兴趣的领域,包括但不限于药物设计、材料科学、环境科学等。下面这两个例子可以给你一些启发。
+
+#### 参考案例
+
+ Uni-Mol性质预测实战-回归任务-电解液分子的介电常数: https://nb.bohrium.dp.tech/detail/1033
+
+ Uni-Mol性质预测实战-分类任务-血脑屏障渗透性: https://nb.bohrium.dp.tech/detail/1034
+
+#### 决赛要求
+
+ 在这个挑战中,我们邀请你使用基于分子三维结构的通用分子表征学习框架 Uni-Mol ,结合你自己的创新思维(即“X”),对Uni-Mol进行架构上的修改与提高,扩大Uni-Mol的应用场景,实现更高级的应用。
+
+ 基于初赛的proposal,选手在完成作品内容的同时,可以基于对Uni-Mol需求对Uni-Mol工具进行优化,我们给出如下参考的优化建议:
+
+1. 除了结构信息之外考虑到其他的信息,将一些环境的变量如温度,压强等共同作为输入,训练特定的与环境相关的模型。例如Uni-MOF在Uni-Mol的基础上进行了改动,实现了预测特定温度和压强下MOF对气体对吸附能力。
+
+2. 当前Uni-Mol的3D表征没有考虑周期性。在处理一些周期性体系时没有办法得到很好的结果。在之前的输入基础上引入周期性约束,对模型的结构进行调整后得到周期性的信息,实现Uni-Mol对周期性体系的支持。
+
+3. Uni-Mol当前的预训练模型更专注于通用型,在一些功能分子的应用场景中(例如OLED分子,电解液分子),这些分子有其专有的特点。对于特定场景可以重新有针对的构建预训练模型,可以用特定的数据训练专用的预训练模型,也可以重新设计有针对的预训练任务。
+
+4. Uni-Mol当前的表现还有可优化的空间,例如:通过将初始构象迭代优化至其平衡构象,并且优化的构象进一步用于预测QC特性,Uni-Mol+进一步提高了Uni-Mol在量化属性预测对准确性。可以尝试更多的方法进一步优化Uni-Mol的表现,提高训练速度和预测精度。
+
+#### Ref:
+
+ Uni-MOF:https://chemrxiv.org/engage/chemrxiv/article-details/6447d756e4bbbe4bbf3afeaa
+
+ OLED:https://chemrxiv.org/engage/chemrxiv/article-details/6412d142aad2a62ca1d86505
+
+ Uni-Mol+:https://arxiv.org/abs/2303.16982
+
+#### 提交要求
+
+Bohrium Notebook形式或者以附件形式提交完整内容
+
+### 赛题二:dflow + X:开发AI4Science云原生工作流
+
+dflow是一个使用云原生项目Argo作为工作流引擎,面向科学计算工作流开发者的开源Python开发框架。
+
+#### 初赛目标
+
+ 在科学计算场景下或者你的科研工作中一定遇到过一些自动化工作流的需求,在dflow的框架和规范下实现一个简单的工作流,或者复杂工作流的一部分(比如实现其中几个OP),在工作流平台上workflows.deepmodeling.com上跑通,初步体会云原生、自动化、可观测、可复现的内涵
+
+##### 一些提示
+
+ 下面这些案例会帮助你逐步掌握dflow工作流。
+
+#### 参考案例
+
+ Function OP:https://bohrium.dp.tech/notebook/90e75093e3e64c0a99521f1be6dc3346
+
+ Class OP:https://bohrium.dp.tech/notebook/b0897299e4d4466a8d64d2538de1bf26
+
+ Condition:https://bohrium.dp.tech/notebook/dde8e85b376e41fba6f125d5abf1f635
+
+ Slices:https://bohrium.dp.tech/notebook/644edc260d8746159d9ecd48bfa1ca76
+
+ Recursion:https://bohrium.dp.tech/notebook/aa39c7c1ca0b48d4a85cd4032aafceb5
+
+ Reuse:https://bohrium.dp.tech/notebook/e6bfb5f3efda4febba2ba696c9838557
+
+ Dispatcher: https://bohrium.dp.tech/notebook/9840681dced74568b64f3449581e6bf4
+
+ Local: https://bohrium.dp.tech/notebook/96841436cf844b2aade4ffe621d80bcc
+
+#### 决赛目标
+
+基于dflow完成自动化流程,在此基础上满足以下一项或多项的可适当加分,当然要根据自己项目的实际情况:
+
+1. 进一步封装成友好的软件,用户接口可以是命令行,也可以是Bohrium APP,可以在网页上交互、结果展示。
+
+2. 抽象成具有一定扩展性的框架,对于有的用户的相似场景,能在该框架下做一些自定义的开发从而满足需求,例如流程中的某一步的算法不同、实现不同、算的目标不同,在一套框架下能插件化地、相对解耦地接进来。可参考https://github.com/deepmodeling/dpgen2、https://github.com/deepmodeling/APEX、https://github.com/zjgemi/dpa-data-cleaning 等。
+
+3. 开发具有一定复用性的OP,或复用其他人开发的OP,可参考https://aissquare.com/workflows?type=ops&sort=view_count&page=2。
+
+4. 对dflow提出或贡献具有一定共性的需求特性。
+
+#### 提交要求
+
+Bohrium Notebook形式或者以附件形式提交完整内容
+
+### 赛题三:DMFF:LJ势参数调节
+
+可微分分子力场(Differentiable Molecular Force Field, DMFF)优化平台希望通过自动微分技术打造全新的生产级力场计算引擎,以帮助解决参数调优困难、复杂力场计算等开发过程中的诸多痛点问题,达成分子力场参数的自动调优,以及复杂力场分子动力学(MD)的快速实现。
+
+#### 问题描述
+
+ 在计算化学和分子模拟中,Lennard-Jones势(LJ势)是描述原子间范德华力的一种简单模型。LJ势通常用两个参数表示:吸引能(ε)和平衡距离(σ)。这两个参数对于各种类型的原子和分子都有不同的数值。优化这些参数对于准确模拟分子系统的特性非常重要。一直以来,LJ势的调整目标都是更好地复现实验数据,如密度、蒸发焓、表面张力等。在过去,由于算力限制,这种高维空间的参数优化所需资源十分庞大,这限制了LJ势参数的种类与优化的深度。随着可微分计算框架的发展,我们可以用更低的成本在高维空间内使用一阶优化算法;进一步的,DMFF提出了使用MBAR reweighting与可微分框架,直接计算物理性质对力场参数的导数。这意味着直接面向物理性质的大规模力场参数优化已经万事俱备,只欠东风。
+
+#### 初赛目标
+
+ 请参考下面的例子,撰写一个Bohrium Notebook,实现对于一种以上的有机分子,面向一种以上的热力学性质,调整其Lennard-Jones参数。
+
+#### 一些提示
+
+ 可选的有机分子可以参考:https://pubs.acs.org/doi/pdf/10.1021/ct200731v。较易实现的目标物理性质有:密度、蒸发焓、介电常数。对于每种分子,Gromacs格式的参数文件可以使用acpype生成,液相盒子则可以用packmol准备。DMFF可以便利地使用reweighting方法计算统计平均值的导数,进而进行参数优化。
+
+#### 参考案例
+
+ https://github.com/deepmodeling/DMFF/blob/wangxy/v1.0.0-devel/examples/lennard_jones_opt/opt.ipynb
+
+#### 决赛目标
+
+1. 基于初赛成果,搭建一个可扩展的Lennard-Jones参数优化框架。使用者可以自由增加新的小分子与新的热力学性质,达成比目前GAFF2更好的效果。
+
+2. 参赛选手可以选择更有效的优化算法,我们非常欢迎选手为DMFF贡献新的feature来更好地支撑这一应用。
+
+#### 提交要求
+
+ Bohrium Notebook形式或者以附件形式提交完整内容
+
+#### 提交方式
+
+- 发送邮件至邮箱:hackathon@deepmodeling.com
+
+- 邮件命名为“赛道_姓名_方向.zip”,如“AI4Science应用场景探索_小明_DMFF.zip,AI for Life Sciences_李华_自由赛道.zip”,若邮件内有附件,附件同邮件名。
+
+- 邮件内容包含参赛者姓名,压缩包/bohrium Notebook链接(具体看赛题要求),以及必要的说明
+
+### 时间安排
+
+1. Hackathon宣讲、组队、报名时间:6月27日-7月7日
+
+2. Hackathon初赛:7月8日-7月14日
+
+3. 初赛结果公布:7月15日-7月16日
+
+4. Hackathon决赛:7月17日-8月5日
+
+5. 决赛答辩:8月6日-8月7日
+
+6. Hackathon颁奖:8月10日
\ No newline at end of file
diff --git a/Chinese_version/Final/AI4Science Evangelistic Teaching/README.md b/Chinese_version/Final/AI4Science Evangelistic Teaching/README.md
new file mode 100644
index 0000000..4934369
--- /dev/null
+++ b/Chinese_version/Final/AI4Science Evangelistic Teaching/README.md
@@ -0,0 +1,83 @@
+# 赛题背景
+
+近年来,我们欣喜的看到AI4Science领域取得了诸多突破性进展,例如破解蛋白质折叠难题的Alpha-Fold、高精度模拟1亿原子运动的DeePMD-kit、覆盖元素周期表的预训练模型DPA-1、刷爆多项材料和生物医药任务的大模型Uni-Mol等。我们坚信AI工具将在自然科学领域掀起新的浪潮,AI4Science科研成果将影响我们每个人的生活。令人遗憾的是,这些充满未来感的成就受制于其“阳春白雪”的科学属性,缺少了些“烟火气”,未能像ChatGPT那样进入市井人家成为茶余饭后的谈资。对此,我们诚挚的邀请各位布道者和DeepModeling社区一起,在这个盛夏,把AI4Science知识灵动起来!共同释放AI4Science无限可能!
+
+**在本赛道,我们鼓励选手们以通俗易懂的方式分享自己在Hackathon期间的学习成果,分享自己使用AI4Science软件的使用心得,分享自己对AI4Science的新见解和新思考。我们一起传递AI4Science知识,共同见证人工智能时代科研工具的升级换代!**
+
+
+## 赛题要求
+
+本赛道允许选手们脑洞大开,选择任何与AI4Science相关的创作内容,例如:
+
+
+- 先进算法的底层逻辑
+
+- 成熟AI软件的使用心得
+
+- 前沿进展和应用领域
+
+- 文献复现的辛酸历程
+
+自己对AI4Science的思考和实践
+
+
+**我们鼓励各种内容创作形式,包括但不限于:**
+
+
+- Notebook笔记
+
+- Bilibili科普视频
+
+- 知乎优质文章
+
+- 小红书文献复现日记
+
+
+**本赛道不为选手们的想象力划定任何边界!我们将综合考量作品的科学属性、创新性和潜在传播力等。**
+为了让各位同学对此赛道有更多创意,下面给大家一些选题方向和形式的建议,以抛砖引玉。
+
+
+
+- **方向一:学习知识“跑”起来**
+
+AI4Science的学习需要一个强大且易于上手的工具。对此,我们于今年5月份发布了Notebook案例广场,创新性的将交互式编程环境纳入Bohrium科研平台中,为AI4Science初学者带来了全新的学习体验。短短两个月过去,Notebook案例广场上已经汇聚了分子动力学、深度学习、化学和生物信息学、材料计算和图像表征等几百个优秀案例。本方向鼓励大家在Notebook上动手体验前沿AI4Science模型,动手记录AI4Science心得,动手实践AI4Science创意,让学习知识“跑”起来!
+
+- **方向二:社区教程“写”出来**
+
+DeepModeling社区的发展让越来越多的老师、同学有社区软件的学习需求。比如DeePMD-kit、ABACUS、DMFF、DeepFlame相关社群里有大量的老师同学针对相关问题进行讨论。微信群里面的讨论固然是一个好的学习手段,但为了更多人能够看到,我们更鼓励大家共同建设社区学习文档,将自己学习和科研的心得落实到学习文档上让更多的人能够学习,能够看到。本方向鼓励大家将自己过去(或正在)学习使用相关社区软件产生的案例变成文字资料,一方面撰写资料的过程有助于自己整理思路,另一方面也可以方便更多的人跟着学习。
+
+- **方向三:精彩内容“讲”出来**
+
+随着AI4Science一个个激动人心的成果出现,相关知识的学习需求越来越迫切。一方面年轻的同学们迫切希望有人能够将AI4Science相关知识传授给自己;另一方面公众也希望从科普的角度了解AI4Science的前世今生。本方向鼓励大家以课程视频的形式讲授AI4Science相关课程,清楚的将AI4Science的精彩内容“讲”出来!
+
+- **方向四:知识传播“酷”起来**
+
+
+当今庞大的内容市场中早已涌现出一批优秀的科普作品。例如,毕导、何同学“理论+实践”的创作思路,Procreate等绘画工具,3Blue1Brown开发的Manim可视化工具也被用来制作视频科普。在AI4Science领域,除了上述Notebook笔记工具,有人尝试将分子世界和VR、游戏引擎(Unity)相结合,充满了科技感!总之,本方向鼓励内容生产者利用丰富的内容创作经验和炫酷的可视化技术将AI4Science酷起来!
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/Rl03dnIqqomF0Fx8FjgcVhnonRd?from=from_copylink)**
+
+## 决赛期间交流活动:
+
+**布道师面对面**
+
+我们了解到很多同学对传福音工作存在一些疑虑,例如:
+
+1. 我不知道我的讲道作品能否被该领域的新人成功消化。
+
+2.遇到技术问题,例如NoteBook相关的操作问题等。
+
+3. 不确定你的讲道是否存在任何科学缺陷
+
+为了帮助大家解决以上问题,我们决定发起一次非正式的布道者面对面活动。具体安排如下:
+
+[点击查看详情](https://ucoyxk075n.feishu.cn/docx/VA7QdoF2zorT5kxUbWAcs7jrn9g)
+
+**活动时间**
+
+2023 年 8 月 1 日晚上 7:30
+
+2023 年 7 月 26 日晚上 7:30
+
+2023 年 7 月 24 日晚上 7:30
+
diff --git a/Chinese_version/Final/AI4Science Hardcore Software Development/README.md b/Chinese_version/Final/AI4Science Hardcore Software Development/README.md
new file mode 100644
index 0000000..e709347
--- /dev/null
+++ b/Chinese_version/Final/AI4Science Hardcore Software Development/README.md
@@ -0,0 +1,188 @@
+# Background of the question
+
+AI4Science硬核软件开发赛道由DeepModeling开源社区、北京大学超算队、北京大学Linux俱乐部联合主办。本赛道鼓励选手积极参与到AI4Science本身的工具开发中。对高性能感兴趣的同学可以对指定软件进行高性能优化;对AI感兴趣的同学可以针对某些网络进行重构。又或者你发现软件中还有一些别的问题你想要改进——总之只要是和AI4Science有关的一切软件开发在这里都被鼓励!
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4Science硬核软件开发相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+
+## 赛题内容
+
+### 一、自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4Science硬核软件开发相关的想法来完成。包括但不限于:
+
+- **DeepModeling开源社区软件高性能优化**:选手可以自由浏览DeepModeling开源社区相关软件,并对自己感兴趣的部分进行高性能优化
+
+- **DeepModeling开源社区软件开发**:选手可以自由浏览DeepModeling开源社区相关软件,并对自己感兴趣的事情进行开发。如果不确定如何下手,优先鼓励大家查看社区项目里面的相关issue,解决issue里面的问题
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+## 二、指定赛题
+
+### 赛题一:高性能跨平台的邻近表算法实现
+
+邻近表(Neighborlist)在计算化学中具有重要意义,在第一性原理计算、分子动力学模拟等领域都有重要的应用。邻近表是一种用于表示对象之间的局部关系或邻近关系的数据结构,记录了在一定截断半径范围内相邻粒子的索引,并在模拟过程中随原子的运动而动态更新。因此,无论是近程相互作用的计算,还是局域的结构性质的统计都直接依赖于邻近表。因此,临近表建立的算法优劣将显著影响计算效率。我们逐渐意识到,在不同的科学计算项目中都有共同的邻近表需求,并且可以抽象为具有明确输入与输出的算法。此外,由于科学软件的复杂性和特殊性,程序不仅仅像深度学习框架一样强烈地依赖于GPU,而且需要运行在各种架构且异构的加速平台上。我们是否可以将邻近表抽象出来并进行高度优化,形成从python、c++到cuda,从x86、arm到各种异构加速平台全覆盖的高度优化的库,从而减少重复地开发。
+
+受计算机硬件架构特性的影响,邻近表算法在不同硬件平台上的实现和性能表现存在显著差异。因此,在设计和优化邻近表算法时,必须针对各种计算机硬件架构进行特定的实现和优化。 此外,模拟体系的性质也存在很大差异,如体系规模(从小型到大型体系)、密度分布(从稀疏到均匀密集)以及空间分布(从均匀到局部稠密)。基于这些不同的模拟体系特点,设计邻近表算法和优化策略时需要综合考虑各种因素,以确保算法在各种场景下的高效性能表现。
+
+#### 初赛目标
+
+在初赛中,选手们通过学习几种经典邻近表算法,自由选择编程语言实现基本算法。测试模型及标准答案请见 https://github.com/deepmodeling-activity/hackathon-test-cases
+
+#### 决赛目标
+
+决赛中,基于初赛成果,选手们可以自由优化,既可以在代码层面进行调优,也可以提出新型算法,乃至实现更加复杂的空间分解和负载均衡策略。最终的的评分将采用北大超算平台进行,具体使用方式将在后期推出。
+
+#### 一些提示
+
+为评估邻近表算法在各种情况下的正确性和性能表现,我们将提供一组覆盖常见模拟场景的测试用例(包括模型文件)以及针对不同硬件架构的测试平台。选手们可以自由选择编程语言,选择或自主设计不同的邻近表算法,要求在计算尽可能准确的基础上加快计算速度。可能需要考虑的因素有:体系规模、密度分布、空间分布、硬件架构、IO与分块等等。
+
+#### 评分标准
+
+评分将综合考虑算法的正确性和执行速度,并根据体系和平台的成绩进行加权计算。具体的评分权重细则将在评分标准文档中公布。
+
+#### 决赛提交要求
+
+我们将为参赛者提供多种不同平台的服务器,以便对其编写的代码进行测试和评估。这些平台包括基于x86和ARM架构的CPU集群,以及Nvidia和AMD的GPU设备。为了确保代码的正确性,我们将提供一套测试框架,该框架规定了代码输入与输出的格式和标准。参赛者在完成自己的代码编写后,需要将其算法接入测试框架进行相应的测试。通过这一过程,我们将能够确保参赛者的代码满足既定的性能和正确性要求,从而为比赛的公平性和可靠性提供保障。
+
+### 赛题二:ABACUS
+
+ABACUS是一款广泛应用于材料科学计算的高性能密度泛函理论(DFT)软件。为了充分发挥其在实际生产应用中的性能潜力,本赛题旨在挖掘并优化软件中的性能瓶颈,从而提高计算效率、节省计算资源并加速科研进程。
+
+ABACUS支持平面波(PW)和数值原子轨道(LCAO)两种不同的基组,选手们需要在对给定的两个算例(1. LCAO基组算例,2. PW基组算例)进行性能热点分析,并自由进行性能优化。
+
+#### 初赛目标
+
+初赛中,选手们通过测试给定的两个算例,分析其性能热点并找到性能热点对应的代码,分析并提出初步的性能优化方案。方案可自由采用MPI优化/OpenMP并行优化或算法优化等。
+
+#### 决赛目标
+
+决赛中,选手们基于初赛提出的性能优化方案进行性能优化打榜比赛。指定的算例的潜在性能优化方案:1. LCAO基组算例,2. PW基组算例。
+
+#### 算例地址:
+
+https://github.com/deepmodeling/abacus-develop/tree/for_hackathon/hackathon_test_cases
+
+#### 一些优化方向的提示:
+
+**LCAO基组算例:**
+
+1. ABACUS中的电荷密度对称化算法;
+
+2. ABACUS中LCAO基组计算密度矩阵的MPI并行算法。
+
+**PW基组算例:平面波基组使用迭代法求解对角化,目前ABACUS支持CG和Davidson两种对角化算法,可以:**
+
+1. 考虑对Davidson算法进行优化(算法实现层面)或实现其他的对角化算法(LOBPCG/PPCG/RMM-DIIS等)
+
+2. 考虑对CG或Davidson算法采用MPI/OpenMP/CUDA等高性能优化方案。
+
+#### 评分标准
+
+为公平评估性能优化的效果,所有选手优化后的程序将采用:1. MPI多进程并行,2. OpenMP多线程并行,3. MPI+OpenMP混合并行。三种测试方案分别对两个目标算例的热点函数耗时进行综合性能优化效果评估,评分标准方面,我们鼓励对一个热点函数进行极致的优化而不是对多个热点函数都进行适度优化,具体的评分权重细则将在评分标准文档中公布。
+
+
+### 赛题三:可自动微分的点电荷长程静电作用算法
+
+在周期性边界条件下的系统中,由于最小镜像约定的限制,邻近表方法不能有效处理长程静电相互作用。为了解决这个问题,研究人员发展了诸如Ewald、PME、PPPM等长程相互作用算法。随着系统规模的扩大,优化现有算法和开发新算法变得非常重要。在基于物理的分子力场DMFF中,我们将各种物理力场和模拟计算流视为人工智能模型的自然延伸,以第一性原理或实验数据为输入,采用先进机器学习算法反向矫正和优化物理模型参数。实现这一目标的关键是代码的自动微分功能。因此,在保证自动微分功能的前提下,如何实现高效且先进的长程静电作用算法成为一个亟待解决的问题。
+
+#### 初赛目标
+
+在分子动力学模拟和量子化学计算中,准确计算长程静电相互作用对于正确预测物质的性质和行为至关重要。DMFF中,我们初步实现了一种基于PME的长程静电相互作用,同时支持多极静电和色散相互作用。尽管PME方法的性能得到了很大的改进,但在大规模计算中仍然存在计算效率的瓶颈。本赛题的目标是开发新的点电荷静电相互作用算法,以优化PME方法,并在保持自动微分能力的前提下提高长程作用部分的计算速度。 有三方面的优化思路:
+
+1. 对现有的PME算法进行彻底的分析,以识别在JAX代码层面的优化机会。
+
+2. JAX提供了自定义算子的功能,允许我们使用C++和CUDA实现高效的算子。这为加速计算提供了另一种途径。例如,我们可以为b-spline插值实现一个自定义算子,以提高计算效率。具体而言,我们可以将融合函数 $$F(x)$$ 实现为一个自定义算子,使其能够在GPU上快速计算。
+
+3. 除了PME算法外,近年来研究人员还提出了许多先进的长程作用计算算法,如PMU和ScaFaCoS。研究和比较先进的静电相互作用算法,通过JAX和CUDA算子实现先进算法加速长程作用计算,以评估它们在提高计算效率方面的潜力。
+
+选手所提出的方法需要在可自动微分的前提下加速点电荷的长程静电作用的计算。我们将评估所提出方法在DMFF框架中的性能,以证明其可以将DMFF的能力推向新的高度。我们将建立一种高效的静电相互作用计算方法,以加速分子动力学模拟和量子化学计算中长程作用部分的计算。这将为相关领域的研究人员提供更好的工具,从而加速科学发现的过程。测试模型及标准答案请见 https://github.com/deepmodeling-activity/hackathon-test-cases
+
+#### 一些提示
+
+初赛中,选手们学习理解PME的原理后,首先实现基本算法,并将其集成到提供的测试框架中,以评估其在各种模拟场景下的正确性和性能表现。决赛中,基于初赛成果,选手们可以自由优化,既可以在代码层面进行调优,也可以提出新型算法,从而提升各种模拟场景下的正确性和性能表现。
+
+为评估长程作用算法在各种情况下的正确性和性能表现,我们将提供一组覆盖常见模拟场景的测试用例(包括模型文件)以及针对不同硬件架构的测试平台。选手们可以自由选择编程语言,选择或自主设计不同的邻近表算法,要求在计算尽可能准确的基础上加快计算速度。可能需要考虑的因素有:体系规模、密度分布、空间分布、硬件架构、IO与分块等等。
+
+#### 评分标准
+
+评分将综合考虑算法的正确性和执行速度,并根据体系和平台的成绩进行加权计算。具体的评分权重细则将在评分标准文档中公布。
+
+#### 决赛提交要求
+
+我们将为参赛者提供多种不同平台的服务器,以便对其编写的代码进行测试和评估。这些平台包括基于x86和ARM架构的CPU集群,以及Nvidia和AMD的GPU设备。为了确保代码的正确性,我们将提供一套测试框架,该框架规定了代码输入与输出的格式和标准。参赛者在完成自己的代码编写后,需要将其算法接入测试框架进行相应的测试。通过这一过程,我们将能够确保参赛者的代码满足既定的性能和正确性要求,从而为比赛的公平性和可靠性提供保障。评分将采用北大超算平台进行,具体使用方式将在后期推出。
+
+### 赛题四:DeepFlame—热力学函数和输运参数的神经网络训练
+
+在燃烧模拟中,计算更新热力学状态和输运参数是关键的一步。在工程应用中,工质入射、混合和燃烧等过程至少部分发生在跨临界或超临界状态下,可能导致燃烧模拟中常用的理想气体模型不再适用。尽管可以通过引入形式上更复杂的真实流体模型以提高燃烧模拟的准确性,但将导致模拟复杂度的增加和计算量的显著增加,定量来看,使用真实气体模型更新热力学函数和输运参数将会占用大涡模拟总计算时长的50%到75%。
+
+#### 初赛目标
+
+机器学习是一种潜在的计算真实流体热力学函数和输运参数的回归工具。在本赛题中,你需要训练用于计算氮气的热力学函数和输运参数的神经网络。网络的输入信息为工质的总焓和压力,输出数据为温度、密度、热扩散率、粘度和等焓压缩系数。我们提供了压力在3.5-5 MPa、温度在127-350K的数据用于训练和测试你的神经网络。
+
+#### 一些提示
+
+1. 数据生成
+
+我们所提供的数据集采用基于Peng-Robinson状态方程的真实流体模型生成(自Cantera2.6版本开始提供)。如果你需要生成更多数据用于训练和测试,可自行安装Cantera并利用所提供的Python程序生成相关数据。安装方法可参考Cantera官网安装教程(https://cantera.org/install/conda-install.html#sec-install-conda),或DeepFlame安装文档(https://deepflame.deepmodeling.com/en/latest/qs/install.html)。
+
+2. 开源框架
+
+虽然有很多可使用的开源框架,本测试推荐使用PyTorch。
+
+#### 评分标准
+
+神经网络的性能评估将综合以下三方面:(1)预测准确度(越精确越好)(2)神经网络设计的精简度(参数越少越好),(3)鼓励参赛选手在完成基本要求的基础上自主扩展网络的功能,如针对多组分、宽工况等场景开展网络训练。
+
+#### 提交要求
+
+- 神经网络以pt或pth格式提交
+
+- 用于神经网络推理的python脚本
+
+- 对于神经网络的设计、性能评估的介绍文档,以word或pdf格式提交,不限制格式或字数
+
+
+
+### 赛题五:DeepFlame—DeepFGM框架
+
+Flamelet Generated Model(FGM)是一种使用预先计算的火焰来表示湍流反应流中火焰结构的燃烧模型。它为模拟复杂燃烧过程提供了一种高效的计算方式,并且被广泛应用在燃烧系统的CFD模拟。使用FGM模型需要基于查表计算而来的火焰面数据。然而,当又众多的反应组分,且随着变量的维度提升,用于计算的表所占用的内存将会十分巨大。DeepFGM,一种在DeepFlame里包含的湍流燃烧积分(TCI)模型,将会根据表中计算用到的每一个物理量生成量身定制的神经网络,最终减少整体的内存占用。
+
+#### 初赛目标
+
+此测试中,我们将提供训练数据集和它们的格式,以及一些训练用到的源代码供选手们参考。选手们需要使用提供的代码和资源来训练关于化学反应速率($$w_c$$)的网络。在取得训练的网络之后,选手们将在DeepFlame中进行Sandia-D算例的计算。
+
+#### 一些提示
+
+1. 网络训练
+
+使用的网络结构基于PyTorch框架搭建。网络的结构被定义在RES.py中。选手需要根据注释完成trian_PES.py中的代码来实现网络训练,并将网络结果以pth格式保存。
+
+2. 案例验证
+
+
+在网络训练完成之后,我们可以替换DeepFlame的Sandia-D中使用的网络来验证后期结果。对于特定的操作过程,建议参考DeepFlame训练营中关于DeePFGM的内容和相关网站。
+
+#### 评分标准
+
+
+神经网络的表现将基于两个方面:(1)表数据的预测准确度(2)后期结果
+
+#### 提交要求
+
+神经网络以pth格式提交
+
+完整的train_RES.py文件
+
+
+[点击这里查看更多赛题信息](https://dptechnology.feishu.cn/docx/QGfHdUHrEowMi4xYkJuchN9Rnbh?from=from_copylink)
+
+## 作品提交方式
+
+- 发送邮件至邮箱:hackathon@deepmodeling.com
+
+- 邮件命名为“赛道_姓名_方向.zip”,如“AI4Science应用场景探索_小明_DMFF.zip,AI for Life Sciences_李华_自由赛道.zip”,若邮件内有附件,附件同邮件名。
+
+- 邮件内容包含参赛者姓名,压缩包/bohrium Notebook链接(具体看赛题要求),以及必要的说明
+
+
diff --git a/Chinese_version/First_Round/AI for Electrochemistry/README.md b/Chinese_version/First_Round/AI for Electrochemistry/README.md
new file mode 100644
index 0000000..4a4a537
--- /dev/null
+++ b/Chinese_version/First_Round/AI for Electrochemistry/README.md
@@ -0,0 +1,91 @@
+# 赛题背景
+
+AI4EC赛道由DeepModeling开源社区、嘉庚创新实验室人工智能应用电化学联合实验室(AI4EC)联合主办,旨在鼓励希望探索各类电池领域相关材料的电化学性质的选手,运用AI4Science相关软件工具,用于开发针对某一体系,或某一环境下,诸如材料氧化还原电位、反应自由能变等性质计算的工作流;也可以用于解决某一特定的问题,总之,如果你渴望用材料来不断定义能源,欢迎你加入AI for Electrochemistry的探索之旅!
+
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4EC相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+
+## 1. 自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4EC相关的想法来完成。包括但不限于:
+
+
+场景探索:使用AI4EC的算法或软件,探索一些实际应用场景
+
+
+工作流开发类:围绕一些常见场景,开发AI4EC工作流
+
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+
+## 2. 参考题目
+
+#### **赛题**
+
+- 构建通过机器学习加速的氧化还原电位计算的自动化工作流
+
+
+#### **背景 & 问题**
+
+- 基于第一性原理的分子动力学模拟(AIMD) 计算自由能速度慢、效率低。
+
+- 通过机器学习势能 (MLP) 可以加速 AIMD 模拟。MLP的准确性需要高质量的数据集来保证。深度势能生成器 (DP-GEN) 可用于产生适合MLP的数据集。
+
+
+#### **目标**
+
+- 构建DP-GEN与氧化还原电位计算方法相结合的工作流
+
+
+#### **可能的解决方案**
+
+- 理解氧化还原电位计算:参考J. Chem. Phys. 157, 024103 (2022)和其它相关文献
+
+- 使用DP-GEN:请从github下载DP-GEN的源代码并阅读其主体。
+
+- 构建工作流:可以通过直接修改DP-GEN的源代码,实现自由能微扰与MLP训练的耦合。
+
+
+
+#### **入门**
+
+- 通过阅读LAMMPS的输入文件了解使用深度势能分子动力学(DPMD)实现自由能计算的过程。并对比常规的DPMD计算文件,分析异同。
+
+- 阅读论文J. Chem. Phys. 157, 024103 (2022),理解如何计算出垂直能量差(vertical energy gaps)和热力学积分(thermodynamic integration)。
+
+- 读取LAMMPS输出文件计算垂直能量差并画出统计平均图像。
+
+- 基于统计平均的垂直能量差,画出热力学积分图像,计算自由能。
+
+
+
+#### **数据集 & 材料**
+
+- 2个深度势能模型的数据集 (初始和最终状态),
+
+- LAMMPS的输入文件、计算输出文件
+
+
+
+#### **得分点**
+
+- 读取数据,计算累积平均垂直能量差,并画出热力学积分的图示。
+
+- 理解LAMMPS计算自由能的输入,分析计算内容的重点,并写出分析报告。
+
+
+#### **提交格式**
+
+- 包含所需文件的压缩格式文档,文档需包含:
+
+
+- 计算累积平均垂直能量差,并画出热力学积分的图示(以Bohrium Notebook形式展现)
+
+- LAMMPS计算自由能输入文件解读报告(word)
+
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/UJIwdMKf6oMhMjxRQcfciR8onyc?from=from_copylink)**
+
+
diff --git a/Chinese_version/First_Round/AI for Life Sciences/README.md b/Chinese_version/First_Round/AI for Life Sciences/README.md
new file mode 100644
index 0000000..0e8d3de
--- /dev/null
+++ b/Chinese_version/First_Round/AI for Life Sciences/README.md
@@ -0,0 +1,46 @@
+# 赛题背景
+
+药物发现利用广泛的技术引导了与疾病相关的新型化学实体进入临床环境,以满足患者未得到满足的需求。虽然许多传统技术方法被用于“湿”实验,但最近几十年,计算方法的开发和应用已经被广泛应用。近年来,人工智能,特别是机器学习方法的复兴,加速了药物发现过程,提高了临床前研发效率[1]。
+
+
+AI for Life Sciences赛道鼓励选手针对生物医药领域普遍关心的问题,使用AI4Science相关软件工具尝试解决。希望选手能够可以针对生物医药领域中目前已有的应用场景提出解决方案,如各种性质预测,靶标预测,结合模式探究及分子生成等实际场景;同时鼓励选手尝试使用不同软件与工具,比如Uni-Mol深入探索某个领域——总之只要是和AI4Science与生物医药有关的一切探索在这里都被鼓励!
+
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和生物医药相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+## 1. 自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择生物医药领域大家关心的问题,使用AI4Science相关算法和工具进行探索。
+
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+## 2. 参考题目
+
+#### 题目背景描述
+
+
+定量构效关系(quantitative structure-activity relationships,QSAR),是研究一组化合物的活性、毒性、药代性质与其结构(structural)、物理化学性质(physicochemical)、拓扑结构(topological)等之间的相关关系,并用数理统计模型加以表征的研究方法。近几十年来,随着药物相关数据的大量积累,基于QSAR的药物设计与发现方法已转向利用大规模数据源和分子描述符库,使用更多的机器学习算法自动生成预测模型。然而,QSAR模型的准确性在很大程度上依然受限于分子表示方法。具体来说,分子表示方法包括类机器可读的分子表示、字符串表示、化学表表示、基于特征的表示等,常用的方法一般依赖于2D,导致模型无法学习到三维空间下的配体分子信息。
+
+
+Uni-Mol是一个用于三维分子表示的多功能框架,在训练过程中直接利用分子的三维信息,极大地增强了模型的表现力和适用性。Uni-Mol包含两个具有相同架构的模型:一个是分子预训练模型,其在一个包含2.09亿个分子构象的数据集上进行训练;一个是口袋预训练模型,在一个包含300万个蛋白质口袋的数据集上进行训练。此外,Uni-Mol的模型架构满足SE(3)等变性。在下游实验中,Uni-Mol不仅在先前研究过的分子性质预测任务中达到了最先进的性能,而且在与药物发现相关的一系列下游任务中表现出色,特别是那些涉及了与三维信息高度相关的任务。这些任务的例子包括高精度分子构象生成、蛋白质-配体结合构象预测和蛋白质口袋属性预测。Uni-Mol在诸如小分子性质预测、蛋白质靶点预测、蛋白质-配体复合物构象预测和量子化学性质预测等任务中表现出优越的性能和强大的泛化能力,超越了现有的解决方案。
+
+
+现在,我们鼓励选手进一步地探索采用3D分子表示框架Uni-Mol解决更多药物设计与发现具体场景的实际难题,赛题参考如下。
+
+
+- **赛题一:蛋白质靶点预测**
+
+
+药物候选物与靶蛋白之间物理相互作用的识别是药物发现中的关键环节。根据统计数据,目前关于药物-蛋白质空间的知识相当有限,因此需要新的方法来扩展我们的理解。已经发表的研究表明,蛋白质靶点预测是一个开放性问题,不仅需要新算法,还需要新的表示方法来阐明尚未探索的药物-靶点相互作用(DTI)空间和其他相关任务,典型的例子包括激酶谱预测。在初赛中,我们鼓励选手基于我们所开发的3D分子表示Uni-Mol框架提出解决方案,Uni-Mol结合了分子和口袋预训练模型,学习基于距离矩阵的评分函数,而后通过采样和优化复合物构象来实现蛋白质-配体结合的预测。
+
+
+- **赛题二:性质预测**
+
+
+分子性质预测的目标是从一组已知化合物中学习一个可泛化的模型,该模型可以应用于新的分子。这通常涉及系统地设计或选择描述符作为监督式机器学习模型训练的输入。例如,Dahl等[2]和Mayr等[3]报告了在tox21挑战数据集上应用深度神经网络(DNNs)成功进行ADMET预测。Uni-Mol也在分子性质预测这一重要任务中进行了实验,吸引了人工智能(AI)从业者的大量关注。它在各种性质和数据集上相较于最先进(SOTA)方法表现出优越的性能。在初赛中,我们鼓励选手基于Uni-Mol开发面向某一具体场景的分子性质预测模型,或者提出更优的通用解决方案。
+
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/S08Hddzo7oxsjsx6chlc4BAinEf?from=from_copylink)
+
+
diff --git a/Chinese_version/First_Round/AI4Science Application Scenario Exploration/README.md b/Chinese_version/First_Round/AI4Science Application Scenario Exploration/README.md
new file mode 100644
index 0000000..f605f44
--- /dev/null
+++ b/Chinese_version/First_Round/AI4Science Application Scenario Exploration/README.md
@@ -0,0 +1,41 @@
+# 赛题背景
+
+随着AI4Science蓬勃发展,我们看到了一系列具备巨大潜力的软件,比如**DeePMD-kit**、**ABACUS**、**DMFF**、**Uni-Mol**、**DeepFlame**等。这些软件目前已经在很多领域具备了非常令人惊叹的表现,比如DeePMD-kit成功模拟1亿原子运动,比如Uni-Mol在预测MOF材料、OLED材料性质方面优秀表现等。然而实际上AI4Science的前景远不止于此,我们认为未来大量的领域都有可能被AI4Science进行重构,而这个过程当中一定会产生一系列振奋人心的成果。
+
+
+因此在本赛道,我们鼓励各位选手们探索并延伸AI4Science在不同场景中的应用。这种探索可以是使用更先进的算法探索某个场景,比如使用AI4Science的方式探索自己的课题;也可以针对相关场景的特殊性,对相关算法进行定制化的开发,让算法适配更多的应用场景;还可以在这些基础上开发更方便用户使用的用户接口和工作流。我们一起探索AI4Science应用的种种可能性,并在这个过程中加深自己对领域知识的理解。
+
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4Science相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+
+## 1. 自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4Science相关的想法来完成。包括但不限于:
+
+
+- 场景探索:使用AI4Science的算法或软件,探索一些实际应用场景
+
+- 工作流开发类:围绕一些常见场景,开发AI4Science工作流(推荐使用dflow搭建相关工作流,但是不强制)
+
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+## 2. 参考题目
+
+- **赛题一:Uni-Mol+X:利用预训练模型探索3D分子表示学习的新应用**
+
+
+- **赛题二:dflow + X:开发AI4Science云原生工作流**
+
+
+- **赛题三:DMFF:LJ势参数调节**
+
+
+- **赛题四:DeepFlame:求解一维对冲扩散火焰**
+
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/G5IAdItjIonSi1xG8HBc6IWbnEb?from=from_copylink)**
+
+
+
diff --git a/Chinese_version/First_Round/AI4Science Evangelistic Teaching/README.md b/Chinese_version/First_Round/AI4Science Evangelistic Teaching/README.md
new file mode 100644
index 0000000..edc34f8
--- /dev/null
+++ b/Chinese_version/First_Round/AI4Science Evangelistic Teaching/README.md
@@ -0,0 +1,60 @@
+# 赛题背景
+
+近年来,我们欣喜的看到AI4Science领域取得了诸多突破性进展,例如破解蛋白质折叠难题的Alpha-Fold、高精度模拟1亿原子运动的DeePMD-kit、覆盖元素周期表的预训练模型DPA-1、刷爆多项材料和生物医药任务的大模型Uni-Mol等。我们坚信AI工具将在自然科学领域掀起新的浪潮,AI4Science科研成果将影响我们每个人的生活。令人遗憾的是,这些充满未来感的成就受制于其“阳春白雪”的科学属性,缺少了些“烟火气”,未能像ChatGPT那样进入市井人家成为茶余饭后的谈资。对此,我们诚挚的邀请各位布道者和DeepModeling社区一起,在这个盛夏,把AI4Science知识灵动起来!共同释放AI4Science无限可能!
+
+**在本赛道,我们鼓励选手们以通俗易懂的方式分享自己在Hackathon期间的学习成果,分享自己使用AI4Science软件的使用心得,分享自己对AI4Science的新见解和新思考。我们一起传递AI4Science知识,共同见证人工智能时代科研工具的升级换代!**
+
+
+## 赛题要求
+
+本赛道允许选手们脑洞大开,选择任何与AI4Science相关的创作内容,例如:
+
+
+- 先进算法的底层逻辑
+
+- 成熟AI软件的使用心得
+
+- 前沿进展和应用领域
+
+- 文献复现的辛酸历程
+
+自己对AI4Science的思考和实践
+
+
+**我们鼓励各种内容创作形式,包括但不限于:**
+
+
+- Notebook笔记
+
+- Bilibili科普视频
+
+- 知乎优质文章
+
+- 小红书文献复现日记
+
+
+**本赛道不为选手们的想象力划定任何边界!我们将综合考量作品的科学属性、创新性和潜在传播力等。**
+为了让各位同学对此赛道有更多创意,下面给大家一些选题方向和形式的建议,以抛砖引玉。
+
+
+
+- **方向一:学习知识“跑”起来**
+
+AI4Science的学习需要一个强大且易于上手的工具。对此,我们于今年5月份发布了Notebook案例广场,创新性的将交互式编程环境纳入Bohrium科研平台中,为AI4Science初学者带来了全新的学习体验。短短两个月过去,Notebook案例广场上已经汇聚了分子动力学、深度学习、化学和生物信息学、材料计算和图像表征等几百个优秀案例。本方向鼓励大家在Notebook上动手体验前沿AI4Science模型,动手记录AI4Science心得,动手实践AI4Science创意,让学习知识“跑”起来!
+
+- **方向二:社区教程“写”出来**
+
+DeepModeling社区的发展让越来越多的老师、同学有社区软件的学习需求。比如DeePMD-kit、ABACUS、DMFF、DeepFlame相关社群里有大量的老师同学针对相关问题进行讨论。微信群里面的讨论固然是一个好的学习手段,但为了更多人能够看到,我们更鼓励大家共同建设社区学习文档,将自己学习和科研的心得落实到学习文档上让更多的人能够学习,能够看到。本方向鼓励大家将自己过去(或正在)学习使用相关社区软件产生的案例变成文字资料,一方面撰写资料的过程有助于自己整理思路,另一方面也可以方便更多的人跟着学习。
+
+- **方向三:精彩内容“讲”出来**
+
+随着AI4Science一个个激动人心的成果出现,相关知识的学习需求越来越迫切。一方面年轻的同学们迫切希望有人能够将AI4Science相关知识传授给自己;另一方面公众也希望从科普的角度了解AI4Science的前世今生。本方向鼓励大家以课程视频的形式讲授AI4Science相关课程,清楚的将AI4Science的精彩内容“讲”出来!
+
+- **方向四:知识传播“酷”起来**
+
+
+当今庞大的内容市场中早已涌现出一批优秀的科普作品。例如,毕导、何同学“理论+实践”的创作思路,Procreate等绘画工具,3Blue1Brown开发的Manim可视化工具也被用来制作视频科普。在AI4Science领域,除了上述Notebook笔记工具,有人尝试将分子世界和VR、游戏引擎(Unity)相结合,充满了科技感!总之,本方向鼓励内容生产者利用丰富的内容创作经验和炫酷的可视化技术将AI4Science酷起来!
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/Rl03dnIqqomF0Fx8FjgcVhnonRd?from=from_copylink)**
+
+
diff --git a/Chinese_version/First_Round/AI4Science Hardcore Software Development/README-en.md b/Chinese_version/First_Round/AI4Science Hardcore Software Development/README-en.md
new file mode 100644
index 0000000..5693600
--- /dev/null
+++ b/Chinese_version/First_Round/AI4Science Hardcore Software Development/README-en.md
@@ -0,0 +1,61 @@
+# Background of the question
+
+AI4Science hardcore software development track is co-hosted by the DeepModeling open source community, Peking University Supercomputing Team, and Peking University Linux Club. The track encourages competitors to actively participate in the development of AI4Science's own tools. Students interested in high performance can perform high-performance optimization of specified software; Students interested in AI can reconstruct certain networks. Or maybe you find something else in the software that you want to improve on – in short, everything related to AI4Science is encouraged here!
+
+
+
+**This track is divided into two parts: free proposition and fixed proposition. We especially encourage everyone to do free propositions, as long as any ideas related to AI4Science hardcore software development are very welcome; Of course, if you are overwhelmed by free propositions, you can also participate in the fixed proposition track and exert your creativity and talent under the designated proposition.**
+
+
+
+## Free proposition
+
+Runners on this track have full creative freedom and can choose any ideas related to AI4Science hardcore software development. Including but not limited to:
+
+- **DeepModeling open source community software high-performance optimization**: Players can freely browse DeepModeling open source community related software and perform high-performance optimization for the parts they are interested in
+
+- **DeepModeling Open Source Community Software Development**: Contestants can freely browse DeepModeling open source community software and develop things they are interested in. If you are not sure how to start, you are encouraged to check the relevant issues in the community project and solve the problems in the issues
+
+
+Runners who choose this track need to submit their own proposals in the preliminary stage to describe their ideas and initially confirm the feasibility of the idea (the judging team will also give some constructive guidance suggestions to facilitate better implementation).
+
+
+
+## Specify the question
+
+**Question 1: High-performance cross-platform neighbor table algorithm implementation**
+
+
+- Neighborlist is of great significance in computational chemistry and has important applications in first-principles calculations, molecular dynamics simulation, and other fields. A proximity table is a data structure used to represent local relationships or proximity relationships between objects, records the indexes of adjacent particles within a certain truncation radius, and dynamically updates with the movement of atoms during simulation.Therefore, both the calculation of short-range interactions and the statistics of local structural properties directly depend on the proximity table. Therefore, the advantages and disadvantages of the algorithm established by the adjacent table will significantly affect the computing efficiency. We have come to realize that different scientific computing projects have common neighbor table requirements and can be abstracted into algorithms with explicit inputs and outputs. In addition, due to the complexity and specificity of scientific software, programs not only rely strongly on GPUs like deep learning frameworks, but also need to run on heterogeneous acceleration platforms of various architectures. Can we abstract the adjacent table and highly optimize it to form a highly optimized library from Python, C to CUDA, from x86, ARM to various heterogeneous acceleration platforms, so as to reduce repetitive development.
+
+
+- Affected by the characteristics of computer hardware architecture, the implementation and performance of the adjacent table algorithm on different hardware platforms are significantly different. Therefore, when designing and optimizing the proximity table algorithm, specific implementations and optimizations must be made for various computer hardware architectures.In addition, the properties of simulated systems vary greatly, such as system size (from small to large systems), density distribution (from sparse to uniformly dense), and spatial distribution (from uniform to locally dense). Based on the characteristics of these different simulation systems, it is necessary to consider various factors when designing the adjacent table algorithm and optimization strategy to ensure the efficient performance of the algorithm in various scenarios.
+
+
+**Question 2: ABACUS**
+
+
+- ABACUS is a high-performance density functional theory (DFT) software widely used in materials science calculations. In order to fully exploit its performance potential in real production applications, this competition aims to identify and optimize performance bottlenecks in software to improve computing efficiency, save computing resources and accelerate scientific research processes.
+
+
+- ABACUS supports two different base groups, plane wave (PW) and numerical atomic orbital (LCAO), players need to study two different bases for a given (1. LCAO Base Group Study, 2. PW Base Group Study) to analyze performance hotspots and perform performance optimization freely.
+
+
+**Question 3: Long-range electrostatic action algorithm of point charge with automatic differentiation**
+
+- In systems under periodic boundary conditions, the proximity table method cannot effectively handle long-range electrostatic interactions due to the limitation of the minimum mirror convention. To solve this problem, the researchers developed long-range interaction algorithms such as Ewald, PME, PPPM, and others. As systems scale, it becomes important to optimize existing algorithms and develop new ones.In physics-based molecular force field DMFF, we treat various physical force fields and simulated computational flows as natural extensions of artificial intelligence models, using first-principles or experimental data as inputs, and using advanced machine learning algorithms to reverse correct and optimize physical model parameters. The key to achieving this is the automatic differentiation capability of the code. Therefore, under the premise of ensuring the automatic differentiation function, how to realize the efficient and advanced long-range electrostatic action algorithm has become an urgent problem to be solved.
+
+
+**Question 4: DeepFlame—Neural network training for thermodynamic functions and transport parameters**
+
+- In combustion simulations, calculations to update thermodynamic states and transport parameters are a key step. In engineering applications, processes such as incident of working fluids, mixing, and combustion occur at least partially in a transcritical or supercritical state, which may render the ideal gas model commonly used in combustion simulations no longer applicable.Although the accuracy of combustion simulations can be improved by introducing formally more complex real fluid models, this will lead to an increase in simulation complexity and a significant increase in computation, and quantitatively, updating thermodynamic functions and transport parameters with real gas models will take up 50% to 75% of the total calculation time of the large eddy simulation.
+
+
+**Question 5: DeepFlame—DeepFGM framework**
+
+- Flamelet Generated Model (FGM) is a combustion model that uses precomputed flames to represent the structure of flames in turbulent reactive streams. It provides an efficient calculation method for simulating complex combustion processes and is widely used in CFD simulation of combustion systems. Using the FGM model requires flame surface data calculated based on lookup tables.However, when there are many reaction components, and as the dimension of the variable increases, the memory occupied by the table used for calculation will be very large. DeepFGM, a turbulent combustion integral (TCI) model included in DeepFlame, will generate a tailored neural network based on every physical quantity used in the calculations in the table, ultimately reducing the overall memory footprint.
+
+[Click here for detailed content] (https://dptechnology.feishu.cn/docx/QGfHdUHrEowMi4xYkJuchN9Rnbh?from=from_copylink)
+
+
+
diff --git a/Chinese_version/First_Round/AI4Science Hardcore Software Development/README.md b/Chinese_version/First_Round/AI4Science Hardcore Software Development/README.md
new file mode 100644
index 0000000..394a1e3
--- /dev/null
+++ b/Chinese_version/First_Round/AI4Science Hardcore Software Development/README.md
@@ -0,0 +1,66 @@
+# 赛题背景
+
+AI4Science硬核软件开发赛道由DeepModeling开源社区、北京大学超算队、北京大学Linux俱乐部联合主办。本赛道鼓励选手积极参与到AI4Science本身的工具开发中。对高性能感兴趣的同学可以对指定软件进行高性能优化;对AI感兴趣的同学可以针对某些网络进行重构。又或者你发现软件中还有一些别的问题你想要改进——总之只要是和AI4Science有关的一切软件开发在这里都被鼓励!
+
+
+
+**本赛道赛题分为自由命题和固定命题两个部分。我们特别鼓励大家做自由命题,只要和AI4Science硬核软件开发相关的任何创意都非常欢迎;当然如果大家对自由命题不知所措,也可以参与固定命题赛道,在指定的命题下发挥自己的创意与才华。**
+
+
+
+## 自由命题
+
+本赛道的选手拥有充分的创意自由,可以选择任意和AI4Science硬核软件开发相关的想法来完成。包括但不限于:
+
+
+- DeepModeling开源社区软件高性能优化:选手可以自由浏览DeepModeling开源社区相关软件,并对自己感兴趣的部分进行高性能优化
+
+- DeepModeling开源社区软件开发:选手可以自由浏览DeepModeling开源社区相关软件,并对自己感兴趣的事情进行开发。如果不确定如何下手,优先鼓励大家查看社区项目里面的相关issue,解决issue里面的问题
+
+
+选择这个赛道的选手,需要在初赛阶段提交自己的proposal来描述自己的想法并初步证实该想法可行性(评审组也会给出一些建设性的指导建议,方便更好的实现)。
+
+
+
+## 指定赛题
+
+**赛题一:高性能跨平台的邻近表算法实现**
+
+
+- 邻近表(Neighborlist)在计算化学中具有重要意义,在第一性原理计算、分子动力学模拟等领域都有重要的应用。邻近表是一种用于表示对象之间的局部关系或邻近关系的数据结构,记录了在一定截断半径范围内相邻粒子的索引,并在模拟过程中随原子的运动而动态更新。因此,无论是近程相互作用的计算,还是局域的结构性质的统计都直接依赖于邻近表。因此,临近表建立的算法优劣将显著影响计算效率。我们逐渐意识到,在不同的科学计算项目中都有共同的邻近表需求,并且可以抽象为具有明确输入与输出的算法。此外,由于科学软件的复杂性和特殊性,程序不仅仅像深度学习框架一样强烈地依赖于GPU,而且需要运行在各种架构且异构的加速平台上。我们是否可以将邻近表抽象出来并进行高度优化,形成从python、c++到cuda,从x86、arm到各种异构加速平台全覆盖的高度优化的库,从而减少重复地开发。
+
+
+- 受计算机硬件架构特性的影响,邻近表算法在不同硬件平台上的实现和性能表现存在显著差异。因此,在设计和优化邻近表算法时,必须针对各种计算机硬件架构进行特定的实现和优化。此外,模拟体系的性质也存在很大差异,如体系规模(从小型到大型体系)、密度分布(从稀疏到均匀密集)以及空间分布(从均匀到局部稠密)。基于这些不同的模拟体系特点,设计邻近表算法和优化策略时需要综合考虑各种因素,以确保算法在各种场景下的高效性能表现。
+
+**赛题二:ABACUS**
+
+
+- ABACUS是一款广泛应用于材料科学计算的高性能密度泛函理论(DFT)软件。为了充分发挥其在实际生产应用中的性能潜力,本赛题旨在挖掘并优化软件中的性能瓶颈,从而提高计算效率、节省计算资源并加速科研进程。
+
+
+- ABACUS支持平面波(PW)和数值原子轨道(LCAO)两种不同的基组,选手们需要在对给定的两个算例(1. LCAO基组算例,2. PW基组算例)进行性能热点分析,并自由进行性能优化。
+
+
+**赛题三:可自动微分的点电荷长程静电作用算法**
+
+- 在周期性边界条件下的系统中,由于最小镜像约定的限制,邻近表方法不能有效处理长程静电相互作用。为了解决这个问题,研究人员发展了诸如Ewald、PME、PPPM等长程相互作用算法。随着系统规模的扩大,优化现有算法和开发新算法变得非常重要。在基于物理的分子力场DMFF中,我们将各种物理力场和模拟计算流视为人工智能模型的自然延伸,以第一性原理或实验数据为输入,采用先进机器学习算法反向矫正和优化物理模型参数。实现这一目标的关键是代码的自动微分功能。因此,在保证自动微分功能的前提下,如何实现高效且先进的长程静电作用算法成为一个亟待解决的问题。
+
+
+**赛题四:DeepFlame—热力学函数和输运参数的神经网络训练**
+
+
+- 在燃烧模拟中,计算更新热力学状态和输运参数是关键的一步。在工程应用中,工质入射、混合和燃烧等过程至少部分发生在跨临界或超临界状态下,可能导致燃烧模拟中常用的理想气体模型不再适用。尽管可以通过引入形式上更复杂的真实流体模型以提高燃烧模拟的准确性,但将导致模拟复杂度的增加和计算量的显著增加,定量来看,使用真实气体模型更新热力学函数和输运参数将会占用大涡模拟总计算时长的50%到75%。
+
+
+**赛题五:DeepFlame—DeepFGM框架**
+
+
+- Flamelet Generated Model(FGM)是一种使用预先计算的火焰来表示湍流反应流中火焰结构的燃烧模型。它为模拟复杂燃烧过程提供了一种高效的计算方式,并且被广泛应用在燃烧系统的CFD模拟。使用FGM模型需要基于查表计算而来的火焰面数据。然而,当又众多的反应组分,且随着变量的维度提升,用于计算的表所占用的内存将会十分巨大。DeepFGM,一种在DeepFlame里包含的湍流燃烧积分(TCI)模型,将会根据表中计算用到的每一个物理量生成量身定制的神经网络,最终减少整体的内存占用。
+
+
+
+
+
+**[点击此处即可查看详细赛题内容](https://dptechnology.feishu.cn/docx/QGfHdUHrEowMi4xYkJuchN9Rnbh?from=from_copylink)**
+
+
diff --git a/Chinese_version/README.md b/Chinese_version/README.md
new file mode 100644
index 0000000..6d05123
--- /dev/null
+++ b/Chinese_version/README.md
@@ -0,0 +1,122 @@
+# 欢迎来的DeepModeling Hackathon 3.0!
+
+## 活动介绍
+
+第三届DeepModeling Hackathon大赛北京科学智能研究院(AI for Science Institute, Beijing)与北京深势科技有限公司联合举办([详情请点击这里](https://mp.weixin.qq.com/s?__biz=MzUxMDQwOTk4MA==&mid=2247497497&idx=1&sn=97499acbc2388e7ef7c6498b2caa89e1&chksm=f901da8ace76539ccea1fe3ed2b6f759fd22b1591ef8249a8f5ce2a278144334c91dc25a13bc&scene=21#wechat_redirect))。
+
+现在我们带着最大的诚意邀请所有人参与DeepModeling社区第三届Hackathon:
+
+- 在这里,你所有和AI4Science有关的创意将被鼓励与珍视;
+
+- 在这里,你可以聆听领域内经验丰富的导师的耐心指导;
+
+- 在这里,你可以和一群志同道合且充满激情的伙伴并肩作战;
+
+- 在这里,你可以完成你最期待的挑战;
+
+我们提供20万的奖金池,赛场往返的车票,亦可线上参与;
+
+我们准备好了一切,期待与你一起共同释放AI4Science的无限可能!
+
+## 参与要求
+
+
+简单来说,我们欢迎一切对AI4Science感兴趣的老师和同学。
+
+具体来说:
+
+- 如果你对AI4Science的应用场景感兴趣,我们欢迎你使用最新的AI4Science工具探索任何你想要探索的场景,解决过去经典方法不好解决的问题;也欢迎你基于特定场景为AI4Science相关工具开发更好用的用户接口和工作流。
+
+- 如果你对AI4Science底层算法原理、相关模型构建感兴趣,我们欢迎你提出自己的想法和我们交流,改进现有软件或者构建你自己的软件
+
+- 如果你对高性能优化感兴趣,我们欢迎你大胆尝试,亲手释放软件与硬件的无限潜能
+
+- 如果你对分享与传播知识感兴趣,我们欢迎你采用创新的方式来传播相关知识与理念,将AI4Science传播给更多人
+
+最后,如果你对AI4Science感兴趣,但是并不确定自己能做什么,甚至不确定自己能力是否足够,我们依然强烈鼓励你先报名进来跟着大家一起讨论学习。兴趣是最好的老师,实战是最快的学习方式,在这里一定会找到你能发挥自己热情和特长的赛道,共同探索AI4Science的星辰大海。
+
+## 赛道介绍
+
+本次Hackathon我们鼓励一切和AI4Science有关的想法、探索与实践。针对不同的主题,本次Hackathon设置了5大赛道:
+
+**AI4Science应用场景探索(北京)**:本赛道鼓励选手以AI4Science相关软件为工具,探索自己想要探索的场景。选手可以使用AI4Science相关工具助力自己的课题研究,比如使用Uni-Mol筛选活性分子、使用DPA-1进行小分子的构象探索、使用DMFF修正官能团间的相互作用、使用DeepFlame探索湍流与燃烧相互作用机制;也可以针对指定场景开发定制化工作流、方便好用的用户接口等。只要是和AI4Science有关的一切应用探索在这里都被鼓励!
+
+**AI4Science硬核软件开发(北京)**:本赛道由DeepModeling开源社区、北京大学超算队、北京大学Linux俱乐部联合主办。本赛道鼓励选手积极参与到AI4Science本身的工具开发中。对高性能感兴趣的同学可以对指定软件进行高性能优化;对AI感兴趣的同学可以针对某些网络进行重构。又或者你发现软件中还有一些别的问题你想要改进——总之只要是和AI4Science有关的一切软件开发在这里都被鼓励!
+
+**AI for 生物医药(上海)**:本赛道鼓励选手针对生物医药领域普遍关心的问题,使用AI4Science相关软件工具尝试解决。希望选手能够可以针对生物医药领域中目前已有的应用场景提出解决方案,如各种性质预测,靶标预测,结合模式探究及分子生成等实际场景;同时鼓励选手尝试使用不同软件与工具,比如Uni-Mol深入探索某个领域——总之只要是和AI4Science与生物医药有关的一切探索在这里都被鼓励!
+
+**AI for ElectroChemistry(厦门)**:本赛道由DeepModeling开源社区、嘉庚创新实验室人工智能应用电化学联合实验室(AI4EC)联合主办,旨在鼓励希望探索各类电池领域相关材料的电化学性质的选手,运用AI4Science相关软件工具,用于开发针对某一体系,或某一环境下,诸如材料氧化还原电位、反应自由能变等性质计算的工作流;也可以用于解决某一特定的问题,总之,如果你渴望用材料来不断定义能源,欢迎你加入AI for Electrochemistry的探索之旅。
+
+**AI4Science布道(北京)**:本赛道鼓励选手采用创新的方式向他人传播AI4Science相关知识和理念。讲解内容可以是AI4Science某个前沿论文,可以是自己的科研成果,也可以是有趣的科普知识;形式可以考虑课程视频、Bohrium Notebook案例,wikipedia或者更灵活的短视频、小红书等等——总之,只要是和AI4Science有关的一切理念传播在这里都被鼓励!
+
+以上是Hackathon总体赛道分类,大家所有和AI4Science有关的创意都被欢迎。
+
+## 赛制介绍
+
+为了最大限度鼓励大家在Hackathon中快速学习相关知识,主动发挥创新精神,本次Hackathon设置初赛和决赛,采用组队制,具体如下:
+
+- 初赛:
+
+ - 形式:线上参与
+
+ - 以学员学习为主,在我们帮助下快速学习和掌握AI4Science相关知识与软件技能,为决赛做好准备
+
+- 决赛:
+
+ - 形式:允许线上,但是更鼓励线下共同探索交流(进入决赛选手报销线下到相关赛场来回车票)
+
+ - 以创新和挑战为主,完成自选或者指定的Hackathon相关挑战
+
+- 允许组队,每队1-2人(仅队长填写报名问卷即可)
+
+## 时间安排
+
+DeepModeling社区第三届Hackathon将于6月27日开始报名,7月8日正式开始。比赛将于8月6日进行决赛评比,并于8月10日暨第二届科学智能峰会现场进行颁奖。具体时间安排如下:
+
+Hackathon宣讲、组队、报名时间:**6月27日-7月7日**
+
+Hackathon初赛:**7月8日-7月14日**
+
+初赛结果公布:**7月15日-7月16日**
+
+Hackathon决赛:**7月17日-8月5日**
+
+决赛答辩:**8月6日-8月7日**
+
+Hackathon颁奖:**8月10日**
+
+ (具体时间可能会根据实际情况灵活调整)
+
+## 具体赛题
+
+#### 初赛赛题
+
+#### 1. AI4Science应用场景探索赛道: [详细内容点击此处](https://dptechnology.feishu.cn/docx/G5IAdItjIonSi1xG8HBc6IWbnEb?from=from_copylink)
+
+
+#### 2. AI4Science硬核软件开发: [详细内容点击此处](https://dptechnology.feishu.cn/docx/QGfHdUHrEowMi4xYkJuchN9Rnbh?from=from_copylink)
+
+
+#### 3. AI for 生物医药: [详细内容点击此处](https://dptechnology.feishu.cn/docx/S08Hddzo7oxsjsx6chlc4BAinEf?from=from_copylink)
+
+
+#### 4. AI for ElectroChemistry: [详细内容点击此处](https://dptechnology.feishu.cn/docx/UJIwdMKf6oMhMjxRQcfciR8onyc?from=from_copylink)
+
+
+#### 5. AI4Science布道: [详细内容点击此处](https://dptechnology.feishu.cn/docx/Rl03dnIqqomF0Fx8FjgcVhnonRd)
+
+
+## 参与方式
+
+1. 扫描二维码加入Hackathon交流群,欢迎在群里交流一切Hackathon相关的问题。(请务必入群,后续通知都将在群内进行)
+
+
+
+如果二维码无法加入,可扫码添加深度势能小编微信:deeppotential,小编会手动拉你入群)
+
+3. 请大家选择好赛道后,请在7月8日前扫描下方二维码,填写问卷报名。
+
+
+
+
+