AI tokamak tutorial
研究方向
AI + 托卡马克,包括数据、控制和物理模拟加速等多个方面。参考链接。
|
教材和书本
下列课程不分先后顺序,也可以当工具书查阅
- 磁约束等离子体实验物理,科学出版社,王龙
- 托卡马克第四版,清华大学出版社,王文浩译
- Dive into deep learning - author Mu Li
- B站视频,跟着李沐学AI - author Mu Li https://space.bilibili.com/1567748478
- 强化学习 - EasyRL https://datawhalechina.github.io/easy-rl
- https://www.deeplearningbook.org/ - MIT deep learning book
- 吴恩达机器学习课程,https://space.bilibili.com/3493134768016008
其他理论知识
- 时间序列分析, https://www.math.pku.edu.cn/teachers/lidf/course/atsa/atsanotes/html/_atsanotes/index.html (较为理论,可能部分看不懂)
- 基本机器学习算法可视化和公式讲解,即 scikit-learn 的文档,https://scikit-learn.org/stable/
预备知识
基础知识
- 使用 Google,Chat-GPT 等,具备顺畅访问 Google 和 Chat-GPT 的能力
- Linux 和 GIT 的基本操作,其中不掌握任何Linux基础知识的,可以先用 WSL2 熟悉。特别是其中 ssh 公钥和私玥的使用方法
- 所谓WSL,即 Windows Subsystem for Linux 官方安装教程:https://learn.microsoft.com/en-us/windows/wsl/install
- Linux 需要了解
LIBRARY_PATH, LD_LIBRARY_PATH, PATH, INCLUDE, MANPATH,这5个环境变量的使用方法 - An interactive Git visualization tool to learn concept
- 机器学习模型搭建的基本操作,
- 最低要求熟练跑通 Torch 官方 DistributedDataParallel 中的 “nccl” 和 “gloo” 即 GPU 和 CPU 的训练后端。
- Python + numpy + pandas + h5py + PyTorch + matplotlib + jupyter + VScode 的熟练运用
- 熟读提问的智慧,之后再提问,特别注意不着编边际的问题。
- 简单而言,先中文搜索,然后英文搜索,deepseek chat-GPT,claude 等全部都搜一遍。如果还是无法解决再在群里提问,或者找师兄师姐们,最后再去问老师。
- 如果花了 5 天以上的时间搞不定,那就还是去问问人。
账号开通列表
- 等离子体物理研究所邮箱 - 询问自己室的秘书
- 开通新神马和老神马账号,特别是要开通新神马 DCU 权限 - 刘晓娟老师负责
- EAST 账号 Link - 王枫老师管理
- 加入小组 WPS 共享资料库
- 生成 ed25519 算法的 ssh 公钥, 上传到
共享资料库/Storage/ssh/组内公钥.docx生成方法
ssh-keygen -t ed25519 -C "<yourname>"
代码和配置类问题解决方案
- 百度,Google,GPT全都搞一遍,特别是要注意给问题翻译成英文去搜一搜
- 测试多种网络环境,不同账号是否有问题
- 提供可能的问题来源,比如log等。比如最小复现方法。
- 总结来说:先自己尝试解决,解决不了,就给问题化简到别人能最小复现的版本,然后再提问。提问的话,先尝试找师兄师姐等同学,然后再找老师。
常用链接
链接打不开
- 缺乏相关账号,请回到开通账号
- 没有在内网,请使用 vpn, 或者 WebVPN
常用链接
- http://202.127.204.41:8080/udaclient/ 一个 web 版的图形化 EAST 参数访问用户端
- EAST logbook
- EAST 常用物理参数列表
- EAST 账号密码重置
- 合肥物质科学研究院 WebVPN
- Fusion Wiki 基本的tokamak 概念定义
- Fusion 术语表
- 简单的公用服务器教程
代码开发
- 工具链:Conda + Pytorch ( >= 2.4 推荐 latest stable version ) + Python >= 3.9 (推荐3.12)。PS:目前 Conda 对于组织已经不是免费的了,后续会逐步迁移至x miniforge, miniforge 用法和 conda 一样,只是是完全基于开源社区的。
- 数据库目前是基于 HDF5 的内部数据库
- 代码风格见 开发规范。
- 内部 private_modules 包,有很多常用的数据操作方法,请不要分享。具体使用方法可以咨询王明龙
MDSplus 数据库读取的简略方法 - Python
- 安装 https://github.com/MDSplus/mdsthin
- 参考 GitHub 中的相关教程。其中用 with statement 是推荐方法,因为自动关闭 Connections 可以节省 MDSplus 数据库的 TCP 连接资源。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import mdsthin
def mdsthin_get(shot, tree_name, node_name, server_name='mds.ipp.ac.cn'):
node_name = rf'\{node_name}'
with mdsthin.Connection(server_name) as c:
c.openTree(tree_name, shot)
node_data = c.get(node_name).data()
node_time = c.get(f'dim_of({node_name})').data()
# c.disconnect() will be called automatically
return node_data, node_time
shot = 100000
tree_name = 'east'
node_name = 'ipm'
server_name = 'mds.ipp.ac.cn'
mdsthin_get(shot, tree_name, node_name, server_name)
EAST的数据使用和相关的数据库位置
- 请不要用 python 脚本读取MDS+数据库。虽然我们内部的有相对应的数据读取方法,但是这个会影响到 EAST 正常实验的进行。如果需要使用,请一定要征得 chenguang.wan 的同意
- 数据库所有的数据请不要进行除读数据外的任何操作。误删会影响所有人的工作
数据库使用方法
- 新神马服务器数据
/data/share/chenguang_wan/DataBase,该数据库支持高 IO 的数据访问,可以使用 Python 高 IO 的读取 - 具体使用教程可以询问:王明龙和卢敬敬
论文撰写和文献管理相关
论文署名
下面署名一个标点符号都不能错
中文名:中国科学院合肥物质科学研究院等离子体物理研究所,合肥 230031,中国
英文名:Institute of Plasma Physics, Hefei Institutes of Physical Science, Chinese Academy of Sciences, Hefei 230031, China
中文名:中国科学技术大学,合肥 230026,中国
英文名:University of Science and Technology of China, Hefei 230026, China
满足毕业条件后,建议将署名的第一单位改为合肥物质科学研究院,这样的话,不仅可以拿到科研奖励,对于未来的职业发展也有帮助。
用到EAST数据,需要在作者名列表中加上 EAST team, 其中 EAST team 的 affiliation 是 Institute of Plasma Physics, Hefei Institutes of Physical Science, Chinese Academy of Sciences, Hefei 230031, China
软件和 LyX 模板等
- 文献管理 – 使用 Zotero
- 使用Better BibTex 插件导出
.bib文件,其中需要添加自定义配置以实现规范的Citation Keys, 设置 Edit -> Settings -> Better BibTex -> Citation keys和Active citation key formula 均设置为:auth(0,1,author,false).capitalize+year - 可使用Better Notes 插件实现基于markdown的笔记功能
- Zotero 可以配置 WebDav / Sync Disk 以实现跨端同步文件和笔记的功能
- WebDav 配置可以参考中国科技云webdav支持
- 使用Better BibTex 插件导出
- 论文撰写 – 使用 Lyx 2.4.x 版本 + latex 最新版 + IOP 模板,如果以使用高版本的 Lyx 编写文档,可以用高版本自带的导出功能将文档导出成兼容 2.4.x 版本的形式,具体方法见下图
- IOP 模板下载位置:https://www.kdocs.cn/l/cbc9uJBTrkSa,IOP 模板安装方法 https://www.cnblogs.com/freedom-wan/p/13429879.html
- Nuclear Fusion 相关 lyx 模板,请基于该模板进行撰写,该模板的格式更加优美,能让审稿人看的更爽,下载链接 https://www.kdocs.cn/l/ccj2tevnX0Tl
论文排版技巧
- 所有的图片,除非没有 pdf 版本的图片,否则的话全都使用 pdf 矢量图。
- 如果喜欢 latex overleaf, 建议使用 中国科技云 overleaf 共享网站 https://latex.cstcloud.cn/project。
- ChatGPT 新 LaTex 工具: prism.openai.com 支持协作,用起来也很好。
- 其他格式 一般按照 Nuclear Fusion 格式,特别注意文献引用和图表引用
- 最好保证自己的英文论文能用 pdflatex 编译不出错,这样才是各类英文期刊比较容易通过的格式
论文撰写
- 投稿之前一定要让”Chenguang Wan@chenguang.wan@ipp.ac.cn”确认作者列表,这个十分重要!!!
- 如果合适的话,在论文投稿之前,最好写一个 专利和软著
- 论文投稿之前,需要在 pinboard 上 公示,公示方法参考
- 基本流程:论文初稿 → 专利 → 软著→ 投稿,专利的申请日要在论文发表日之前。
- 所有论文全都用我的账号投稿,这样我能最快的和编辑沟通。(惨痛经验可以详询 Minglong Wang)
论文撰写其他需要注意的细节
- 不要中英文标点混排,因为半角和全角符号的处理方式不一样,容易出现很奇怪的错误。比较容易出错的有:中文:”()”, 和英文 “(),”, 即括号,逗号,句号,引号。
~ 是 \sim 而不是直接敲 ~.bib文件, Key 最好以 author-FirstName.capitalize+year, 姓首字母大写 + 年份,如果重复的话,即后面缀上 a,b,c 用以区别。即Wan2025c这种格式- 最好每个参考文献都有 doi,没有 doi 的时候最好有 url,而且只能出现一个链接,doi 优先,没有 doi 再选择其他链接。
论文致谢
这个部分非常重要,关系到科研项目是否能顺利结项。
- 如果用到EAST数据需要添加下列语句:
We thank the staff members at EAST in Hefei (https://cstr.cn/31130.02.EAST ), for providing technical support and assistance in data collection and analysis.
- 其次对于所有在本论文中帮助过你的人,但是不在论文作者中,需要在致谢部分给出
- 项目致谢,这部分需要让 chenguang.wan@ipp.ac.cn 确认
可投期刊推荐
一区 TOP 类可投
- Nature Machine Intelligence: 这个比较简单,目测是很容易拿下的子刊
- Nature Physics
- Nature Energy
- Nature Communications
- Communications Physics:该期刊一般是 Nature Communication 投不中的选择
- Cell Reports Physical Science
- Nuclear Fusion,其中有 Nuclear Fusion Letter,Letter 属于 NF 中比较重要的文章。
- Nature Machine Intelligence
- The Innovation (Cell Press)
- Journal of Fusion Energy
- Science Advance:和 NC 类似
二区期刊可投
- Nuclear Materials and Energy
- NUCLEAR ENGINEERING AND DESIGN
- PPCF
纯 AI 领域
- NeurIPS, AI for Science Workshop
- ICLR,ICML,AAAI, AI for Science
可投水刊列表
- IEEE Transactions on Nuclear Science
- Fusion Engineering and Design
- IEEE Transactions on Plasma Science
推荐审稿人列表
论文中建议给下列论文,全都引用一遍
管理要求
- 所有组内同学,必须按照一周一次的频率发送周总结报告,具体方式参见组群
- 保持邮件畅通,在手机上安装相应的邮件程序。包括论文、会议等学术活动的通知大多使用邮件。PS: 中科院邮件客户端设置教程
其他说明
- 如果有部分链接无法打开,如果你不是小组成员,这部分内容不共享。如果你是小组成员,请联系 chgwan 加入到小组内部共享列表, 加入之前麻烦给 wps 用户名改成真实姓名,用以方便追踪。
- RSS订阅列表,方便及时追踪最新通知
中国科技云
链接:https://www.cstcloud.cn/
开通等所邮件之后,就有科技云的访问权限了。科技云可用来 Latex 协作,免费的 webdav 支持,免费的开源镜像服务。有兴趣可以了解一下使用方法。
