“响鼓不用重锤”
本学期讨论班以论文、专著汇报为主, 集中在机器学习(优化算法)、单细胞组学分析、病理图像分析三方面.
关于如何做论文汇报, 请参考李沐B站视频.
如何找论文: 建议使用Google搜索: 主题词、关键字(英文), 善用LLMs(chatgpt, DeepSeek等)
吴恩达:关于机器学习职业生涯以及阅读论文的一些建议 [必看视频!!!]
- 选择论文的非客观标准
- 论文是否近5年发表(虽然有一些经典论文是较早之前发表的, 但是可能要深入了解某一个主题才能挖掘得到).
- 论文是否发表于重要的期刊或会议(虽然有一些重要论文发表在质量较低的期刊, 高质量期刊也有质量较低的论文, 但新手应该用一个简单的准则来判断论文水准).
- 选择论文的客观标准
- 论文多如海水, 阅读论文应十分聚焦于同一个研究主题上, 即使有一些论文研究主题相近或自己感兴趣, 也应弃之. 放弃需要智慧, 而接受只需盲目努力.
- 提供Github代码的应该优先考虑, 容易上手、理解.
- 建议就某一个期刊或会议同一年份同一主题的研究论文入手.
- 阅读论文除了正文内容还应该关注
- 论文作者: 看看能不能找到论文第一作者或通讯作者的主页, 找找他们的发表记录, 对于一些领域内资深的研究者, 往往会有意外的发现, 他们通常会就同一个研究主题发表一系列的工作, 这也是找论文的一种方式.
- 对比方法: 从多篇论文的对比方法中可以找到共同的对比方法, 那一般是同一问题的影响比较大的方法.
- 参考文献: 从参考文献的标题中也能找到同一主题的论文.
- 不同论文的联系: 不同的论文各自侧重哪一方面; 是否有它们都忽略了的地方; A论文的方法能否解决B论文存在的问题等等, 这往往是研究想法开始的地方.
- 精读过的论文应该做好笔记: 内容应该简短、精要, 以能回忆起关键内容、架构为主, 方便联系已经读过的论文.
- 机器学习论文以三大会论文为主(ICML/NeuraIPS/ICLR)
- 往年ICML的论文集: https://proceedings.mlr.press
- 往年NeuraIPS的论文集: https://papers.nips.cc
- 往年ICLR的论文集: https://openreview.net/group?id=ICLR.cc
- 医学图像期刊及会议
- 生物信息学期刊
关于论文阅读的工具: 重要、前沿的论文基本都是发表在英文刊物、会议上, 目前已经有较多的论文阅读工具辅助翻译、找到论文重点, 但应该注意工具只是起到辅助作用, 还是应该以自身求证、理解为主.
- Aminer(https://www.aminer.cn)
最好已经修读过《机器学习》(B站上有台大李宏毅的机器学习视频课或者吴恩达的课程)、《最优化方法》.下面列出一些必要的阅读章节, 但这并不意味必须读完这些材料才能展开研究, 书籍的作用大多时候是字典.
- 邱锡鹏. 神经网络与深度学习, 2021.
- 第一章: P6-P11。
- 第二章:P22-P37。理解机器学习三要素、了解线性回归的例子。
- 第四章:4.1神经元、4.3前馈神经网络、4.4反向传播算法(先跳过数学推导,理解原理即可)
- 刘浩洋, 户将, 李勇锋,文再文,最优化:建模、算法与理论(第二版), 高教出版社
- 第一章 最优化简介
- 第二章 基础知识
- 我主讲的研究生课程《最优化方法》
- 邱锡鹏. 神经网络与深度学习, 2021.
研究方向涉及较多的编程, 以Python为主, 所有研究想法都应该编程实现, 否则只是空中楼阁, 善用LLMs(chatgpt, DeepSeek等)
- 建议开发环境: Visual Studio + Anaconda + Pytorch.
- 使用富文本编辑器NotePad++, markdown文件编辑器.
如果需要我帮忙检查代码请保持良好的编程习惯和编程风格.
- 研究方向涉及较多深度学习内容, 主要基于Pytorch框架实现, 教程可参考https://github.com/ShusenTang/Dive-into-DL-PyTorch.
要学会使用Latex, 善用LLMs(chatgpt, DeepSeek等)
- 参考https://www.overleaf.com/learn/latex/Learn_LaTeX_in_30_minutes
