“响鼓不用重锤”

本学期讨论班以论文、专著汇报为主, 集中在机器学习(优化算法)、单细胞组学分析、病理图像分析三方面.

  1. 关于如何做论文汇报, 请参考李沐B站视频.

  2. 如何找论文: 建议使用Google搜索: 主题词、关键字(英文), 善用LLMs(chatgpt, DeepSeek等)

    • 吴恩达:关于机器学习职业生涯以及阅读论文的一些建议 [必看视频!!!]

    • 选择论文的非客观标准
      • 论文是否近5年发表(虽然有一些经典论文是较早之前发表的, 但是可能要深入了解某一个主题才能挖掘得到).
      • 论文是否发表于重要的期刊或会议(虽然有一些重要论文发表在质量较低的期刊, 高质量期刊也有质量较低的论文, 但新手应该用一个简单的准则来判断论文水准).
    • 选择论文的客观标准
      • 论文多如海水, 阅读论文应十分聚焦于同一个研究主题上, 即使有一些论文研究主题相近或自己感兴趣, 也应弃之. 放弃需要智慧, 而接受只需盲目努力.
      • 提供Github代码的应该优先考虑, 容易上手、理解.
      • 建议就某一个期刊或会议同一年份同一主题的研究论文入手.
    • 阅读论文除了正文内容还应该关注
      • 论文作者: 看看能不能找到论文第一作者或通讯作者的主页, 找找他们的发表记录, 对于一些领域内资深的研究者, 往往会有意外的发现, 他们通常会就同一个研究主题发表一系列的工作, 这也是找论文的一种方式.
      • 对比方法: 从多篇论文的对比方法中可以找到共同的对比方法, 那一般是同一问题的影响比较大的方法.
      • 参考文献: 从参考文献的标题中也能找到同一主题的论文.
      • 不同论文的联系: 不同的论文各自侧重哪一方面; 是否有它们都忽略了的地方; A论文的方法能否解决B论文存在的问题等等, 这往往是研究想法开始的地方.
      • 精读过的论文应该做好笔记: 内容应该简短、精要, 以能回忆起关键内容、架构为主, 方便联系已经读过的论文.
    • 机器学习论文以三大会论文为主(ICML/NeuraIPS/ICLR)
      • 往年ICML的论文集: https://proceedings.mlr.press
      • 往年NeuraIPS的论文集: https://papers.nips.cc
      • 往年ICLR的论文集: https://openreview.net/group?id=ICLR.cc
    • 医学图像期刊及会议
    • 生物信息学期刊
  3. 关于论文阅读的工具: 重要、前沿的论文基本都是发表在英文刊物、会议上, 目前已经有较多的论文阅读工具辅助翻译、找到论文重点, 但应该注意工具只是起到辅助作用, 还是应该以自身求证、理解为主.

    • Aminer(https://www.aminer.cn)
  4. 最好已经修读过《机器学习》(B站上有台大李宏毅的机器学习视频课或者吴恩达的课程)、《最优化方法》.下面列出一些必要的阅读章节, 但这并不意味必须读完这些材料才能展开研究, 书籍的作用大多时候是字典.

  5. 研究方向涉及较多的编程, 以Python为主, 所有研究想法都应该编程实现, 否则只是空中楼阁, 善用LLMs(chatgpt, DeepSeek等)

    • 建议开发环境: Visual Studio + Anaconda + Pytorch.
    • 使用富文本编辑器NotePad++, markdown文件编辑器.
    • 如果需要我帮忙检查代码请保持良好的编程习惯和编程风格.

    • 研究方向涉及较多深度学习内容, 主要基于Pytorch框架实现, 教程可参考https://github.com/ShusenTang/Dive-into-DL-PyTorch.
  6. 要学会使用Latex, 善用LLMs(chatgpt, DeepSeek等)

    • 参考https://www.overleaf.com/learn/latex/Learn_LaTeX_in_30_minutes