当前位置: 首页 > news >正文

博士研究文档管理技术指南

博士研究文档管理——跟踪会议、实验和决策

博士研究可能是一项艰巨的任务。在成为解决特定问题专家的过程中,很容易迷失方向:我之前读过这篇论文吗?这篇论文说了什么?我们为什么决定改变方向?我为什么要进行这些实验?上次会议上我和谁交谈过?在我的博士生涯中,我发现记录这些事情能让我以最小的开销显著提高效率。在本文中,我想分享一些关于记录博士工作内容和方法的经验。

引言

在我博士初期,我与一些博士生和学者就如何在博士期间跟踪所有事项进行了一系列对话。其中一些讨论受到2018年CVPR"优秀公民"研讨会的启发。这促使我开始认真思考如何组织并最终记录我的博士工作。回顾过去,我认为这是我做出的较好决定之一。最近,在海德堡获奖者论坛2023上,我发现许多成功的学者也会记录,例如在会议期间与谁交谈以掌握情况。在本文中,我想分享我跟踪和组织博士工作的方法。

最初,我几乎将所有内容都记录在一个文档中;我称之为主文档。这是一个(非常非常)长的LaTeX文档,检入Git仓库。如今,在某中心DeepMind,它更像是一个日志;仍然是一个长文档,包含大量指向云端文件夹、文档或幻灯片的链接。我相信有更好的工具可用。然而,是单个文档、使用某中心文档还是LaTeX并不重要。方法不那么重要。我的关键见解是首先要开始记录博士工作的要点。我确信这可以以最小的开销实现,同时获得许多好处。

以下,我想回顾我博士工作的主要部分——即阅读、会议、实验和社交——并概述我认为需要记录的重要内容,以及它如何帮助我取得成功。

记录参考文献和阅读

每个研究项目通常从阅读论文和发展想法开始。在这个阶段,我发现(a)跟踪我阅读的论文——即使只是略读——和(b)为我计划或正在进行的研究保留关键论文的简短摘要非常有用。

我仍然在一个中心化、组织良好的BibTeX文件中跟踪所有查看的论文。这可以通过非常有限的开销完成,因为它只涉及从某机构学术搜索、语义学者或DBLP复制BibTeX条目并赋予其唯一名称。此外,我过去常将论文放入粗略的类别中。分类通常基于对摘要的快速浏览。偶尔,我会在博客上分享这些分类的部分内容,例如,参见《240+篇关于对抗样本的论文》。对于那些我最终更仔细阅读的论文,因为它们与我的研究直接相关,我过去也添加简短摘要。通常这仅涉及几句话描述论文的关键思想。我经常还包括阅读时的问题——要么是当我不理解某些内容时,要么是当我有后续想法时。其中许多实际上发布在ShortScience或我的阅读笔记中。我尝试了不同的工具来跟踪摘要,如单独文档、OneNote或Markdown文件树,但最终只是将它们添加到我的主LaTeX文档中。

以这种方式跟踪论文有几个直接的好处。例如,它极大地简化了论文写作:我能够非常快速地撰写相关工作部分,不需要花费太多时间中断写作来查找和添加BibTeX条目。我的导师和许多审稿人反复强调我的相关工作部分多么全面和详细,尽管它们并不费力。论文摘要特别有助于将我的工作与类似论文区分开来或回应审稿意见。除了论文写作,拥有分类的论文列表有助于准备讲座,对正在攻读学士/硕士论文的学生也很有用。我还发现知道哪些论文我已经读过很有用。如果有人与我分享一篇论文并且它在我的列表中,我知道我要么有摘要,要么这篇论文与我的工作不太相关。这对于在会议上优先参加哪些演讲或海报也很有用,因为我通常在论文发表前阅读许多预印本。最后,对我所在领域的论文有很好的概览也有助于加快任何审稿职责。

会议和决策

阅读论文和发展研究想法通常是协作努力。在我的情况下,我与导师和合作者定期开会,讨论论文、想法或实验。虽然在工业界保留会议记录相当正常,但我发现学术界的会议处理更为非正式。通常,在谁以及如何记录会议方面没有明确的期望。然而,我发现在研究中跟踪会议内容和决策可能非常有用。主要有三个原因:

首先,会议通常会产生某种决策。例如,关注什么研究问题,优先进行什么实验,向谁寻求帮助或与谁合作,在哪里提交,如何回应审稿意见等等。不幸的是,很容易忘记一些决策或忘记将它们传达给未出席的合作者。更重要的是,很容易忘记做出特定决策的原因。对我来说,这意味着我经常忘记我们为什么决定进行特定实验,我需要与导师核对或重新讨论部分讨论。一旦我开始跟踪会议讨论和决策,组织我的日常工作并向合作者传达结果和决策就变得容易得多。

其次,跟踪讨论和参与者有助于避免冲突或重复争论。就个人而言,我很少与合作者发生任何冲突或问题。然而,我经历了许多博士生关于作者身份或贡献的争论。这些冲突随着时间的推移而增长,因为各方对会议或决策有不同的记忆。我注意到许多学生通过记录会议并与合作者分享笔记成功避免了此类冲突。这在误解可以更容易解决的早期就暴露了它们。

最后,它提高了可见性。例如,每当一些合作者未出席某些会议时,我过去常常发送笔记,以便每个人都在同一页上。这也使得在小组会议或站会上阐述我正在做什么变得更容易。这使研究小组熟悉我正在做什么以及我面临哪些问题。

实验

一旦研究想法被选为有前途的,实际的研究工作就开始了。理论工作以工作笔记或手写草稿的形式记录,这些很容易数字化和跟踪。对于编码,版本控制系统如Git被广泛采用——尽管在学术界有时缺少最佳实践(频繁提交、描述性提交消息、利用分支等)。剩下且通常更难适当跟踪的是实验。我相信这实际上是机器学习作为一个相当年轻的实证科学的结果。事实上,实验室笔记本在许多其他学科中极为常见。通常有关于如何正确维护实验室笔记本的课程,如哥伦比亚大学的这个课程。例如,当我遇到来自亥姆霍兹药物研究所的博士生时,他们告诉我,保持实验室笔记本是实际进入实验室空间进行实验的先决条件。

就个人而言,我从未以上述意义维护实验室笔记本,因为我在博士接近结束时才了解到它。然而,在我的前两篇论文之间,我意识到跟踪实验假设、配置和结果对于在顶级场所发表至关重要。这一点尤其重要,因为从工程角度来看,机器学习实验变得越来越复杂。工业研究实验室如某中心DeepMind实际上有现成的基础设施来跟踪实验并使其可重现。然而,作为博士生,我必须自己构建这个基础设施,我计划写一篇单独的博客文章关于技术基础设施。

在这里,我想关注记录实验的非技术方面:实验假设和结论。这也与上述部分相关,因为实验通常由与合作者的会议讨论和决策推动。最初,我开始只写几句话描述我为什么要进行实验。这可能简单如"数据增强X是否提高对抗鲁棒性?"。然后,在实验之后,我以图表或表格的形式收集关键结果以及一些观察。这些随后被讨论并可能导致额外的实验。对我来说,关键是一致性。这在撰写论文或进行演示时变得重要。有了这个实验日志,很容易回溯并检查为什么选择特定超参数,替代方法或基线表现如何等。

事件、申请和职业决策

说服博士生记录会议或实验相对容易。这样做的好处通常在下次论文提交时就能注意到。然而,跟踪会议或其他活动的互动、奖学金或实习申请以及更高层次的职业决策的直接好处较少。通常,我在会议上建立的联系或在其他研究实验室进行的演讲在几年后才变得相关或有趣。当我记不起在以前会议上交谈过的其他研究人员时,我开始记录我与谁交谈过,并在社交媒体上找到他们以保持联系。我还更好地跟踪了我参加的研讨会和演讲,或拍摄了海报照片。所有这些都可以相当容易地完成。但需要一致地完成,例如,在每个会议日晚上坐下来记录主题和姓名,并一致地向人们索取名片或拍摄他们的徽章照片。到现在,许多会议和活动在徽章上打印QR码,使这变得容易得多。

结论

总体而言,在整个博士期间,我了解到保持书面记录非常有用。令人惊讶的是,我发现只有少数博士生真正系统地这样做——尤其是在机器学习领域。我也不确定我是否完美地解决了它。即使没有,我注意到它在整个博士期间及以后都非常有用。在本文中,我概述了我倾向于跟踪的内容以及它如何有益于我的工作并最终有益于我的研究成果:

  • 我保留了我阅读或引用的所有论文的中心列表和BibTeX文件;
  • 我记录了我参加或组织的大多数会议中的讨论和决策;
  • 我记录了实验假设和结果;
  • 我记下了在会议上建立的联系以及我参加的演讲和活动;
    更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
    对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

http://www.hskmm.com/?act=detail&tid=34470

相关文章:

  • 题解:P12128 [蓝桥杯 2024 省 B 第二场] 质数变革
  • 题解:P12003 在小小的奶龙山里面挖呀挖呀挖(加强版)
  • apisix升级完整流程
  • 10.11-10.18 一周总结
  • 10/19/2025 一周总结
  • 如何生成逼真的合成表格数据:独立采样与关联建模方法对比
  • winform+Task+async
  • AI元人文:跨学科视野下的人工智能伦理新范式
  • Rust 开发最佳实践(Rustlang Best Practices)
  • Why dont Japanese people reply to messages
  • 20232301郑好 实验二 后门原理与实践
  • 2025年复合钢丝网厂家推荐排行榜,昆山高精密网版,复合钢丝网公司精选!
  • 20232322 2025-2026-1 《网络与系统攻防技术》实验二实验报告
  • 消防局的设立
  • Python 潮流周刊#73:让我们对 PyPI 温柔一点,好吗?
  • 2025 年中国超声波流量计行业品牌全景分析报告:十大高性能品牌技术、性能与市场优势深度解析
  • 2025年精密弹簧厂家推荐排行榜,微型精密弹簧,不锈钢精密弹簧,高弹性精密弹簧公司推荐!
  • 2025网络推广服务推荐:云数智推,专业定制化营销解决方案!
  • React+Three.js 实现 Apple 2025 热成像 logo
  • 详细介绍:遥感目标检测数据集汇总,覆盖城市问题/工业安全/农业健康/室内场景……
  • 数据采集与融合作业1
  • CSP-S2023题解
  • 2025年氧化镁厂家最新推荐排行榜,活性氧化镁,肥料级氧化镁,优质供应与技术实力之选!
  • 运算符与自增自减
  • 2025年通风天窗/排烟天窗/通风气楼厂家最新推荐榜单,屋顶通风器/顺坡气楼/10A/1型/TC5A/TC12B/屋脊通风天窗公司推荐!
  • 使用autoDL gpu云服务器训练yolo的常用操作 - 东南西北风
  • 软件工程第三次作业-结对项目
  • with关键字
  • 2025精密球轴承优质厂家推荐:无锡雨露精工,国产高端定制首选!
  • 自定义注解