AI biology 到底 AI 了什么？

doggie · 2025 年11 月 9 日 15:07

原文

本文由简悦 SimpRead 转码，原文地址 mp.weixin.qq.com

我总觉得 AI biology 奇怪，现在是 2025 年，研究生三年之后真的有工作吗？

只要你读的是 “AI × 生物” 里相对主流、技术含量高的方向（比如计算生物学、生物信息、蛋白结构预测、单细胞 / 多组学分析、AI 药物发现等），三年之后是有工作出路的，但不等于“随便混混就都能上岸”。这个领域现在既热门又内卷，门槛和分化都在变高。

我按几个关键问题聊清楚：

你说的 “AI biology” 大概是哪几类？

现在大家口中的 “AI + 生物”，大致会落到几种路径（不一定互斥）：

① 计算生物 / 生物信息（偏科研）

玩的是组学数据（基因表达、单细胞、多组学）、进化、调控网络等。

常用：Python/R、统计、机器学习、deep learning、图神经网络，外加一堆 pipeline 和 Linux。

出路：高校 / 研究所博后、医学院 / 医院科研岗、生物医药 / 器械公司里的 “算法 / 数据科学家”“生物信息工程师”。

② AI 药物发现 / 结构生物学方向

例如蛋白结构预测（AlphaFold 系谱）、分子生成、虚拟筛选、分子动力学 + 深度学习。

出路：药企（尤其 Biotech、AI drug discovery 初创）、大药厂研发部门、部分 tech+bio 公司。

③ 医疗 AI / 数字医疗

比如病理图像、医学影像（CT、MRI）、电子病历 NLP、临床决策支持系统。

出路：互联网医疗公司、影像 / 器械公司、医院信息中心相关合作项目团队。

④ 纯 “做点机器学习玩玩” 的伪 AI-bio

读的方向挂着 “智能”“AI” 标签，但实际就是帮实验室跑跑工具、调调参数、做点可视化。

算法、工程、数学功底都薄，生物理解也一般。

这一类是最危险的：毕业时既不像硬核 CS/ML，又比传统生物少了实打实的实验技能，很容易变成 “两边都不够硬”。

你大概要先判断自己未来会更像哪一类。真正决定你是否好找工作的是 “技能和项目深度”，而不是专业名称。

2025 往后 3–5 年，这个方向是涨是跌？

需求在涨，但门槛也在涨，且地区 / 学校 / 个人差异非常大。

稍微展开一下现实：

行业层面

人口老龄化、药物研发成本高、精准医疗的趋势都是真实存在的，这些都需要超大规模数据和建模。

大模型出来之后，生物信息和药物发现反而更需要会 “把模型和生物问题对齐” 的人，而不是只会调用 API 的人。

大药厂、Biotech、互联网巨头都在持续招 “懂 AI 又懂生物 / 医学” 的人，但更加偏好：

有实打实项目产出（paper、开源代码、落地产品、pipeline）的；

能独立把一个问题从 “生物假设 → 数据 → 模型 → 结果解释” 完整打通的人。

学历层面

本科：一般很难直接做 “AI + 生物” 的高质量岗位，除非是极强的 CS + 科研背景。

硕士 / 研究生：如果是科研型硕士 + 过硬项目，做工程 / 算法 / 数据科学是完全可行的；如果是 “混文凭” 的硕士，竞争力非常弱。

博士：对想走真正科研驱动型工作（研究院、药企研究科学家）仍然是主流门槛。

你的问题是 “三年研究生之后有没有工作”，更关键其实是：这三年你能积累到什么程度。

现实一点：什么样的背景，确实比较容易找工作？

把话说直白一点：如果你满足下面大部分条件，就不用太悲观：

技能结构

编程：至少 Python 过关（数据处理、建模、写 pipeline），能读懂 / 改开源项目；如果再会点 C++/Rust/Java 只是加分。

数学 / 统计：基本概率论、数理统计、线性代数，能看懂经典机器学习 / 深度学习公式，而不是 “只会调库”。

机器学习 / 深度学习：真正从零实现过 / 改造过 model（比如自编码器、GNN、Transformer 在生物任务上的变体），懂数据预处理、特征工程、model evaluation。

生物知识：不要求你像 wet-lab 大佬，但必须懂你手上数据的生物意义，能和实验 / 临床的人正常沟通。

项目 / 成果

做过完整链路的项目：从问题定义 → 数据收集 / 清洗 → 建模 → 结果解释 → 写报告或 paper，最好有开源代码。

有 1–2 篇像样的论文（不一定顶刊，但要能体现方法和思考），或者公司 / 实验室真正落地的产出。

能在简历和面试里把一个项目讲得 “既清楚算法细节，又讲得清楚生物意义”。

这样的人，在 2025 之后三年，找工作主要是 “选哪里、选什么类型的公司” 的问题，不是 “有没有工作” 的问题。

哪些坑是会让你毕业后非常尴尬的？

这里我可能会说得重一些：

只蹭热点不补基础

如果三年过后，你的状态是：

机器学习看不懂、代码只会抄；

模型训练全靠师兄师姐给的脚本，出问题也不知道怎么 debug；

论文只看结论和图，不看方法；

生物问题问深一点就卡壳，只能说 “因为论文这么做”。

那确实会很难。因为在企业眼里，你既不是能扛 project 的工程师，也不是能做原创研究的 scientist，就是一个 “会操作别人写好的脚本的 technician”，可替代性极高。

只会做传统 wet-lab，又想靠 “挂个 AI 标签”

如果你主要技能还是实验（PCR、Western、细胞、动物实验），但只是：

在简历上写 “参与 AI 项目”；

实际只是交数据给别人训练模型；

自己对代码和算法都不熟；

那在找 “AI 相关岗位” 的时候，基本上过不了技术面试；找传统生物岗，又会被问：那你实验技能是不是三年都废了？

这种 “中间状态” 是很多人最怕的。

把 “整体大环境焦虑” 全拿来套在自己身上

确实，宏观经济和行业波动都在，裁员消息、PhD 卷上天这些新闻也都是真的。

但最终对你就业起决定性作用的是——你个人的那几个项目、那几个技能点，而不是 “AI 泡沫”“大环境差” 这几个抽象词。

如果你现在就要做决策，该怎么评估自己适不适合走这条路？

给你几个简单的自检问题，你可以自己在心里打分：

你对 “写代码、看数学公式、查 bug” 这类偏理工的工作，是抗拒还是有兴趣？
相比 “做实验”，你更享受的是哪种：

A：在实验台上重复性操作；

B：坐在电脑前拆数据、调模型、看结果？

你有没有那种 “为了搞清楚一个技术细节，能自己查文档 / 搜索 / 看源码搞一天” 的耐心？
你能不能接受三年里大量时间不在 bench 上，而是在 Linux + Python + paper pile 里打转？

如果对 “写代码、建模、读 paper” 这些事情本身不抵触甚至有点上头，那么 AI biology 对你来说更可能是机会而不是坑。

如果你心底其实还是更喜欢 wet-lab 的那套，而且对代码特别厌烦，那就要认真考虑是否要走 “硬 AI” 方向，还是做 “懂一点计算的生物人” 会更舒服。

你现在能做的现实规划

明确一个主轴：决定你是 “偏 CS 的 AI-bio 人” 还是“偏生物的 AI-bio 人”，然后围绕这个主轴补足短板，不要两边都浅尝辄止。

争取至少做出 1–2 个你可以拿出去讲 30 分钟的项目：包含问题背景、数据、方法、结果、局限性和改进方向。

能力证明尽量 “可见”：GitHub、公开数据竞赛成绩、论文 / 预印本、实习经历。这些都是将来找工作时真实的 “筹码”。

主动去了解目标岗位的 JD，看他们要什么栈，然后反推自己这三年该补哪块，而不是闭门造车。

回到你的原话：“总觉得 AI biology 奇怪，三年后有工作吗？”

“奇怪” 的部分，在于这个领域现在确实鱼龙混杂，挂名 AI 的课题和岗位里，有真金，也有镀金。

“三年后有工作吗”的真实版本是：有一大堆需要 “懂 AI、懂数据、又能和生物 / 临床对话” 的岗位，但不会为 “啥也不精” 的人买单。

如果你愿意把这三年当成真正的技能积累期，努力让自己变成那种 “能把一个生物问题用 AI 讲清楚、做扎实” 的人，那么 AI biology 不是坑，是跳板。

如果你只是想借着 “热门” 躲避就业压力，希望“专业名头自动带来好工作”，那不只是 AI biology，2025 年以后大概任何专业都会让人失望。

我觉得奇怪的点在于：实验室本身就没有 AI 基础，只是想做 AI 就搞了个 AI biology 方向。让零基础学生去探索，但是外面的企业也这么干。另外，大家都是让 GPT 写写机器学习和深度学习代码，就叫 AI 了。我不确定这样是否有工作深度。而且我认为 AI biology 的前提是做一些基础工作，不是浮于写写机器学习代码去分析数据就叫 AI biology。

你说的这点，其实是现在很多 “AI+X” 里最真实、也最尴尬的部分：

实验室和公司自己没什么 AI 基础，却先把牌子挂出来，让一批零基础学生 + GPT 去 “摸索”。你直觉上觉得虚，这个直觉本身没错，只是需要再拆细一点看：什么是 “假 AI biology”，什么才算有实际深度的方向。

先说白了：你看到的大部分 “AI biology”，确实是浮在表面的

你提到的这几个现象，其实可以挨个拆开：

一是，“实验室本身没有 AI 基础，只是想赶个热点，就开了 AI biology 方向，让零基础学生去试”。

这在全球范围内都存在，不止中国：很多 PI 本身是传统生物、药理、分子生物背景，这两年觉得不搞 AI 没法发文章、没经费，于是就：

写本书 / 看几篇综述，拉个懂点编程的协作者；
找学生去学机器学习、跑公开数据集；
课题题目里加上 “AI-driven”“deep learning”。

这样的组，很容易变成你说的那种状态：

“学生零基础 + 导师半懂不懂 + GPT 代写代码 = 看上去很 AI 的论文题目”。

二是，“外面企业也这么干”。

很多中小药企、生物公司、甚至医院的信息中心，会说自己要搞 “AI 影像”“AI 药物筛选”，实际就是：

买现成的工具 / 平台；
招 1–2 个数据分析 / 机器学习工程师；
让他们把内部数据丢进去跑跑模型，看能不能出点 “AI 报告”。

这种环境下，工作内容就很容易沦为你说的那种：

“拿 GPT 帮忙写个模型代码，调几个参数，出几张图，就叫 AI”。

三是，“用 GPT 写写 ML / DL 代码就叫 AI”。

这确实是现在的一个新问题：以前你不会写代码，就只能老老实实学；现在 GPT 能给你写出 80% 看起来像那么回事的代码，短期内让 “装 AI” 变得太容易。

但是——这里有个很关键的现实：

真正用人、发论文、做产品的地方，看的是 “你能不能让东西稳定、可解释、可落地”。

这一点，光靠 GPT 自动生成代码是撑不住的。GPT 让入门门槛变低，但把 “谁是深、谁是浅” 区分得更明显了：

浅的是：会让 GPT 写一段跑完就完事，甚至都不太懂 loss 在干嘛；
深的是：会利用 GPT 提高效率，但自己能判断模型是不是在瞎拟合，数据有没有问题，结论能不能站得住。

所以，你直觉上觉得 “大家都在浮油层上划水”，这个现象在“假 AI 环境” 里是真实存在的；

但是如果你据此得出结论：“整个 AI biology 就是浮的，根本没有深度工作”，这一点我是不赞同的。

那什么才叫有 “深度” 的 AI biology？“基础工作”到底是啥？

你提到了一个很关键但抽象的词：“基础工作”。

直觉上你觉得，AI biology 不应该只是拿模型套数据，而是要有更扎实的东西撑着。这个感觉完全对，但要把它讲清楚，需要把 AI biology 拆开来看：

真正有深度的 AI biology，至少包含几层 “基础”：

一层是数据和实验的基础。

简单说：你得知道这些数据是不是靠谱、能不能支撑模型学到有意义的东西。比如：

组学数据：RNA-seq、single-cell、ATAC-seq、蛋白组学，这些的实验设计、批次效应、噪声来源，如果你一点都不了解，只会把表达矩阵丢进模型，那做出来的结果八成是 “看着很炫，实际上很假”。
结构和分子数据：蛋白结构、配体构象、分子动力学模拟，这些的物理约束、化学合理性，要是没概念，就很容易做出 “模型预测得很好，但分子根本合成不出来” 的东西。

这一层就是你在说的：

“先做基础工作，再谈 AI”。

基础工作不是指 “先做几年没技术含量的打杂”，而是指——你对生物、化学、实验和数据本身要有一定理解，不然 AI 只是空中楼阁。

第二层是算法和建模本身。

这里的 “深度”，不是指你一定要去搞新的 SOTA 模型，而是至少要做到：

知道为什么用这种模型，而不是那种（比如，为什么用图网络处理分子，为什么对序列数据用 Transformer 类模型）；
知道模型的假设是什么、局限在哪儿（比如训练数据的分布、偏差、样本量）；
知道怎么评估模型是不是在真正学东西，而不是在记数据（交叉验证、外部验证集、前瞻性验证、负对照设计等等）。

当一个组 / 公司只停留在 “GPT 帮我写了个 ResNet / Transformer，我把结果曲线贴在 PPT 上”，那确实不叫有深度的 AI 生物，是在玩样子。

第三层是和生物问题真正闭环。

深一点的 AI biology 一定会问：“模型结果对真实世界有什么可操作的影响？”

比如：

药物发现：模型优先推荐的分子，能不能设计实验去验证？如果失败了，为什么失败，模型要怎么改？
疾病亚型：用聚类和表示学习发现了新亚型，那临床上能不能分辨？能不能指导不同用药？
基因调控 / 通路：建了个调控网络，那网络里的关键节点能不能通过敲除 / 过表达看到预期表型？

这些就是你说的 “基础工作” 往下延伸：

数据有根，模型有脑，实验有手，这三者要互相咬合，而不是各自飞。

你说的那种 “挂 AI 名头，没基础就上”，有没有出路？

非常坦白地说，如果一个实验室 / 公司是这种状态：

导师 / 老板本身不懂 AI，只是觉得 “你帮我搞点机器学习，我们也算前沿”；
项目基本就是 “下载公开数据集 → 套分类 / 回归 / 聚类模型 → 出一篇文章”；
没有长期的、生物学清晰的问题线，也没有认真搭实验验证；

那在这个环境下，即使你天天用 GPT 写代码，三年后你的竞争力也是危险的。你直觉怀疑 “这样有没有工作深度”，不是你太敏感，而是你很清醒。

更现实一点说，这种环境培养出来的人，最容易陷入的困境是：

代码只停留在 “能跑” 的层面，工程能力和数学理解都不扎实；
生物理解停留在 “略懂流程”，但缺乏对某个系统 / 疾病 / 技术的深刻认识；
项目大多基于公开数据集，缺少真正从问题出发、到数据产生、到模型设计、到验证的闭环经历。

这样的履历，放在招聘方眼里，就很容易被归入 “浮在表面的一代 AI 生物人”。

这一点上，我是同意并且支持你的警惕的。

但我也要反驳你一个地方：完全否定 “从零开始探索” 不合理

你说 “实验室没基础就搞 AI biology，让零基础学生探索”，听上去很冒险，但并不意味着一定没价值。关键区别在于：

一种是，导师虽然没 AI 经验，但有清晰的生物学问题和长期积累，比如：

做某个疾病十几年，很清楚现在实验数据的痛点；
只是之前不用机器学习，如今希望用 AI 手段整合多组学数据、提高筛选效率。

这种情况下，哪怕 AI 部分是你边学边做，只要问题扎实、数据真实、有实验验证，你其实是在做 “从无到有的搭桥”，这很有价值。

另一种是，问题本身也不清楚，只是为了凑个 “AI 题目” 发文章，选什么数据无所谓，结果有没有生物学意义也无所谓，这才是彻底的“空”。

从学生角度，你其实可以用几个问题来判断自己所在的环境更像哪种：

这个组有没有一个清晰的生物学 / 医学问题方向？还是题目一年换一个热点？
老板对数据和实验是否很在行，只是对 AI 不熟？还是对什么都 “半瓶水响叮当”？
项目有没有认真考虑怎么验证模型结论，而不是只停留在 “看上去指标还不错”？

如果前两点是肯定的，第三点有努力在做，那 “从零起步的 AI biology” 其实还算是个上升期环境；

如果三点都比较虚，那你的担心基本就是现实风险。

你真正需要搞清楚的是：你想要成为什么样的人？

现在的困惑，其实可以翻译成一句更直白的话：

“我不想变成那种只会拿 GPT 写模型、却没有真实含金量的人，那我到底该怎样在 AI biology 里走得更深？”

客观一点说，有几个选择方向：

如果你仍然想待在这个领域里，那你要刻意对抗 “浮” 的那一面。比如：

在生物学上，选一块你真心想搞懂的东西，不要什么都浅尝辄止；
在技术上，至少把一条完整的链条吃透：从数据获取 → 预处理 → 特征 / 表示 → 模型 → 评估 → 可解释性 → 实验验证设计；
在使用 GPT 上，把它当成工具，而不是拐杖：让它帮你写样板代码、查 API，但关键设计、指标、对结果的质疑要由你来承担。

如果你发现自己对编程和建模其实没兴趣，那就值得诚实面对：

你可能更适合在生物学 / 医学 / 实验一侧走深，比如成为那种 “特别懂某个疾病机制 / 某个技术平台的人”，将来和 AI 团队合作，而不是亲自写模型。

这样的角色在真正成熟的团队里非常需要，不是 “低一等的选项”。

如果你既不想搞深生物、也不想搞深 AI，只是希望混一个 “看起来前沿” 的方向，那我会很老实地说：

无论 AI biology 还是其他什么热门交叉学科，很大概率都会在 3–5 年内把你淘汰掉。

因为 GPT 帮你写皮毛代码，AI 工具帮你做基础分析，这些浅层东西最容易被自动化掉。

最后帮你把这件事说穿

你现在觉得奇怪，是因为你隐约感受到一个事实：

“AI biology 这个牌子，本身已经不再是含金量的保证，真正有用的是你在里面沉淀下来的那套能力和视角。”

在这一点上，我是完全站你这边的。

但我不会顺着说 “那就别碰 AI biology 了”，因为如果你对这个领域还有兴趣、也愿意认真练功，这条路依然有深度，也有工作，只是：

不能指望 “实验室说是 AI 方向，你就自然有深度”；
更不能指望 “会用 GPT 写代码，就算掌握 AI”。

你真正在找的 “基础工作”，其实就是：

对生物问题的扎实理解 + 对数据和实验的尊重 + 对模型的清醒判断 + 对闭环验证的执着。

这些东西不写在专业名字上，也不自动随研究方向附赠，只能靠你选对环境、选对导师、选对项目，再加上自己下功夫一点一点积累。

话题		回复	浏览量
晚点采访自变量王潜 🗣️闲聊转载	0	17	2026 年1 月 21 日
技术大爆炸的今天，医疗与 AI 的发展将走向何处？ \| DrPika's Blog 🥼实践与临床转载 , 医学影像学 , 人工智能	0	48	2025 年11 月 4 日
【转载】工作还是读博？this is a question 🗣️闲聊转载	0	22	2025 年12 月 19 日
【转载】AI 可能不会改变许多工作 \| 虹线 🗣️闲聊转载	0	21	2025 年11 月 18 日
人工智能学习路径分享（2023.11更新） 🤖人工智能学习路径	1	418	2023 年12 月 4 日