推荐词
AI biology有哪些大方向?
AI+biology交叉需要的人才是两头都强而不是两头都拉
如果只是蹭热点,最终会变成:公式看不懂,代码只会抄,训练靠脚本,论文只看图,一问就卡壳,实验不会做
原文
本文由 简悦 SimpRead 转码, 原文地址 mp.weixin.qq.com
我总觉得 AI biology 奇怪,现在是 2025 年,研究生三年之后真的有工作吗?
只要你读的是 “AI × 生物” 里相对主流、技术含量高的方向(比如计算生物学、生物信息、蛋白结构预测、单细胞 / 多组学分析、AI 药物发现等),三年之后是有工作出路的,但不等于“随便混混就都能上岸”。这个领域现在既热门又内卷,门槛和分化都在变高。
我按几个关键问题聊清楚:
- 你说的 “AI biology” 大概是哪几类?
现在大家口中的 “AI + 生物”,大致会落到几种路径(不一定互斥):
① 计算生物 / 生物信息(偏科研)
玩的是组学数据(基因表达、单细胞、多组学)、进化、调控网络等。
常用:Python/R、统计、机器学习、deep learning、图神经网络,外加一堆 pipeline 和 Linux。
出路:高校 / 研究所博后、医学院 / 医院科研岗、生物医药 / 器械公司里的 “算法 / 数据科学家”“生物信息工程师”。
② AI 药物发现 / 结构生物学方向
例如蛋白结构预测(AlphaFold 系谱)、分子生成、虚拟筛选、分子动力学 + 深度学习。
出路:药企(尤其 Biotech、AI drug discovery 初创)、大药厂研发部门、部分 tech+bio 公司。
③ 医疗 AI / 数字医疗
比如病理图像、医学影像(CT、MRI)、电子病历 NLP、临床决策支持系统。
出路:互联网医疗公司、影像 / 器械公司、医院信息中心相关合作项目团队。
④ 纯 “做点机器学习玩玩” 的伪 AI-bio
读的方向挂着 “智能”“AI” 标签,但实际就是帮实验室跑跑工具、调调参数、做点可视化。
算法、工程、数学功底都薄,生物理解也一般。
这一类是最危险的:毕业时既不像硬核 CS/ML,又比传统生物少了实打实的实验技能,很容易变成 “两边都不够硬”。
你大概要先判断自己未来会更像哪一类。真正决定你是否好找工作的是 “技能和项目深度”,而不是专业名称。
- 2025 往后 3–5 年,这个方向是涨是跌?
需求在涨,但门槛也在涨,且地区 / 学校 / 个人差异非常大。
稍微展开一下现实:
行业层面
人口老龄化、药物研发成本高、精准医疗的趋势都是真实存在的,这些都需要超大规模数据和建模。
大模型出来之后,生物信息和药物发现反而更需要会 “把模型和生物问题对齐” 的人,而不是只会调用 API 的人。
大药厂、Biotech、互联网巨头都在持续招 “懂 AI 又懂生物 / 医学” 的人,但更加偏好:
有实打实项目产出(paper、开源代码、落地产品、pipeline)的;
能独立把一个问题从 “生物假设 → 数据 → 模型 → 结果解释” 完整打通的人。
学历层面
本科:一般很难直接做 “AI + 生物” 的高质量岗位,除非是极强的 CS + 科研背景。
硕士 / 研究生:如果是科研型硕士 + 过硬项目,做工程 / 算法 / 数据科学是完全可行的;如果是 “混文凭” 的硕士,竞争力非常弱。
博士:对想走真正科研驱动型工作(研究院、药企研究科学家)仍然是主流门槛。
你的问题是 “三年研究生之后有没有工作”,更关键其实是:这三年你能积累到什么程度。
- 现实一点:什么样的背景,确实比较容易找工作?
把话说直白一点:如果你满足下面大部分条件,就不用太悲观:
技能结构
编程:至少 Python 过关(数据处理、建模、写 pipeline),能读懂 / 改开源项目;如果再会点 C++/Rust/Java 只是加分。
数学 / 统计:基本概率论、数理统计、线性代数,能看懂经典机器学习 / 深度学习公式,而不是 “只会调库”。
机器学习 / 深度学习:真正从零实现过 / 改造过 model(比如自编码器、GNN、Transformer 在生物任务上的变体),懂数据预处理、特征工程、model evaluation。
生物知识:不要求你像 wet-lab 大佬,但必须懂你手上数据的生物意义,能和实验 / 临床的人正常沟通。
项目 / 成果
做过完整链路的项目:从问题定义 → 数据收集 / 清洗 → 建模 → 结果解释 → 写报告或 paper,最好有开源代码。
有 1–2 篇像样的论文(不一定顶刊,但要能体现方法和思考),或者公司 / 实验室真正落地的产出。
能在简历和面试里把一个项目讲得 “既清楚算法细节,又讲得清楚生物意义”。
这样的人,在 2025 之后三年,找工作主要是 “选哪里、选什么类型的公司” 的问题,不是 “有没有工作” 的问题。
- 哪些坑是会让你毕业后非常尴尬的?
这里我可能会说得重一些:
只蹭热点不补基础
如果三年过后,你的状态是:
机器学习看不懂、代码只会抄;
模型训练全靠师兄师姐给的脚本,出问题也不知道怎么 debug;
论文只看结论和图,不看方法;
生物问题问深一点就卡壳,只能说 “因为论文这么做”。
那确实会很难。因为在企业眼里,你既不是能扛 project 的工程师,也不是能做原创研究的 scientist,就是一个 “会操作别人写好的脚本的 technician”,可替代性极高。
只会做传统 wet-lab,又想靠 “挂个 AI 标签”
如果你主要技能还是实验(PCR、Western、细胞、动物实验),但只是:
在简历上写 “参与 AI 项目”;
实际只是交数据给别人训练模型;
自己对代码和算法都不熟;
那在找 “AI 相关岗位” 的时候,基本上过不了技术面试;找传统生物岗,又会被问:那你实验技能是不是三年都废了?
这种 “中间状态” 是很多人最怕的。
把 “整体大环境焦虑” 全拿来套在自己身上
确实,宏观经济和行业波动都在,裁员消息、PhD 卷上天这些新闻也都是真的。
但最终对你就业起决定性作用的是——你个人的那几个项目、那几个技能点,而不是 “AI 泡沫”“大环境差” 这几个抽象词。
- 如果你现在就要做决策,该怎么评估自己适不适合走这条路?
给你几个简单的自检问题,你可以自己在心里打分:
-
你对 “写代码、看数学公式、查 bug” 这类偏理工的工作,是抗拒还是有兴趣?
-
相比 “做实验”,你更享受的是哪种:
A:在实验台上重复性操作;
B:坐在电脑前拆数据、调模型、看结果?
-
你有没有那种 “为了搞清楚一个技术细节,能自己查文档 / 搜索 / 看源码搞一天” 的耐心?
-
你能不能接受三年里大量时间不在 bench 上,而是在 Linux + Python + paper pile 里打转?
如果对 “写代码、建模、读 paper” 这些事情本身不抵触甚至有点上头,那么 AI biology 对你来说更可能是机会而不是坑。
如果你心底其实还是更喜欢 wet-lab 的那套,而且对代码特别厌烦,那就要认真考虑是否要走 “硬 AI” 方向,还是做 “懂一点计算的生物人” 会更舒服。
- 你现在能做的现实规划
明确一个主轴:决定你是 “偏 CS 的 AI-bio 人” 还是“偏生物的 AI-bio 人”,然后围绕这个主轴补足短板,不要两边都浅尝辄止。
争取至少做出 1–2 个你可以拿出去讲 30 分钟的项目:包含问题背景、数据、方法、结果、局限性和改进方向。
能力证明尽量 “可见”:GitHub、公开数据竞赛成绩、论文 / 预印本、实习经历。这些都是将来找工作时真实的 “筹码”。
主动去了解目标岗位的 JD,看他们要什么栈,然后反推自己这三年该补哪块,而不是闭门造车。
- 回到你的原话:“总觉得 AI biology 奇怪,三年后有工作吗?”
“奇怪” 的部分,在于这个领域现在确实鱼龙混杂,挂名 AI 的课题和岗位里,有真金,也有镀金。
“三年后有工作吗”的真实版本是:有一大堆需要 “懂 AI、懂数据、又能和生物 / 临床对话” 的岗位,但不会为 “啥也不精” 的人买单。
如果你愿意把这三年当成真正的技能积累期,努力让自己变成那种 “能把一个生物问题用 AI 讲清楚、做扎实” 的人,那么 AI biology 不是坑,是跳板。
如果你只是想借着 “热门” 躲避就业压力,希望“专业名头自动带来好工作”,那不只是 AI biology,2025 年以后大概任何专业都会让人失望。
我觉得奇怪的点在于:实验室本身就没有 AI 基础,只是想做 AI 就搞了个 AI biology 方向。让零基础学生去探索,但是外面的企业也这么干。另外,大家都是让 GPT 写写机器学习和深度学习代码,就叫 AI 了。我不确定这样是否有工作深度。而且我认为 AI biology 的前提是做一些基础工作,不是浮于写写机器学习代码去分析数据就叫 AI biology。
你说的这点,其实是现在很多 “AI+X” 里最真实、也最尴尬的部分:
实验室和公司自己没什么 AI 基础,却先把牌子挂出来,让一批零基础学生 + GPT 去 “摸索”。你直觉上觉得虚,这个直觉本身没错,只是需要再拆细一点看:什么是 “假 AI biology”,什么才算有实际深度的方向。
先说白了:你看到的大部分 “AI biology”,确实是浮在表面的
你提到的这几个现象,其实可以挨个拆开:
一是,“实验室本身没有 AI 基础,只是想赶个热点,就开了 AI biology 方向,让零基础学生去试”。
这在全球范围内都存在,不止中国:很多 PI 本身是传统生物、药理、分子生物背景,这两年觉得不搞 AI 没法发文章、没经费,于是就:
-
写本书 / 看几篇综述,拉个懂点编程的协作者;
-
找学生去学机器学习、跑公开数据集;
-
课题题目里加上 “AI-driven”“deep learning”。
这样的组,很容易变成你说的那种状态:
“学生零基础 + 导师半懂不懂 + GPT 代写代码 = 看上去很 AI 的论文题目”。
二是,“外面企业也这么干”。
很多中小药企、生物公司、甚至医院的信息中心,会说自己要搞 “AI 影像”“AI 药物筛选”,实际就是:
-
买现成的工具 / 平台;
-
招 1–2 个数据分析 / 机器学习工程师;
-
让他们把内部数据丢进去跑跑模型,看能不能出点 “AI 报告”。
这种环境下,工作内容就很容易沦为你说的那种:
“拿 GPT 帮忙写个模型代码,调几个参数,出几张图,就叫 AI”。
三是,“用 GPT 写写 ML / DL 代码就叫 AI”。
这确实是现在的一个新问题:以前你不会写代码,就只能老老实实学;现在 GPT 能给你写出 80% 看起来像那么回事的代码,短期内让 “装 AI” 变得太容易。
但是——这里有个很关键的现实:
真正用人、发论文、做产品的地方,看的是 “你能不能让东西稳定、可解释、可落地”。
这一点,光靠 GPT 自动生成代码是撑不住的。GPT 让入门门槛变低,但把 “谁是深、谁是浅” 区分得更明显了:
-
浅的是:会让 GPT 写一段跑完就完事,甚至都不太懂 loss 在干嘛;
-
深的是:会利用 GPT 提高效率,但自己能判断模型是不是在瞎拟合,数据有没有问题,结论能不能站得住。
所以,你直觉上觉得 “大家都在浮油层上划水”,这个现象在“假 AI 环境” 里是真实存在的;
但是如果你据此得出结论:“整个 AI biology 就是浮的,根本没有深度工作”,这一点我是不赞同的。
那什么才叫有 “深度” 的 AI biology?“基础工作”到底是啥?
你提到了一个很关键但抽象的词:“基础工作”。
直觉上你觉得,AI biology 不应该只是拿模型套数据,而是要有更扎实的东西撑着。这个感觉完全对,但要把它讲清楚,需要把 AI biology 拆开来看:
真正有深度的 AI biology,至少包含几层 “基础”:
一层是数据和实验的基础。
简单说:你得知道这些数据是不是靠谱、能不能支撑模型学到有意义的东西。比如:
-
组学数据:RNA-seq、single-cell、ATAC-seq、蛋白组学,这些的实验设计、批次效应、噪声来源,如果你一点都不了解,只会把表达矩阵丢进模型,那做出来的结果八成是 “看着很炫,实际上很假”。
-
结构和分子数据:蛋白结构、配体构象、分子动力学模拟,这些的物理约束、化学合理性,要是没概念,就很容易做出 “模型预测得很好,但分子根本合成不出来” 的东西。
这一层就是你在说的:
“先做基础工作,再谈 AI”。
基础工作不是指 “先做几年没技术含量的打杂”,而是指——你对生物、化学、实验和数据本身要有一定理解,不然 AI 只是空中楼阁。
第二层是算法和建模本身。
这里的 “深度”,不是指你一定要去搞新的 SOTA 模型,而是至少要做到:
-
知道为什么用这种模型,而不是那种(比如,为什么用图网络处理分子,为什么对序列数据用 Transformer 类模型);
-
知道模型的假设是什么、局限在哪儿(比如训练数据的分布、偏差、样本量);
-
知道怎么评估模型是不是在真正学东西,而不是在记数据(交叉验证、外部验证集、前瞻性验证、负对照设计等等)。
当一个组 / 公司只停留在 “GPT 帮我写了个 ResNet / Transformer,我把结果曲线贴在 PPT 上”,那确实不叫有深度的 AI 生物,是在玩样子。
第三层是和生物问题真正闭环。
深一点的 AI biology 一定会问:“模型结果对真实世界有什么可操作的影响?”
比如:
-
药物发现:模型优先推荐的分子,能不能设计实验去验证?如果失败了,为什么失败,模型要怎么改?
-
疾病亚型:用聚类和表示学习发现了新亚型,那临床上能不能分辨?能不能指导不同用药?
-
基因调控 / 通路:建了个调控网络,那网络里的关键节点能不能通过敲除 / 过表达看到预期表型?
这些就是你说的 “基础工作” 往下延伸:
数据有根,模型有脑,实验有手,这三者要互相咬合,而不是各自飞。
你说的那种 “挂 AI 名头,没基础就上”,有没有出路?
非常坦白地说,如果一个实验室 / 公司是这种状态:
-
导师 / 老板本身不懂 AI,只是觉得 “你帮我搞点机器学习,我们也算前沿”;
-
项目基本就是 “下载公开数据集 → 套分类 / 回归 / 聚类模型 → 出一篇文章”;
-
没有长期的、生物学清晰的问题线,也没有认真搭实验验证;
那在这个环境下,即使你天天用 GPT 写代码,三年后你的竞争力也是危险的。你直觉怀疑 “这样有没有工作深度”,不是你太敏感,而是你很清醒。
更现实一点说,这种环境培养出来的人,最容易陷入的困境是:
-
代码只停留在 “能跑” 的层面,工程能力和数学理解都不扎实;
-
生物理解停留在 “略懂流程”,但缺乏对某个系统 / 疾病 / 技术的深刻认识;
-
项目大多基于公开数据集,缺少真正从问题出发、到数据产生、到模型设计、到验证的闭环经历。
这样的履历,放在招聘方眼里,就很容易被归入 “浮在表面的一代 AI 生物人”。
这一点上,我是同意并且支持你的警惕的。
但我也要反驳你一个地方:完全否定 “从零开始探索” 不合理
你说 “实验室没基础就搞 AI biology,让零基础学生探索”,听上去很冒险,但并不意味着一定没价值。关键区别在于:
一种是,导师虽然没 AI 经验,但有清晰的生物学问题和长期积累,比如:
-
做某个疾病十几年,很清楚现在实验数据的痛点;
-
只是之前不用机器学习,如今希望用 AI 手段整合多组学数据、提高筛选效率。
这种情况下,哪怕 AI 部分是你边学边做,只要问题扎实、数据真实、有实验验证,你其实是在做 “从无到有的搭桥”,这很有价值。
另一种是,问题本身也不清楚,只是为了凑个 “AI 题目” 发文章,选什么数据无所谓,结果有没有生物学意义也无所谓,这才是彻底的“空”。
从学生角度,你其实可以用几个问题来判断自己所在的环境更像哪种:
-
这个组有没有一个清晰的生物学 / 医学问题方向?还是题目一年换一个热点?
-
老板对数据和实验是否很在行,只是对 AI 不熟?还是对什么都 “半瓶水响叮当”?
-
项目有没有认真考虑怎么验证模型结论,而不是只停留在 “看上去指标还不错”?
如果前两点是肯定的,第三点有努力在做,那 “从零起步的 AI biology” 其实还算是个上升期环境;
如果三点都比较虚,那你的担心基本就是现实风险。
你真正需要搞清楚的是:你想要成为什么样的人?
现在的困惑,其实可以翻译成一句更直白的话:
“我不想变成那种只会拿 GPT 写模型、却没有真实含金量的人,那我到底该怎样在 AI biology 里走得更深?”
客观一点说,有几个选择方向:
如果你仍然想待在这个领域里,那你要刻意对抗 “浮” 的那一面。比如:
-
在生物学上,选一块你真心想搞懂的东西,不要什么都浅尝辄止;
-
在技术上,至少把一条完整的链条吃透:从数据获取 → 预处理 → 特征 / 表示 → 模型 → 评估 → 可解释性 → 实验验证设计;
-
在使用 GPT 上,把它当成工具,而不是拐杖:让它帮你写样板代码、查 API,但关键设计、指标、对结果的质疑要由你来承担。
如果你发现自己对编程和建模其实没兴趣,那就值得诚实面对:
你可能更适合在生物学 / 医学 / 实验一侧走深,比如成为那种 “特别懂某个疾病机制 / 某个技术平台的人”,将来和 AI 团队合作,而不是亲自写模型。
这样的角色在真正成熟的团队里非常需要,不是 “低一等的选项”。
如果你既不想搞深生物、也不想搞深 AI,只是希望混一个 “看起来前沿” 的方向,那我会很老实地说:
无论 AI biology 还是其他什么热门交叉学科,很大概率都会在 3–5 年内把你淘汰掉。
因为 GPT 帮你写皮毛代码,AI 工具帮你做基础分析,这些浅层东西最容易被自动化掉。
最后帮你把这件事说穿
你现在觉得奇怪,是因为你隐约感受到一个事实:
“AI biology 这个牌子,本身已经不再是含金量的保证,真正有用的是你在里面沉淀下来的那套能力和视角。”
在这一点上,我是完全站你这边的。
但我不会顺着说 “那就别碰 AI biology 了”,因为如果你对这个领域还有兴趣、也愿意认真练功,这条路依然有深度,也有工作,只是:
-
不能指望 “实验室说是 AI 方向,你就自然有深度”;
-
更不能指望 “会用 GPT 写代码,就算掌握 AI”。
你真正在找的 “基础工作”,其实就是:
对生物问题的扎实理解 + 对数据和实验的尊重 + 对模型的清醒判断 + 对闭环验证的执着。
这些东西不写在专业名字上,也不自动随研究方向附赠,只能靠你选对环境、选对导师、选对项目,再加上自己下功夫一点一点积累。