文章目录
- 前言
- 一、一个长期困扰 NLP 团队的问题
- 二、传统 NLP 时代:被流水线锁死的领域
- 1. 流水线范式是怎么来的
- 2. 流水线天生带的两个原罪
- 三、BERT 时代:预训练打通了一半的任督二脉
- 1. BERT 干了什么
- 2. 但 BERT 卡在了一半
- 四、LLM 的本质:把所有任务收编成「预测下一个 token」
- 1. CLM:压根不需要人工标注的训练目标
- 2. 一个模型接口收编了所有任务
- 3. 为什么"预测下一个词"能逼出这么多能力
- 4. 副产物:In-Context Learning
- 五、涌现能力:量变到质变的真正含义
- 1. 涌现到底指什么
- 2. 三个最具代表性的涌现现象
- 3. 涌现背后的工程经验:Scaling Law
- 4. 涌现不等于"越大越好"
- 六、三个层面看清 LLM 与传统 NLP 的根本差距
- 1. 工程层面:从拼乐高到统一系统
- 2. 范式层面:从分类器思维切到生成器思维
- 3. 能力层面:模型可以做"没被显式教过"的任务
- 七、这场范式重写对工程团队意味着什么
- 1. 项目第一件事的变化
- 2. 工程师技能栈的重写
- 3. 对架构师的具体影响
- 八、什么场景反而不该急着上 LLM
- 1. 任务规则极其稳定、QPS 极高的轻量分类
- 2. 强合规、强可解释、监管必须能复现判定逻辑的场景
- 3. 任务量小、数据敏感、不能把数据外发的场景
- 4. 已经有成熟 pipeline 在跑、改造收益跑不赢迁移成本的存量场景
- 九、给一线技术人的几条落地建议
- 1. 学 LLM 之前,先把传统 NLP 的痛点过一遍
- 2. 第一个 LLM 项目,别上来就做 Agent
- 3. 把"prompt 当代码"管起来
- 4. 评估指标要早建,不要等出事再补
- 5. 拥抱"不确定性",但用工程手段把它框住
- 总结
前言
带 NLP 团队的同事最近都有一种集体懵的感觉:明明十几年前就在做"自然语言处理",怎么 ChatGPT 一出来,自己手里的活儿就像被人按了重启键?招聘 JD 全变了,技能栈全变了,连项目排期表的第一行都从"数据怎么标"变成了"prompt 怎么写"。
很多人尝试解释这一切的时候,会落到一句很顺口但其实没说清的话——“因为 LLM 参数比以前大很多”。这句话不算错,但抓不住关键。真正决定 LLM 和传统 NLP 走出两条不同道路的,不是参数多了几个零,而是"任务被组织的方式"被换掉了。
这篇文章是用一个老架构师的视角,把"LLM 到底凭什么颠覆传统 NLP"这件事完整拆透——不堆术语、不绕弯子,直接讲清楚底层逻辑、工程影响和落地边界。
读完这篇文章,你能搞明白:
- 传统 NLP 流水线为什么被锁在一个结构性死循环里出不来
- BERT 完成了哪一半的革命、又卡在哪一半没解决
- LLM 凭一个"预测下一个 token"目标,为什么能把整个 NLP 任务空间收编了
- 涌现能力到底是工程现实还是测量假象,怎么在技术访谈里讲到点上
- 哪些场景反而不该急着上 LLM,怎么判断 ROI 划不划算
- 第一个 LLM 项目怎么起步、prompt 怎么管、评估指标怎么建
不管你是刚转向大模型方向想搞清底层逻辑的工程师,还是带团队做技术选型需要给业务方解释清楚的 leader,还是准备应聘 AI 岗位想答好"LLM vs 传统 NLP"这道高频面试题的同学,这篇都给你提供一份完整的思维