我是谁:从“会用模型”到“把模型用成系统”
这几年,大模型从“能聊天”进化到“能推理、能规划、能调工具”,但真正落地时,很多问题并不在模型本身:数据怎么来、知识怎么管、RAG 怎么评、系统怎么跑、合规怎么过、效果怎么验收。 我更关心的不是“又出了什么新模型”,而是:如何把能力沉淀成工程化、可复用、可迭代的落地体系。
“焱论AI”就是我做这件事的长期记录:把大模型技术栈拆开讲清楚,再把它们按行业场景拼成一套能跑的方案。
我为什么写:把碎片经验变成路线图
行业落地最大的痛点是碎片化:
- 论文里是理想设定,业务里是边界条件
- Demo 很快,但生产很慢
- 指标看起来漂亮,但用户不买账
- 检索召回上去了,答案却更发散了
所以我打算系统性写:
- 论文的关键结论(为什么有效、在什么条件下失效)
- 工程的关键决策(选型、架构、评估、上线、监控)
- 工具的关键能力(推理引擎、国产 GPU、RAG 框架、评测工具链)
- 行业的关键约束(数据质量、权威性分级、审计留痕、可解释与合规)
目标很简单:让“行业大模型”从热词变成一套可执行的工程方法。
我会怎么写:论文为主,工程为辅,工具加持,杂谈引流
我会长期坚持这四个栏目:
- 📄 论文解读:LLM / RAG / 多模态 / 推理 / Agent 的关键论文精读与复现要点
- ⚙️ 工程实践:微调、部署、推理服务、RAG 落地、评估体系、数据治理
- 🧰 工具解析:推理引擎、评测框架、国产 GPU 生态、工程脚手架
- ✍️ 杂谈:行业趋势、个人成长、踩坑记录、方法论沉淀
你会发现我会反复强调两个词:可复用 与 可验证。 因为只有这两件事,才能把“效果”变成“交付”。
你能在这里得到什么
如果你是 AI 学习者:你会得到一条更贴近真实工程的学习路线。 如果你是算法/工程同学:你会得到从“论文结论”到“系统交付”的桥梁。 如果你来自行业侧:你会得到“怎么评估、怎么治理、怎么上线”的落地框架。
约定:长期更新,不追热点但会追本质
我会关注新东西,但不会被热点带着跑。我更愿意做两件事:
- 把关键知识写成能复用的“模块”
- 把落地问题写成能验证的“指标与方案”
如果你也在做大模型落地,希望这份“焱论AI”的路线图能帮到你。
下一篇:我会先从 RAG 可信性 开始:如何设计评估集与指标,避免“召回越多、答案越飘”。