FastAPI + 大模型推理服务的最小骨架

与其堆功能,不如先把日志、限流、超时这些‘无聊但关键’的东西做好。

为什么重排几乎总能提升 RAG 效果

Embedding 负责“找得到”,重排负责“排得准”,这是两个完全不同的问题。

把博客当产品:内容路线图怎么设计

栏目不是分类,而是信息架构;节奏不是勤奋,而是供给控制。

焱论AI:为什么我要系统性写大模型与行业落地

我会用“论文为主,工程为辅,工具加持,杂谈引流”的结构,持续输出大模型与行业落地的可复用方法与路线图。