RAG 的问题从来不是“模型不够大”,而是链路不够稳定

一条最小可用 RAG 流水线

  1. 原始语料 → 清洗与切分
  2. 向量化 → 索引
  3. 检索 → Top-k
  4. 重排 → 相关性收敛
  5. 生成 → 引用约束
  6. 评估 → 可回溯指标

如果你只能优化一处,优先 重排 + 评估