RAG 的问题从来不是“模型不够大”,而是链路不够稳定。 一条最小可用 RAG 流水线 原始语料 → 清洗与切分 向量化 → 索引 检索 → Top-k 重排 → 相关性收敛 生成 → 引用约束 评估 → 可回溯指标 如果你只能优化一处,优先 重排 + 评估。