CloudCanal RAG 实战|如何让问答机器人“智能”起来
· 阅读需 8 分钟
在之前的文章中,我们介绍了如何使用 CloudCanal 和 Ollama 搭建全栈私有的 RAG 问答服务,为企业级 RAG 应用提供了部署简单、安全可靠的解决方案。
最近,我们用这套方案,在 CloudCanal 官网上线了基于 知识库 的智能问答机器人。在发布前的测试过程中,却发现它似乎没有想象中那么“智能”,出现了答非所问、检索失焦、上下文理解有误等问题。
今天,我们将从 CloudCanal 官网问答机器人工程实践出发,深入分析传统 RAG 的瓶颈,并介绍 CloudCanal RAG 的针对性优化策略,展示如何构建一个真实可用的智能问答机器人。
传统 RAG 模式的问题
传统 RAG 流程简化如下:
- 原始文档 → 切分 → 向量化 → 存入向量数据库
- 用户提问 → 转换为查询向量 → 相似度检索 → 拼接上下文
- 构造 Prompt → 输入大模型 → 大模型推理并回答
这一流程看似十分合理,但实际操作时却会发现各种各样的问题: