目录
方案流程
1. Embeddings 介绍
术语:微调 vs 嵌入
一句话理解便是:embedding model 可以将文本转换为固定长度的连续向量。
架构流程图
3、Qdrant云数据库的搭建
3.1、初识Qdrant
3.2、创建云数据库
3.3、通过curl 接口访问
4、写入测试数据
4.1、准备测试数据
4.2、调用embeddingAPI :将测试数据转换为向量数据
将上面准备好的向量数据数组全部写入向量数据库
通过运行接口来调试一下
5、开始查询数据
5.1、将查询字符串转换为向量数据
5.2、根据向量来查询匹配相关性高的前三条记录
5.3、通过chatGPT对查询的相关性数据进行优化
5.4、调试效果
6、总结
参考资料
方案流程
- 将本地答案数据集,转为向量存储到向量数据。
- 当用户输入查询的问题时,把问题转为向量然后从向量数据库中查询相近的答案topK 这个时候其实就是我们最普遍的问答查询方案,在没有GPT的时候就直接返回相关的答案整个流程就结束了。
- 现在有GPT了可以优化回答内容的整体结构,在单纯的搜索场景下其实这个优化没什么意义。但如果在客服等的聊天场景下,引用相关领域内容回复时,这样就会显得不那么的突兀。
本项目的代码全部开源, GitHub地址为:


发布评论