简介
RAG(检索增强生成)技术,可用于在个人电脑上搭建一个基于大模型的本地知识库,RAG的工作原理可以分为以下几个步骤: 1.系统接收到用户的请求(例如提出一个问题)-接收请求 2.系統从大型文档库中检索查询与问题相关的文档片段,该过程可能使用向量数据检索技术(或者关系型数据库、SQL、全文搜索引擎Elasticsearch等方式) -R 3.将检索到的文档与原始查询输入到大模型中(使用适当的提示词Prompt)-A 4.大模型基于以上步骤生成一个答案 -G
下载并启动ollama
启动第一个模型: llama3.2,首次启动会自动下载模型,时间会比较久
bash
ollama run llama3.2