Skip to content

简介

RAG(检索增强生成)技术,可用于在个人电脑上搭建一个基于大模型的本地知识库,RAG的工作原理可以分为以下几个步骤: 1.系统接收到用户的请求(例如提出一个问题)-接收请求 2.系統从大型文档库中检索查询与问题相关的文档片段,该过程可能使用向量数据检索技术(或者关系型数据库、SQL、全文搜索引擎Elasticsearch等方式) -R 3.将检索到的文档与原始查询输入到大模型中(使用适当的提示词Prompt)-A 4.大模型基于以上步骤生成一个答案 -G

下载并启动ollama

启动第一个模型: llama3.2,首次启动会自动下载模型,时间会比较久

bash
ollama run llama3.2

参考链接

  1. langchain+ollama构建本地大模型应用
  2. LangChain4j系列:LangChain4j Easy-Rag示例及RAG APIs详解
  3. 使用LangChain4j构建本地RAG系统