深入LLM与RAG 原理、实现与应用

woaidaqipaiqiu1122 · · 461 次点击 · · 开始浏览    
深入LLM与RAG 原理、实现与应用 一、什么是 RAG? RAG 全称 Retrieval-Augmented Generation,翻译成中文是检索增强生成。检索指的是检索外部知识库,增强生成指的是将检索到的知识送给大语言模型以此来优化大模型的生成结果,使得大模型在生成更精确、更贴合上下文答案的同时,也能有效减少产生误导性信息的可能。 二、RAG 的流程 RAG 的中文名称是检索增强生成,从字面意思来理解,包含三个检索、增强和生成三个过程。 检索: 根据用户的查询内容,从外挂知识库获取相关信息。具体来说,就是将用户的查询通过嵌入模型转换成向量,以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索,从向量数据库中找出最匹配的前 K 个数据。 增强: 将用户的查询内容和检索到的相关知识一起嵌入到一个预设的提示词模板中。 生成: 将经过检索增强的提示词内容输入到大语言模型(LLM)中,以此生成所需的输出。 三、RAG(Retrieval-Augmented Generation)是一种深度学习模型,结合了检索和生成两种方法,用于生成自然语言文本。它的原理是结合了两种主要组件: 1、检索(Retrieval):RAG模型使用检索技术从大型语料库中检索相关信息。这些信息可以是文档、文章、网页或其他文本片段。通过检索相关信息,RAG可以在生成文本时利用这些信息作为参考或灵感来源。 2、生成(Generation):RAG也包含一个生成器,通常是一个预训练的语言模型,例如GPT(Generative Pre-trained Transformer)。生成器负责根据输入信息和检索到的内容生成最终的文本输出。生成器通常会在检索到的信息的基础上进行细化和扩展,以生成更准确、更丰富的文本。 四、LLM能做什么 总体可以概括为:创作内容、处理和分析数据、自动化任务、智能客服 • 写作:写邮件、计划书、宣传文案、简单的故事等,可以模仿小红书风格、指定作家风格,尤其适合写长篇套话,但目前要写出完整且有趣的小说还比较难。 • 润色:提供大纲或已有文本,由LLM来扩写、改写,适用于洗稿、避免被查重等场景。 • 总结:提供会议记录、文章,由LLM自动总结要点和待办。 • 翻译:多语言翻译、白话文和文言文翻译,结合特定prompt进行多轮翻译可以实现惊艳的结果。 • 数据分析:从报告中提取数据、分析数据,做成可视化图表。 • 编程:Github Copilot,程序员都应该用。 • 提取结构化信息:从用户的自然语言中,提取出结构化的信息,方便传给程序做自动化处理。 • 智能助手:利用Agent实现工作流 • 智能客服:基于RAG实现智能客服 LLM有什么缺陷 目前LLM最大的缺陷是幻觉严重,经常会生成无中生有的回复,如果你没有对应的专业知识,很容易被带偏。所以如果你要用于工作、教育等严肃场景,人工二次校验是必要的。幻觉短期内是无法消除的,甚至LLM的泛化能力也跟幻觉有关,就像人类会做离奇的梦一样。为了解决LLM回复准确性的问题,RAG技术被广泛应用。 另外还有一些问题:训练信息更新不及时、逻辑能力差、推理速度慢等。 ![QQ截图20240926151732.png](http://static.itsharecircle.com/240926/06e37395116b2754aa8f0306141478e4.png)
461 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传