黑龙江网站备案免费的ppt制作软件

张小明 2026/1/19 18:59:28
黑龙江网站备案,免费的ppt制作软件,济南手机网站,编程培训班学费一般多少钱在大语言模型#xff08;LLM#xff09;快速发展的今天#xff0c;如何让模型基于我们自己的私有知识进行准确回答#xff0c;成为了一个关键问题。检索增强生成#xff08;Retrieval-Augmented Generation, RAG#xff09;正是解决这一问题的有效范式。本文将通过一段完…在大语言模型LLM快速发展的今天如何让模型基于我们自己的私有知识进行准确回答成为了一个关键问题。检索增强生成Retrieval-Augmented Generation, RAG正是解决这一问题的有效范式。本文将通过一段完整的 Python 代码带你使用LangChain框架构建一个本地 RAG 系统并借此介绍 LLM 应用开发中的核心组件——虽然标题提到“LLMIndex”但实际在 LangChain 生态中我们更常使用 FAISS、Chroma 等向量数据库来实现类似功能注LLMIndex 是 LlamaIndex 项目的核心概念而本文使用的是 LangChain。说明本文示例基于LangChain 本地运行的 Qwen 模型通过http://127.0.0.1:1234/v1提供 OpenAI 兼容 API适合希望在本地部署私有知识问答系统的开发者。一、准备工作pipinstalllangchain langchain-community langchain-openai python-dotenv faiss-cpu同时你需要一个本地运行的大模型服务如 LM Studio、Ollama 或 vLLM并开启 OpenAI 兼容 API端口 1234。一份名为knowledge.txt的文本知识库文件UTF-8 编码。在.env文件中配置OPENAI_API_KEY即使使用本地模型LangChain 仍要求提供 API Key可设为任意字符串如sk-local。二、代码解析构建 RAG 流程1. 加载环境变量与文档load_dotenv()api_keyos.getenv(OPENAI_API_KEY)loaderTextLoader(knowledge.txt,encodingutf-8)documentsloader.load()这里我们使用TextLoader读取本地知识文件。LangChain 支持多种格式PDF、Word、网页等可根据需求替换加载器。2. 文本分块Chunkingtext_splitterRecursiveCharacterTextSplitter(chunk_size300,chunk_overlap50)textstext_splitter.split_documents(documents)由于 LLM 有上下文长度限制需将长文档切分为小段。RecursiveCharacterTextSplitter按字符递归分割保留语义连贯性chunk_overlap避免信息割裂。3. 向量化与向量存储embeddingsOpenAIEmbeddings(modeltext-embedding-qwen3-embedding-0.6b,api_keyapi_key,base_urlhttp://127.0.0.1:1234/v1)vectorstoreFAISS.from_documents(texts,embeddings)关键点来了我们使用本地嵌入模型如 Qwen Embedding将文本转换为向量并存入FAISSFacebook 开源的高效相似性搜索库。这一步相当于构建了“知识索引”——类似于 LlamaIndex 中的VectorStoreIndex。4. 配置本地大语言模型llmChatOpenAI(modelqwen2.5-7b-instruct-1m,api_keyapi_key,base_urlhttp://127.0.0.1:1234/v1)通过 OpenAI 兼容接口调用本地 Qwen 模型无需联网保障数据隐私。5. 构建 RAG 链retrievervectorstore.as_retriever(search_kwargs{k:3})template使用以下上下文片段来回答问题。 如果你不知道答案就说你不知道不要编造答案。 {context} 问题: {question} 有用的回答:promptChatPromptTemplate.from_template(template)defformat_docs(docs):return\n\n.join(doc.page_contentfordocindocs)qa_chain({context:retriever|format_docs,question:RunnablePassthrough()}|prompt|llm|StrOutputParser())这是 LangChain 的精髓声明式链式编程。retriever从向量库中找出最相关的 3 个文本块format_docs将检索结果拼接成字符串prompt注入上下文和问题llm生成答案StrOutputParser提取纯文本。整个流程清晰、模块化易于调试和扩展。6. 提问与输出queryLangChain 支持哪些功能resultqa_chain.invoke(query)print(问题,query)print(回答,result)系统会自动检索knowledge.txt中相关内容并基于上下文生成精准回答。三、为什么不用 LlamaIndex你可能会问既然提到了 “LLMIndex”为什么不直接用 LlamaIndexLlamaIndex更专注于数据索引与查询优化适合复杂知识图谱、多模态索引等场景LangChain则是一个通用 LLM 应用框架强调链式组合、工具集成如 Agent、Memory。两者并非互斥甚至可以结合使用。但在简单 RAG 场景下LangChain FAISS 已足够高效。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

上海网站建设网站开发中国货源大全网

简介 本文详细记录了美团大模型算法岗位面试经历,涵盖模型结构、训练流程、推理优化、多模态技术等核心问题。文章提供了具体问题的解答思路,总结了面试准备关键点,包括扎实基础知识、紧跟技术前沿、动手实践能力和项目深度表达能力。对准备大…

张小明 2025/12/24 10:14:26 网站建设

对文化传播网站建设的建议wordpress 文章带字段

Easy-Scraper终极指南:零基础掌握网页数据采集技巧 【免费下载链接】easy-scraper Easy scraping library 项目地址: https://gitcode.com/gh_mirrors/ea/easy-scraper 还在为复杂的数据抓取任务而烦恼吗?传统爬虫工具需要掌握繁琐的CSS选择器或X…

张小明 2025/12/24 10:12:18 网站建设

徐州网站建设方案维护dede网站漏洞

在当今快速迭代的软件开发环境中,测试工具的选择直接影响项目的效率、质量和成本。对于软件测试从业者而言,一个合适的测试工具不仅能提升测试覆盖率,还能优化团队协作,降低维护负担。然而,市场上工具琳琅满目&#xf…

张小明 2025/12/24 10:11:14 网站建设

大网站php做旅游网站

概述利用GLAD的优化功能,谐振腔命令可以对谐振腔的各个参数进行优化设计。整个设计分为两个过程:首先,利用“resonator/test”和“resonator/set”命令对给定腔镜参数的谐振腔确定腔内本征模的尺寸。然后利用GLAD的优化功能针对特殊的谐振腔参…

张小明 2026/1/8 7:32:02 网站建设

深圳网站建设 龙华信科咨询网站建设合同书-详细版

YuukiPS Launcher终极指南:5分钟轻松管理多款动漫游戏 【免费下载链接】Launcher-PC 项目地址: https://gitcode.com/gh_mirrors/la/Launcher-PC 还在为管理多款动漫游戏而烦恼吗?YuukiPS Launcher正是你需要的解决方案!这款开源启动…

张小明 2025/12/24 10:09:06 网站建设