上海方正大厦网站建设制作公司的网站

张小明 2026/1/19 19:01:42
上海方正大厦网站建设,制作公司的网站,wordpress 分页个数,建网站要备案作者#xff1a;望宸 LangChain 近期发布了《State of Agent Engineering》报告#xff0c;内容比较翔实#xff0c;全面分析了 AI 智能体在企业中的采用现状、挑战与趋势。#xff08;或尚未应用的原因#xff09; 我们对报告进行了翻译#xff0c;并做了些描述和内容…作者望宸LangChain 近期发布了《State of Agent Engineering》报告内容比较翔实全面分析了 AI 智能体在企业中的采用现状、挑战与趋势。或尚未应用的原因我们对报告进行了翻译并做了些描述和内容排序上的的优化让中文读者更易于理解。同时我们将今年 9 月底发布的《AI 原生应用架构白皮书》中的部分调研数据和《State of Agent Engineering》进行比对以了解智能体工程现状在国内外的差异以及对共性问题提供了些应对思路。报名与白皮书原文《State of Agent Engineering》https://www.langchain.com/state-of-agent-engineering《AI 原生应用架构白皮书》https://developer.aliyun.com/ebook/8479《State of Agent Engineering》人群画像1340 份有效回复包括工程师、产品经理、业务负责人和企业高管。《AI 原生应用架构白皮书》人群画像来自参加杭州、上海、北京、深圳、广州举办的 6 场 AI 原生为主题的线下开发者沙龙填写问卷的总人数是 1382 人以架构师、后端、运维、技术负责人为主。什么是智能体工程智能体工程是将大语言模型LLM转化为可靠系统的迭代过程。由于智能体具有不确定性我们认为工程师必须通过快速迭代来持续优化其输出质量。核心发现企业的关注度不再问是否要构建智能体而是关注如何可靠、高效且规模化地部署智能体且这一趋势会一直蔓延到 2026 年直到能有效的解决问题。核心发现生产落地势头强劲57% 的受访者已将智能体投入生产环境大型企业引领采纳潮流。质量是最大拦路虎32% 的人将“质量”列为首要障碍相比之下成本担忧较去年有所下降。可观测性已成为标配近 89% 的受访者为其智能体实施了可观测性方案远超评估evals的采用率52%。多模型策略成常态OpenAI 的 GPT 系列模型占据主导但 Gemini、Claude 和开源模型也获得广泛应用微调尚未普及。大型企业引领采纳浪潮超过半数57.3%的受访者表示其公司已在生产环境中运行智能体另有 30.4% 正在积极开发并有明确的上线计划。这标志着相较于去年51% 的受访者称已有智能体上线有了显著增长。企业正从概念验证阶段迈向生产部署。《AI 原生应用架构白皮书》中关于实施进程的调研结果国内外的智能体发展势头均比较强势企业关注的不再是“是否”要推出智能体而是“如何”以及“何时”。规模效应显现在员工规模超 10,000 人的大型组织中67% 已部署智能体24% 正在开发中而在员工少于 100 人的小型组织中这一比例分别为 50% 和 36%。这表明大型企业正更快地从试点走向可持续演进可能得益于其在平台团队、安全性和可靠性基础设施上有着更大的投入。主流智能体应用场景客户服务是最常见的智能体用例26.5%紧随其后的是研究与数据分析24.4%。这两类应用合计占所有主要部署场景的一半以上。这一结果表明企业正越来越多地将智能体直接面向客户而不仅限于内部使用。同时智能体在提升内部效率方面也表现出显著的价值18% 的受访者提到将其用于内部工作流自动化。研究与数据分析场景的流行进一步印证了智能体当前的优势所在即整合海量信息、跨源推理并加速知识密集型任务。今年的受访者选择的应用场景更加分散每人仅可选一项主要用例说明智能体的应用正在从早期少数场景向更广泛的领域拓展。大企业的偏好略有不同在万人以上企业中内部生产力提升成为首要用例26.8%客户服务24.7%和研究与数据分析22.2%紧随其后。这表明大型企业可能优先聚焦于提升内部团队效率再逐步或同步向终端用户部署。《AI 原生应用架构白皮书》提供了以下 4 类落地场景供多选重塑客户互动 重塑业务流程 提升员工体验 推动创新突破。结合两份数据客户服务和企业内提效是智能体最确定的应用场景。投产的最大障碍质量、延迟与安全质量仍是头号难题与去年一致。今年有三分之一的受访者将其列为最大障碍。这里的“质量”涵盖准确性、相关性、一致性以及智能体能否保持恰当语气并遵守品牌或政策规范。延迟成为第二大挑战20%。随着智能体进入客户服务、代码生成等面向客户的场景响应速度已成为用户体验的关键。这也反映了团队在质量与速度之间的权衡能力更强、步骤更多的智能体虽能产出更高质量结果但响应往往更慢。成本作为担忧因素的提及率低于往年。模型价格下降和效率提升似乎已将组织的关注点从“花费多少”转向“如何让智能体又快又好”。《AI 原生应用架构白皮书》侧重于技术层面的挑战进行调研长回话状态管理 算力资源调度 数据梳理链路 异步通信需求和质量、延迟、成本有所呼应。规模带来的新挑战在 2,000 人以上的大型企业中安全跃升为第二大障碍24.9%超过了延迟。这反映出大型组织对数据合规、权限控制和审计追踪的更高要求。在万人以上企业中开放式回答指出幻觉和输出一致性是确保智能体质量的最大挑战。许多人还提到在大规模场景下进行上下文工程和管理上下文仍十分困难。《AI 原生应用架构白皮书》中提供了上下文工程和 AI 安全的一些初步探索。其中上下文工程是技术难点安全则依赖组织的体系化设计。智能体可观测性已成为行业标配对多步推理链和工具调用进行追踪的能力如今已是智能体工程的“基本要求”。89% 的组织已为其智能体实施了某种形式的可观测性其中 62% 具备详细追踪能力可检查智能体的每一步操作和工具调用。在已上线智能体的团队中这一比例更高94% 拥有某种可观测性71.5% 具备完整追踪能力。这揭示了一个基本事实若无法看清智能体如何推理和行动团队就无法可靠地调试故障、优化性能也无法赢得内外部利益相关者的信任。《AI 原生应用架构白皮书》调研了可观测的主流应用场景。同时《AI 原生应用架构白皮书》提供了相关的理论和实践。解决以上痛点的关键能力是端到端的全链路跟踪、全栈观测、自动化评估。智能体评估与测试仍在追赶尽管可观测性已广泛普及但智能体评估evals的采用仍在追赶中。略超一半的组织52.4%报告会在测试集上运行离线评估表明许多团队已意识到在部署前捕捉回归和验证行为的重要性。在线评估online evals的采用率较低37.3%但正在快速增长因为团队开始监控智能体在真实世界中的表现。对于已上线智能体的团队评估实践明显更成熟“不评估”的比例从 29.5% 降至 22.8%而进行在线评估的比例升至 44.8%。这表明一旦智能体面对真实用户团队就必须依赖生产数据实时发现问题。大多数团队仍从离线评估入手因其门槛较低、设置更清晰但许多正在叠加多种方法。在开展评估的组织中近四分之一同时使用离线和在线评估。这些团队通常结合人工评审与自动化方法用 LLM-as-Judge 实现广度覆盖用人工审核处理深度判断。总体而言人工评审59.8%在高风险或需细腻判断的场景中仍不可或缺而 LLM-as-Judge53.3%则被越来越多地用于规模化评估质量、事实准确性和合规性。相比之下传统的机器学习指标如 ROUGE、BLEU采用率很低在开放式智能体交互中往往存在多个有效答案这些指标并不适用。《AI 原生应用架构白皮书》也认为传统的机器学习指标如 ROUGE、BLEU存在较高的局限性。更流行的是 LLM-as-Judge 范式并提供了利用在线数据实现自动化评估的实践框架。模型与工具生态开放、多元、务实OpenAI 模型占据主导但很少有团队押注单一供应商。超过三分之二的组织使用 OpenAI 的 GPT 系列模型但超过四分之三75%在生产或开发中使用多个模型。团队越来越倾向于根据任务复杂度、成本和延迟等因素将不同任务路由给不同模型而非陷入平台锁定。《AI 原生应用架构白皮书》中提到多模型策略是常态通过 AI 网关可以高效、安全、量化管理模型供应和 Token 的消耗。尽管商业 API 使用便捷但自托管模型仍是重要策略。约三分之一的组织投入资源建设自有基础设施以部署开源模型。这可能是出于高用量下的成本优化、数据驻留/主权要求或特定行业的监管约束。同时微调仍未普及。57% 的组织未进行任何微调而是依赖基础模型结合提示工程和检索增强生成。由于微调需要大量投入数据收集、标注、训练基础设施和持续维护目前主要用于高影响力或高度专业化的场景。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

建设银行六安市分行网站深圳网站建设自己人

FinSight团队 投稿量子位 | 公众号 QbitAI能自动查数据、写分析、画专业金融图表的AI金融分析师来了!最近,中国人民大学高瓴人工智能学院提出了一个面向真实金融投研场景的多模态研报生成系统——玉兰融观(Yulan-FinSight)。面对用…

张小明 2026/1/17 21:20:33 网站建设

湖州房产网站建设网站建设规划书实训报告

第一章:Open-AutoGLM应用适配优化趋势 随着大模型在垂直领域落地需求的不断增长,Open-AutoGLM作为开源自动化语言模型框架,正经历从通用能力向场景化适配演进的关键阶段。其核心优化趋势集中在提升推理效率、降低部署成本以及增强多环境兼容性…

张小明 2026/1/17 21:20:32 网站建设

官方建设网站seo手机排名软件

新手必看:mimalloc内存分配器快速上手完整指南 【免费下载链接】mimalloc mimalloc is a compact general purpose allocator with excellent performance. 项目地址: https://gitcode.com/GitHub_Trending/mi/mimalloc 你是否曾经因为程序内存占用过高而烦恼…

张小明 2026/1/17 21:20:35 网站建设

蓝色脚手架织梦企业网站模板在哪里做公司网站

DBO-DELM【23年新算法】,基于蜣螂优化算法(DBO)优化深度极限学习机(DELM)的数据回归预测(可以更换为单变量/多变量时序预测),Matlab代码,可直接运行,适合小白新手 程序已经调试好,无需更改代码替换数据集即可运行数据格…

张小明 2026/1/17 21:20:36 网站建设

上海金瑞建设集团网站网站和服务器

网络文件共享与服务配置指南 在网络环境中,文件共享和服务配置是非常重要的环节。本文将详细介绍Samba挂载、DHCP服务以及Apache HTTP服务器的相关配置,帮助你更好地管理和使用网络资源。 1. Samba挂载配置 Samba是一种用于在不同操作系统之间共享文件和打印机的协议。在进…

张小明 2026/1/17 21:20:37 网站建设