为什么代理是生成式人工智能的下一个前沿
2024年7月24日| 文章
经过拉雷纳·伊, 崔世安, 和 罗杰·罗伯茨
和许志强
分享
下载
通过将信息转化为行动(想象一下能够完成复杂工作流程的虚拟同事),该技术有望带来新一波生产力和创新浪潮。
下载
过去几年,生成式人工智能(gen AI)所释放的能力和可能性令世界惊叹。大型语言模型(LLM)等基础模型能够实现令人印象深刻的成就,提取洞见,并生成涵盖文本、音频、图像和视频等众多媒介的内容。但下一阶段的生成式人工智能可能会更具变革性。
我们正开启一场变革,从基于知识、由新一代人工智能驱动的工具(例如,能够回答问题并生成内容的聊天机器人)向新一代人工智能赋能的“代理”演进,后者能够使用基础模型在数字世界中执行复杂的多步骤工作流程。简而言之,这项技术正在从想法转化为行动。
分享
侧边栏
关于麦肯锡旗下人工智能公司 QuantumBlack
广义上讲,“代理”系统是指能够在动态世界中独立交互的数字系统。虽然这些软件系统的版本已经存在多年,但新一代人工智能的自然语言功能揭示了新的可能性,使系统能够规划自身行动,使用在线工具完成任务,与其他代理和人员协作,并学习提高自身性能。新一代人工智能代理最终可以充当熟练的虚拟同事,以无缝自然的方式与人类合作。例如,虚拟助理可以规划和预订复杂的个性化旅行行程,处理跨多个旅行平台的物流。使用日常语言,工程师可以向程序员代理描述新的软件功能,然后程序员代理将对其协助创建的工具进行编码、测试、迭代和部署。
这篇文章对您来说有多大相关性和实用性?
最受欢迎的见解
传统上,代理系统难以实现,需要费力的、基于规则的编程或高度专业的机器学习模型训练。人工智能改变了这一点。当使用基础模型(已在极其庞大且多样的非结构化数据集上训练过)而非预定义规则构建代理系统时,它们有可能适应不同的场景,就像法学硕士(LLM)能够清晰地响应 未经明确训练的提示一样。此外,使用自然语言而非编程代码,人类用户就可以指示支持人工智能的代理系统完成复杂的工作流程。然后,多代理系统可以将此工作流程解释并组织成可操作的任务,将工作分配给专门的代理,使用数字工具生态系统执行这些精细化的任务,并与其他代理和人类协作,以迭代方式改进其操作的质量。
在本文中,我们将探讨使用新一代人工智能代理所带来的机遇。尽管这项技术仍处于起步阶段,在投入商业部署之前还需要进一步的技术开发,但它正迅速引起人们的关注。仅在过去的一年里,谷歌、微软、OpenAI 等公司就已投资开发软件库和框架,以支持代理功能。诸如 Microsoft Copilot、Amazon Q 以及谷歌即将推出的 Project Astra 等基于法学硕士 (LLM) 的应用程序正在从基于知识的模式转向基于行动的模式。Adept、crewAI 和 Imbue 等公司和研究实验室也在开发基于代理的模型和多代理系统。鉴于新一代人工智能的发展速度,代理可能会像如今的聊天机器人一样普及。
代理商能给企业带来什么价值?
座席能够释放的价值在于,他们有潜力自动化处理一系列复杂的用例,这些用例的特点是输入和输出高度可变——这些用例历来难以以成本或时间高效的方式处理。例如,像商务旅行这样简单的事情,可能涉及众多可能的行程,涵盖不同的航空公司和航班,更不用说酒店奖励计划、餐厅预订和业余活动,所有这些都必须通过不同的在线平台处理。虽然人们一直在努力实现部分流程的自动化,但大部分工作仍然必须手动完成。这在很大程度上是因为潜在输入和输出的巨大差异使得该流程过于复杂、成本高昂或耗时,无法实现自动化。
支持 Gen AI 的代理可以通过三种重要方式简化复杂和开放式用例的自动化:
- 代理可以管理多重性。许多业务用例和流程都以线性工作流为特征,具有明确的开端和一系列步骤,最终导向特定的解决方案或结果。这种相对简单的特性使其易于在基于规则的系统中编码和自动化。但基于规则的系统往往表现出“脆弱性”——即当遇到规则设计者未曾预料到的情况时,它们就会崩溃。例如,许多工作流程远非可预测,充满了意想不到的曲折和一系列可能的结果;这些工作流程需要特殊处理和细致的判断,这使得基于规则的自动化充满挑战。但由于新一代人工智能代理系统基于基础模型,因此能够处理特定用例中各种不太可能发生的情况,并实时调整以执行完成流程所需的专门任务。
- 代理系统可以用自然语言来指导。目前,要实现用例的自动化,首先必须将其分解为一系列可编码的规则和步骤。这些步骤通常被转换成计算机代码,并集成到软件系统中——这通常是一个成本高昂且耗时费力的过程,需要大量的技术专业知识。由于代理系统使用自然语言作为指令形式,即使是复杂的工作流程也能更快、更轻松地编码。此外,这个过程可能由非技术员工而非软件工程师完成。这使得整合专业知识变得更加容易,允许更广泛地使用新一代人工智能和人工智能工具,并简化技术团队和非技术团队之间的协作。
- 代理可以与现有的软件工具和平台协同工作。除了分析和生成知识之外,代理系统还可以使用工具,并在更广泛的数字生态系统中进行通信。例如,代理可以被指示使用软件应用程序(例如绘图和图表工具)、在网络上搜索信息、收集和整理人工反馈,甚至利用其他基础模型。使用数字工具既是代理的一项定义性特征(这是它们在现实世界中行动的方式之一),也是其新一代人工智能能力得以独特发挥的一种方式。基础模型可以学习如何与工具交互,无论是通过自然语言还是其他界面。如果没有基础模型,这些功能将需要大量的手动工作来集成系统(例如,使用提取、转换和加载工具),或者需要繁琐的手动工作来整理来自不同软件系统的输出。
新一代人工智能代理如何工作
代理可以支持跨行业和业务职能的高复杂度用例,尤其适用于涉及耗时任务或需要各种专门的定性和定量分析的工作流。代理通过递归分解复杂的工作流,并跨专门的指令和数据源执行子任务来实现此目的。该流程通常遵循以下四个步骤(图表 1):
- 用户提供指令:用户通过自然语言提示与AI系统进行交互,就像指导信任的员工一样。系统会识别预期用例,并在需要时要求用户提供进一步的说明。
- 代理系统负责规划、分配和执行工作:代理系统将任务提示处理成工作流程,将其分解为任务和子任务,然后由经理级代理将这些任务分配给其他专业的子代理。这些子代理具备必要的领域知识和工具,能够利用先前的“经验”和已整理好的领域专业知识,相互协调,并利用组织数据和系统来执行这些任务。
- 代理系统迭代改进输出:在整个过程中,代理可能会请求用户提供额外的输入,以确保准确性和相关性。该过程最终会以代理向用户提供最终输出结束,并根据用户提供的任何反馈进行迭代。
- 代理执行动作:代理执行世界上任何必要的动作,以完全完成用户请求的任务。
- 展览 1
- 我们致力于为残障人士提供平等访问我们网站的机会。如果您想了解相关内容,我们将竭诚为您服务。请发送电子邮件至:McKinsey_Website_Accessibility@mckinsey.com
可能性的艺术:三个潜在用例
这些系统对企业意味着什么?以下三个假设的用例让我们大致了解了在不久的将来可能实现的功能。
用例 1:贷款承销
金融机构编制信用风险备忘录,以评估向借款人提供信贷或贷款的风险。该流程涉及汇编、分析和审查与借款人、贷款类型和其他因素相关的各种信息。由于所需的信用风险场景和分析种类繁多,这往往是一项耗时且高度协作的工作,需要客户关系经理与借款人、利益相关者和信用分析师合作进行专门分析,然后提交给信贷经理进行审核并寻求其他专业知识。
基于代理的潜在解决方案:一个代理系统(由多个代理组成,每个代理承担一项专门的、基于任务的角色)可能被设计用于处理各种信用风险场景。人类用户可以使用自然语言启动该流程,提供包含具体规则、标准和条件的高级工作计划。然后,该代理团队将工作分解为可执行的子任务。
例如,一位代理人可以充当客户经理,负责处理借款人与金融机构之间的沟通。一位执行代理人可以整理必要的文件,并将其转发给一位财务分析代理人,该代理人会根据现金流量表审查债务并计算相关财务比率,然后由一位评估代理人进行审核,以找出差异和错误并提供反馈。这种分解、分析、改进和审查的过程将不断重复,直到最终的贷项备忘录完成(图表2)。
展览 2
我们致力于为残障人士提供平等访问我们网站的机会。如果您想了解相关内容,我们将竭诚为您服务。请发送电子邮件至:McKinsey_Website_Accessibility@mckinsey.com
与更简单的新一代人工智能架构不同,代理可以生成高质量的内容,将审核周期缩短 20% 至 60%。代理还能够遍历多个系统,并理解从多个来源提取的数据。最后,代理可以展示他们的工作成果:信贷分析师可以快速深入研究任何生成的文本或数字,访问完整的任务链,并利用数据源生成洞察。这有助于快速验证输出结果。
用例 2:代码文档和现代化
大型企业的遗留软件应用程序和系统通常存在安全风险,并可能减缓业务创新的步伐。然而,对这些系统进行现代化改造 可能非常复杂、成本高昂且耗时,需要工程师审查并理解数百万行旧代码库和业务逻辑的手动文档,然后将这些逻辑转换为更新的代码库,并将其与其他系统集成。
基于代理的潜在解决方案:人工智能代理有潜力显著简化这一流程。可以部署一个专门的代理作为遗留软件专家,分析旧代码并记录和翻译各种代码段。同时,质量保证代理可以审查这些文档并生成测试用例,帮助人工智能系统迭代地改进其输出,确保其准确性并符合组织标准。同时,该流程的可重复性可以产生飞轮效应,代理框架的组件可以重复用于组织内的其他软件迁移,从而显著提高生产力并降低软件开发的总体成本。
用例 3:创建在线营销活动
设计、启动和运行在线营销活动 往往涉及一系列不同的软件工具、应用程序和平台。在线营销活动的工作流程极其复杂。必须将业务目标和市场趋势转化为富有创意的活动创意。必须针对不同的细分市场和地区创建和定制文字和视觉材料。营销活动必须在不同平台上与用户群体进行测试。为了完成这些任务,营销团队通常使用不同类型的软件,并且必须将输出从一个工具转移到另一个工具,这通常既繁琐又耗时。
基于代理的潜在解决方案:代理可以帮助连接这个数字营销生态系统。例如,营销人员可以用自然语言描述目标用户、初步想法、预期渠道和其他参数。然后,代理系统将在营销专业人员的协助下,帮助开发、测试和迭代不同的营销活动创意。数字营销策略代理可以利用在线调查、客户关系管理解决方案的分析数据以及其他市场研究平台,旨在收集洞察,并使用多模态基础模型制定策略。内容营销、文案和设计的代理可以构建定制内容,然后由人工评估员审核以确保与品牌的契合。这些代理将协作迭代和改进输出,并朝着既能优化营销活动影响又能最大限度降低品牌风险的方向发展。
企业领导者应如何为代理人时代做好准备?
分享
侧边栏
了解代理系统带来的独特风险
尽管代理技术尚处于起步阶段,但加大对这些工具的投资,有望使代理系统在未来几年内取得显著的里程碑式进展,并实现规模化部署。因此,企业领导者现在就应该深入了解代理,并思考能否利用代理系统及其功能来加速其核心流程或业务需求。这种理解可以为未来的路线图规划或方案提供参考,并帮助领导者始终保持创新准备的前沿。一旦确定了这些潜在用例,组织就可以开始探索不断发展的代理领域,利用 API、工具包和库(例如 Microsoft Autogen、Hugging Face 和 LangChain)来了解相关内容。
为了迎接代理系统的到来,组织应该考虑以下三个因素,这些因素对于代理系统发挥其潜力至关重要:
- 相关知识的编码:实施复杂的用例可能需要组织将业务流程定义并记录到编码的工作流中,然后用于培训代理。同样,组织可以考虑如何获取主题专业知识,以便用自然语言指导代理,从而简化复杂的流程。
- 战略技术规划:企业需要整合其数据和IT系统,以确保座席系统能够与现有基础设施有效对接。这包括捕捉用户交互以获得持续反馈,并灵活地集成未来技术,而不会中断现有运营。
- 人机在环控制机制:随着新一代人工智能代理开始与现实世界互动,控制机制对于平衡自主性和风险至关重要(参见侧栏“了解代理系统带来的独特风险”)。人类必须验证输出的准确性、合规性和公平性;与领域专家合作维护和扩展代理系统;并创建学习飞轮以持续改进。组织应该开始思考在何种条件下以及如何部署此类人机在环机制。
麦肯锡最新的“人工智能现状”调查 发现,超过72%的受访公司正在部署人工智能解决方案,并且对新一代人工智能(gen AI)的兴趣日益浓厚。鉴于此,企业开始将代理等前沿技术纳入其规划流程和未来人工智能路线图也就不足为奇了。代理驱动的自动化仍然是一个令人兴奋的命题,它有可能彻底改变整个行业,为工作带来全新的行动速度。
尽管如此,这项技术仍处于早期阶段,在其全部功能得以充分发挥之前,还有许多开发工作要做。这些系统日益增长的复杂性和自主性带来了诸多挑战和风险。如果说部署人工智能代理就像在团队中增加新员工一样,那么就像人类团队成员一样,代理需要经过大量的测试、培训和指导,才能被信任独立运作。但即使在这些早期阶段,也不难想象新一代虚拟同事可能.
Comments (0)
No comments