一文带你了解AI代理与代理系统的演变之路
人工智能代理的发展经历了从最初的简单形式,逐步演变为结合内部控制机制、外部情境基础和认知输入的复杂系统,从而实现了更加动态和多样化的交互。如果你想了解更多关于人工智能的相关内容,可以阅读以下这些文章:
如何在2024年构建人工智能软件
Meta的FAIR团队:为全球免费开放人工智能
人工智能产品经理的崛起
Google的2024年人工智能设计原则:以用户为中心的人工智能体验
LLM的局限性
传统的语言模型(LLM)在知识和推理能力方面存在固有的局限性。而具备语言能力的人工智能代理通过将LLM与内部存储器和外部环境连接起来,使其能够基于已有知识或对现实世界的观察进行工作,从而解决了这些挑战。
从规则到智能
在过去,系统往往依赖于手工制定的规则或强化学习,这使得它们难以适应新的环境。而如今,语言人工智能代理通过利用LLM中嵌入的常识理解能力,能够更高效地处理新任务,减少对人工标注或试错学习的依赖。
构架的演变
考虑到上面的图片,大型语言模型(LLM)根据它们的应用服务于不同的目的:
- A. 文本处理:在自然语言处理(NLP)领域,LLM以文本作为输入,生成文本作为输出,处理各种语言任务。
- B. 语言代理:通过将LLM集成到与外部环境的反馈循环中,这些代理能够将观察结果转化为文本,利用LLM进行决策或执行操作。
- C. 认知语言人工智能代理:这些高级系统不仅通过LLM进行交互,还使用其管理内部流程,如学习和推理等。
组成要素
参考下图,可以通过三个关键要素来理解AI代理的运行框架:
- 认知结构情景记忆:指存储和回忆特定事件或经历的能力,例如记住最近的对话内容。语义记忆:储存关于世界的一般知识,包括事实和概念。情景记忆更动态且上下文相关,而语义记忆则更稳定,用于理解抽象和概括性信息。
- 行动空间:AI代理运行于双重行动框架中内部操作:涉及推理、计划和更新内部状态等过程。外部操作:指与环境的交互,例如执行命令或提供输出。
- 决策过程:代理的决策被组织为计划与执行的迭代循环。通过这一过程,代理分析环境、制定策略并采取行动,同时根据新信息不断优化其方法。
数字环境
AI代理主要运行于数字环境中,这些环境为其提供交互和执行任务的平台。常见的数字环境包括移动操作系统、桌面操作系统以及其他数字生态系统。
在这些环境中,AI代理能够参与游戏、API调用、网页浏览以及代码执行,利用这些平台完成任务并应用知识。相比物理交互,数字环境提供了一种更加高效且成本更低的开发与评估途径。
实际案例
例如,在自然语言处理(NLP)任务中,许多数字API(如搜索引擎、计算器、翻译器)已被集成到操作系统中,为特定用途服务。这些工具可以看作是专用的数字环境,帮助代理完成需要外部知识或计算的任务。
随着人工智能代理的持续发展,其在数字环境中的功能将从简单的静态交互扩展到更复杂的系统架构。
从数字到物理
AI代理的未来发展方向是实现物理化,并能够在现实环境中运行。这一转变将为人工智能代理开辟新可能,使其能够与现实世界进行物理交互,导航动态空间,并在机器人等领域中发挥重要作用。
从数字环境到物理环境的过渡是一个关键步骤。这一转变要求AI代理整合感知数据、物理动作以及情境感知的决策能力,从而进一步提升其能力与应用潜力。
总结
本文重点分析了围绕LLM构建的不断演变的框架,旨在最大化LLM的潜力。文章强调,这些框架同时具备内部与外部属性,并通过协作增强了其能力。
- 在内部,推理能力是模型智能和决策的核心;
- 在外部,从数据增强到与外部世界的直接交互,LLM的功能和适应性逐步提升。
随着时间推移,AI代理正在从纯粹的语言处理工具演变为能够在复杂环境中实现动态行为的智能体,为未来的人工智能发展铺平了道路。
感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/。
原文作者:Cobus Greyling
翻译作者:过儿
美工编辑:过儿
校对审稿:Jason
原文链接:https://cobusgreyling.medium.com/the-evolution-of-ai-agents-agentic-systems-92259a5f5e22