2025年值得关注的9大AI趋势(上)

2025年值得关注的9大AI趋势(上)

人工智能领域发展得如此迅速,即使是人工智能的极客,也可能难以跟上步伐。从突破性的AI编码工具到GPT-01、Claude的应用,再到Notebook LLM的播客功能等等——这只是冰山一角。

为了提供2025年最可靠、最具洞察力的人工智能预测,我在本文中采用了以下框架:

  • 技术层面:2025年哪些人工智能技术会引发行业关注?
  • 影响层面:未来几个月人工智能将如何改变我们的生活?

本文建立在扎实的研究基础之上(底部附有链接),主要参考了两大权威来源:

  1. Gartner的人工智能及未来技术的炒作周期图。
  2. 专注于AI世界的趋势分析报告。

现在话不多说,让我们深入探讨2025年值得关注的9大人工智能趋势!如果你想了解更多关于人工智能的相关内容,可以阅读以下这些文章:
如何在2024年构建人工智能软件
Meta的FAIR团队:为全球免费开放人工智能
人工智能产品经理的崛起
Google的2024年人工智能设计原则:以用户为中心的人工智能体验

人工智能的炒作周期,2024

1. 计算机视觉

谷歌眼镜的崛起

计算机视觉赋予机器像人类一样理解图像和视频的能力,涉及四个关键领域:目标分类、识别、跟踪和OCR(光学字符识别)。

为什么是现在?

  • 摄像头普及引发视觉数据爆炸
  • AI技术能够更好地理解复杂场景
  • 摄像头和处理器变得更便宜、更强大
  • 对自动化视觉检查的需求激增

影响


Gartner的数据显示,计算机视觉已经进入“生产力平台期”——即技术已被广泛接受,用户能明显看到其现实价值。但这也引发了隐私与监控问题,同时对一些依赖人类视觉判断的岗位造成了替代威胁,例如保安或医学影像专家。

实例

  • 用脸解锁手机
  • 谷歌Lens进行图像搜索
  • 超市中的自助结账系统
  • 特斯拉的自动驾驶功能
  • 健康分析工具HealthFolder

2. 复合人工智能(Composite AI)

融合多种AI技术的未来

复合人工智能结合机器学习、自然语言处理和知识图谱等技术,能够处理单一AI技术无法解决的复杂任务。

为什么是现在?

  • 单一AI技术无法应对现实复杂问题
  • 企业需要能够理解多种信息类型的AI
  • 高性能计算使AI技术融合成为可能

影响

通过融合,企业可以更高效地分析非结构化数据并提供解决方案。但目前,这种技术还处于“创新触发阶段”,距离大规模商用尚有距离。

实例


富士通的复合AI系统可以通过聊天形式理解业务问题,并自动选择最佳的AI模型,提出具体的解决方案,用于软件预测、物流优化等场景。

3.边缘人工智能

AI技术不再依赖云端

边缘AI将人工智能技术直接嵌入设备本身,无需依赖云端处理。例如,手机的面部解锁功能完全在本地运行。

为什么是现在?

  • 用户希望更快响应,无需等待云处理
  • 隐私需求驱动数据本地化
  • AI芯片技术的飞速发展
  • 在网络不稳定条件下保持功能

影响

边缘AI的应用场景包括智能安防摄像头、医疗设备和工业机器,但其部署和维护的复杂性仍然是挑战。

实例

谷歌的分布式云边缘解决方案帮助零售商在本地运行AI应用,实现实时数据分析、无收银员结账等功能,提升运营效率。

4. (大量)人工智能代理

人工智能代理(Autonomous Agents,AI Agents)是一种能够自主运行、无需人工干预的人工智能。可以将它们想象为一种数字助理,不仅能够执行命令,还能自主发现问题并采取行动。

AI代理的两种类型

基于工具的代理:基于工具的代理可以通过自然语言指令完成数字任务,例如填写表格或浏览网站。像Anthropic这样的知名企业已经推出了相关产品,而OpenAI计划在2025年1月发布类似技术。

模拟代理:模拟代理旨在模仿人类行为,最初是为社会科学研究而设计。最近的研究表明,这些代理在进行两个小时的采访后,可以准确复制人们的价值观和偏好。

为什么是现在?

  • 企业需要能够处理意外事件的人工智能系统。
  • 人工智能在决策能力方面的表现越来越优异。
  • 许多任务需要持续关注,而人类难以长期保持专注。
  • 改进的人工智能安全功能使自主行动成为可能。

根据Gartner的预测,在未来十年内,有两种生成式人工智能(GenAI)技术被认为最具潜力:特定领域的生成式人工智能模型和自主代理。

后果

人工智能代理不需要逐步指导,能够理解用户意图并独立找到解决方案。尽管这一前景充满未来感且令人振奋,但也带来了潜在的负面后果,例如:

  1. 这些代理可能会制造出更复杂且更有害的假药。
  2. 如果用户更多地与AI互动而非与真人交流,是否应明确告知他们正在与AI互动?

例子

  • Tavus 正在研究“数字双胞胎”,它们可以扮演治疗师、医生或教师的角色。
  • H公司 专注于开发先进的人工智能模型,特别是能够自主分解任务并执行的“代理”AI。他们的旗舰产品之一 Runner H 是一种人工智能代理,能够通过简单的自然语言命令自动完成复杂的多步骤网络任务。

如需深入了解微软、甲骨文和英伟达在医疗健康领域的AI代理技术,可以参考《医疗保健领域的AI代理2025指南》。

5. 多模态人工智能

多模态人工智能

多模态人工智能整合了音频、视频、图像和文本,利用“多模态协作”的力量实现更自然的交互和更全面的数据处理能力。

根据Gartner的数据,到2027年,40%的生成式人工智能解决方案将是多模态的(即同时处理文本、图像、音频和视频等多种数据模态),而2023年这一比例仅为1%。

多模态人工智能能够整合和处理多种类型的数据输入(称为模态),如文本、图像、音频、视频及传感器数据,从而生成更完整的理解或输出。

为什么是现在?

  • 技术进步显著提升了处理不同数据类型的能力。
  • 用户希望通过更自然的方式与人工智能进行交互。
  • 复杂的应用场景需要AI具备更强的上下文理解能力。

后果

Gartner认为多模态生成式人工智能(Multimodal GenAI)是2024年生成式人工智能技术成熟度周期中的两大关键技术之一。早期采用这项技术将有可能带来显著的竞争优势和更快的上市时间效益。与开源大型语言模型(LLM)一起,这两种技术在未来五年内对组织的潜在影响尤为巨大。

例子

  • GPT-4 是一项多模态AI技术的典型例子,能够同时理解图像和文本,例如协助用户从草图设计网站。

本文章较长,分为两上下两期,此为上期。

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Pragmatic Coders
翻译作者:过儿
美工编辑:过儿
校对审稿:Jason
原文链接:https://medium.com/@pragmaticcoders/9-real-ai-trends-to-watch-in-2025-bee4e9ab427c