OpenAI 刚刚发布了最强AI模型:GPT-4o

OpenAI 刚刚发布了最强AI模型:GPT-4o

OpenAI终于发布了GPT-4o.这个新模型在音频、视觉和文本方面提供了实时多模态功能,并且有了显著的增强。而且它是免费的,这显示出与GPT-3.5类似的策略——旨在吸引新用户并进一步扩大模型训练的规模。

根据Mia Murati的说法,GPT-4o模型的一个显著特点是其性能,比前身GPT-4快了两倍。它的成本也降低了多达50%。这一发展将使开发人员能够继续部署大规模的AI项目,同时受益于这些新改进。

但技术细节就说到这里吧。让我们来看看这个新模型能为我们做些什么。如果你想了解更多关于OpenAI的相关内容,可以阅读以下这些文章:
OpenAI新的嵌入模型和API更新
OpenAI刚刚证明了人类并没有为即将到来的事情做好准备
OpenAI近期发布了GPTs:创建自己的ChatGPT并从中赚钱(无需编码)
OpenAI是否秘密创造了类脑智能?

这超出了上传图像并与其交互的基本功能。 OpenAI 现在允许我们通过语音助手与 ChatGPT 进行交互,我们甚至可以共享计算机或智能手机中的内容。响应是实时生成的,允许对不同类型和复杂度的内容进行广泛的分析。

在下面的演示中,ChatGPT 成为了一名数学导师(这让我大吃一惊!)

视频链接:https://www.youtube.com/watch?v=_nSmkyDNulk

我们可以在这里看到 ChatGPT 全部功能的一小部分。它不仅解决了数学问题,还指导我们找到解决方案,提供明确的指导方针和建议,帮助我们以更具教育性和说明性的方式理解整个过程。

令人惊叹的是,其语音和视觉功能能够顺畅地识别和解释问题。

OpenAI 非常注重流畅性、语气和逻辑顺序等能力,使其能够以自然的方式继续对话。

在 GPT-4o 演示过程中,该模型可以进行流畅的对话,甚至可以像真正的助手一样使用友好的语气提供建议。该模型能够产生各种情感风格的声音,可以从更戏剧性的音调到严肃正式的音调进行选择。

这是一个将实时对话功能与音频翻译相结合的演示。

视频链接:https://www.youtube.com/watch?v=WzUnEfiIqP4

向 ChatGPT 提供提示的过程比看起来稍微复杂一些。它需要顺利地翻译英语和西班牙语的双语对话,识别两种语言并相应地生成响应。

我对它的响应准确性和流畅性印象深刻,它轻松地达到了设定的目标。它还成功避免了其他实时响应的AI系统中常见的尴尬停顿。

在多个演示中,OpenAI试图展示这些视频不仅仅是巧妙的编辑,而是真实实时发生的。下面的视频就是一个很好的例子,它展示了多模态功能如何交互,以提供基于视觉和听觉的精确响应。

视频链接:https://www.youtube.com/watch?v=MirzFk_DSiI

这里有几点我想强调一下:

  • 准确识别和描述细节:令人惊叹的是,ChatGPT能够准确识别和描述详细元素。即使外部环境变得更加复杂,增加了人群,ChatGPT也能成功识别他们。
  • 创作符合特定条件的歌曲:这个新模型能够创作符合特定条件的歌曲,这太了不起了!它轻松生成旋律!
  • GPT模型之间的互动:两个GPT模型之间的互动几乎让我们看到了未来的样子。尽管没有明确说明,但这似乎是OpenAI的发展方向。凭借GPT-4o展示的能力,下一步是AI系统之间的互动。这可能会导致一个AI训练另一个AI,以及其他我们在最疯狂的梦想中都无法想象的发展。

文本评估

OpenAI 分享的图像清楚地表明,GPT-4o 的表现优于其他模型,特别是在数学和 HumanEval 等领域——这些属性受到用户高度重视,因为它们可以实现更流畅、更人性化的对话。

此外,GPT-4o 已将其响应能力扩展到英语以外的 20 多种其他语言。这种语言标记化的增强旨在覆盖更广泛的全球受众。

GPT-4o 的增强功能与其文本评估功能相结合,提供了与更多人联系的机会,认识到语言通常是沟通之外的障碍。

图表清楚地显示,GPT-4o在音频翻译方面的表现优于其他AI系统,例如Gemini和Whisper-v3。

对我来说,这不仅仅是ChatGPT的一个新更新。当涉及到将AI与环境连接并最大限度地发挥其潜力时,它的影响力要大得多。此外,这正是我对OpenAI的预期:从一开始就通过切实可行的真实行动专注于用户并提供产品。多模态的作用在这里至关重要,他们意识到了这一点,因此努力增强它,以在各种真实世界的环境中提供更精确的响应。

现在,我们有了一款感觉不那么“人造”的产品,满足了我们的一些需求。 GPT-4o 是迈向 GPT-5 的第一步,展示了OpenAI鼓励用户在新情境下部署这种人工智能的主动性。

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:pycoach
翻译作者:诗彤
美工编辑:过儿
校对审稿:Jason
原文链接:https://medium.com/artificial-corner/openai-just-unveiled-the-best-ai-model-gpt-4o-e6ddf36cd793