Gemini Ultra vs GPT-4:Google这次打败GPT-4了吗？

Google刚刚发布了Gemini Advanced，它采用了Google最强大的人工智能模型Gemini Ultra。

没错，这就是几个月前在基准测试中击败GPT-4的机型。现在，我们有机会亲眼看看它是否真的比GPT-4更强。

在本文中，我们将通过Gemini Ultra与GPT-4的对比来了解它的优劣。如果你想了解更多关于ChatGPT的相关内容，可以阅读以下这些文章：
在新研究的支持下，从ChatGPT获得深入响应的9种技巧
 ChatGPT又蠢又没用？请提出正确的问题！
ChatGPT越来越傻了吗？我们一起聊聊“AI Drift”
掌握ChatGPT的反向提示

Gemini Ultra的优点

速度

在大多数测试中，Gemini的速度都比GPT-4快。问题是，Gemini并不总能给出良好的响应。

我们将在本文的其余部分看到Gemini的响应质量，但是，是的，Gemini比GPT-4更快。

Google本地应用程序

我把Gemini Ultra和GPT-4作为私人助理，请它们帮我规划下一次旅行。

我下周要从加利福尼亚前往纽约。向我显示飞往纽约的航班和中央公园附近的酒店。

Gemini可自动连接到Flights和Hotels等Google应用程序，提供实时信息。

GPT-4缺少这一功能。使用插件或带有自定义操作的GPT可能会获得与谷歌本地应用程序类似的功能。默认情况下，GPT-4会做出如下响应。

意想不到的Gemini Ultra：真实的图像

Gemini的图像看起来像是由真正的摄影师拍摄的图片，而不是人工智能制作的图像。在这方面，我们可以说Gemini的图像比DALL-E 3或Midjourney更真实（或更不复杂）。

制作一个程序员学习编程的形象。

不过，与DALL-E 3不同的是，Gemini不会改进你的提示。如果我在ChatGPT上使用相同的提示，DALL-E 3会生成一个让图像看起来更醒目的提示。

如果让我为我的文章选择一张图片，我会选择左边由DALL-E 3生成的图片。

但不可否认的是，我不可能想到《DALL-E 3》为我生成的下面的提示。

想象这样一个场景：一位年轻的程序员正全神贯注地学习编程。场景是夜晚一间光线充足的舒适房间，里面摆满了各种技术用具：一台显示着一行行代码的大型显示器、散落一地的编程书籍，以及桌上一杯热气腾腾的咖啡。程序员身着休闲装，聚精会神地盯着屏幕，敲打着键盘，神情坚定而又充满好奇。他们身后的软木板上钉着笔记和图表，阐述着各种编程概念。这里洋溢着一种默默奉献和追求知识的氛围。

这就是为什么我认为DALL-E 3更适合初学图像生成或缺乏创意的用户。

如果你对图像生成有一定的经验，你可以像我在下面的提示中所做的那样，控制Gemini图像的美感。这样，Gemini生成的图像看起来就不那么逼真了，这似乎是默认设置。

领奖台上的机器人获得漫画美学奖的第一名、第二名和第三名。

我对Gemini生成的图像并不满意，所以我问1号位置上的机器人能否拿着奖杯，结果我如愿以偿。

现在，如果你是为图像创建详细提示的专家，我认为DALL-E 3或Midjourney可能比Gemini更好。

让我们用Gemini来测试下面的提示。

这是一幅以动作片视角拍摄的宽银幕风景画，画面中央是一名表情迷茫的男子，推着一辆购物车。过道上贴满了价格标签，但货架上摆放的不是普通商品，而是各种复杂的机械零件，暗示着一种超现实或未来主义的购物体验。视角应从过道尽头望向入口。周日漫画美学。

这是DALL-E 3所生成的图像。

总的来说，我会用Gemini来生成逼真的图像，只需一个简单的提示。除此之外，我会使用DALL-E 3或 Midjourney。

注：我想在欧洲测试图像生成，但每次尝试都会得到这样的提示：“我还不能创建图像，因此无法为你提供帮助。”我可以通过VPN切换到美国来解决这个问题。

Gemini Ultra的缺点

理由

我给两个模型做了两个推理练习，看看他们能否得到正确答案。

首先，我从这个简单的练习开始。

找出序列中的下一个数字：30，45，90，225，675，…

Gemini很快就得到了答案，但却是错误的。

不过，当我点击“显示草稿”时，我发现3号草稿的答案是正确的，因此我们可以说它在第三次尝试时就答对了。

GPT-4花了更多时间，但第一次尝试就得到了正确答案。

第二个练习更具挑战性。

解决这个练习：

loo,mon,nom,ool,____
A.POK
B.HOL
C.HOK
D.JOI

Gemini的三个初稿都是错的，所以我又问了一遍，在第三稿中得到了正确答案。

另一方面，GPT-4第一次失败，但在第二次尝试时找到了正确答案。

总体而言，GPT-4的推理能力强于Gemini。

代码生成

这两种模型都能很好地解释代码，但在生成代码方面，Gemini似乎受到了Google的一些限制。

如果我们想创建一个蛇形游戏，Gemini可以生成代码，甚至可以一键导出到Google Colab。

但当你尝试生成其他类型的脚本时，它在开始生成代码后突然停止，并抛出以下信息。

在互联网上搜索时，我发现一些YouTuber在使用Gemini时遇到了同样的问题，不仅是在生成代码时，在解释代码时也是如此。

我在使用GPT-4时从未遇到过这种情况，因此我认为GPT-4在编码方面胜过Gemini Ultra。

就是这样！我没有比较阅读PDF或分析数据集等功能，因为Gemini目前还不支持上传图片以外的文件。此外，这次我也没有进行创造力测试，因为这有点主观，所以我把这个问题留给了你。

感谢阅读！你还可以订阅我们的YouTube频道，观看大量大数据行业相关公开课：https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ；在LinkedIn上关注我们，扩展你的人际网络！https://www.linkedin.com/company/dataapplab/

原文作者：The PyCoach
翻译作者：Qing
美工编辑：过儿
校对审稿：Jason
原文链接：https://medium.com/artificial-corner/gemini-ultra-vs-gpt-4-did-google-beat-gpt-4-this-time-b3e8446773b9

March 13, 2024 | Blog | Tags: AI, ChatGPT

Gemini Ultra vs GPT-4:Google这次打败GPT-4了吗？

Gemini Ultra vs GPT-4:Google这次打败GPT-4了吗？

谷歌发布的Gemini 1.5，具有1M上下文窗口

如何使用Code Llama构建自己的LLM编码助手

Latest post

多智能体协作协议（MCP）：LLM 系统中合作智能的未来

LLAMA 4 来袭：Meta 全新大模型的技术突破与商业潜力

一文带你了解 Google 的数据科学Agent

Courses

Events

Lecture 15: How to Become a Data Scientist

Understand Meta LLaMA Throughly

Consulting

ABOUT US

Contact Info: