Gemini Ultra vs GPT-4:Google这次打败GPT-4了吗?

Gemini Ultra vs GPT-4:Google这次打败GPT-4了吗?

Google刚刚发布了Gemini Advanced,它采用了Google最强大的人工智能模型Gemini Ultra。

没错,这就是几个月前在基准测试中击败GPT-4的机型。现在,我们有机会亲眼看看它是否真的比GPT-4更强。

在本文中,我们将通过Gemini Ultra与GPT-4的对比来了解它的优劣。如果你想了解更多关于ChatGPT的相关内容,可以阅读以下这些文章:
在新研究的支持下,从ChatGPT获得深入响应的9种技巧
ChatGPT又蠢又没用?请提出正确的问题!
ChatGPT越来越傻了吗?我们一起聊聊“AI Drift”
掌握ChatGPT的反向提示

  • 速度

在大多数测试中,Gemini的速度都比GPT-4快。问题是,Gemini并不总能给出良好的响应。

我们将在本文的其余部分看到Gemini的响应质量,但是,是的,Gemini比GPT-4更快。

  • Google本地应用程序

我把Gemini Ultra和GPT-4作为私人助理,请它们帮我规划下一次旅行。

我下周要从加利福尼亚前往纽约。向我显示飞往纽约的航班和中央公园附近的酒店。

Gemini可自动连接到Flights和Hotels等Google应用程序,提供实时信息。

图片来自作者

GPT-4缺少这一功能。使用插件或带有自定义操作的GPT可能会获得与谷歌本地应用程序类似的功能。默认情况下,GPT-4会做出如下响应。

图片来自作者

Gemini的图像看起来像是由真正的摄影师拍摄的图片,而不是人工智能制作的图像。在这方面,我们可以说Gemini的图像比DALL-E 3或Midjourney更真实(或更不复杂)

制作一个程序员学习编程的形象。

图片来自作者

不过,与DALL-E 3不同的是,Gemini不会改进你的提示。如果我在ChatGPT上使用相同的提示,DALL-E 3会生成一个让图像看起来更醒目的提示。

图片来自作者

如果让我为我的文章选择一张图片,我会选择左边由DALL-E 3生成的图片。

但不可否认的是,我不可能想到《DALL-E 3》为我生成的下面的提示。

想象这样一个场景:一位年轻的程序员正全神贯注地学习编程。场景是夜晚一间光线充足的舒适房间,里面摆满了各种技术用具:一台显示着一行行代码的大型显示器、散落一地的编程书籍,以及桌上一杯热气腾腾的咖啡。程序员身着休闲装,聚精会神地盯着屏幕,敲打着键盘,神情坚定而又充满好奇。他们身后的软木板上钉着笔记和图表,阐述着各种编程概念。这里洋溢着一种默默奉献和追求知识的氛围。

这就是为什么我认为DALL-E 3更适合初学图像生成或缺乏创意的用户。

如果你对图像生成有一定的经验,你可以像我在下面的提示中所做的那样,控制Gemini图像的美感。这样,Gemini生成的图像看起来就不那么逼真了,这似乎是默认设置。

领奖台上的机器人获得漫画美学奖的第一名、第二名和第三名。

我对Gemini生成的图像并不满意,所以我问1号位置上的机器人能否拿着奖杯,结果我如愿以偿。

图片来自作者

现在,如果你是为图像创建详细提示的专家,我认为DALL-E 3或Midjourney可能比Gemini更好。

让我们用Gemini来测试下面的提示。

这是一幅以动作片视角拍摄的宽银幕风景画,画面中央是一名表情迷茫的男子,推着一辆购物车。过道上贴满了价格标签,但货架上摆放的不是普通商品,而是各种复杂的机械零件,暗示着一种超现实或未来主义的购物体验。视角应从过道尽头望向入口。周日漫画美学。

图片来自作者

这是DALL-E 3所生成的图像。

图片来自作者

总的来说,我会用Gemini来生成逼真的图像,只需一个简单的提示。除此之外,我会使用DALL-E 3或 Midjourney。

注:我想在欧洲测试图像生成,但每次尝试都会得到这样的提示:“我还不能创建图像,因此无法为你提供帮助。”我可以通过VPN切换到美国来解决这个问题。

  • 理由

我给两个模型做了两个推理练习,看看他们能否得到正确答案。

首先,我从这个简单的练习开始。

找出序列中的下一个数字:30,45,90,225,675,…

Gemini很快就得到了答案,但却是错误的。

图片来自作者

不过,当我点击“显示草稿”时,我发现3号草稿的答案是正确的,因此我们可以说它在第三次尝试时就答对了。

GPT-4花了更多时间,但第一次尝试就得到了正确答案。

图片来自作者

第二个练习更具挑战性。

解决这个练习:

loo,mon,nom,ool,____
A.POK
B.HOL
C.HOK
D.JOI

Gemini的三个初稿都是错的,所以我又问了一遍,在第三稿中得到了正确答案。

图片来自作者

另一方面,GPT-4第一次失败,但在第二次尝试时找到了正确答案。

总体而言,GPT-4的推理能力强于Gemini。

  • 代码生成

这两种模型都能很好地解释代码,但在生成代码方面,Gemini似乎受到了Google的一些限制。

如果我们想创建一个蛇形游戏,Gemini可以生成代码,甚至可以一键导出到Google Colab。

图片来自作者

但当你尝试生成其他类型的脚本时,它在开始生成代码后突然停止,并抛出以下信息。

图片来自作者

在互联网上搜索时,我发现一些YouTuber在使用Gemini时遇到了同样的问题,不仅是在生成代码时,在解释代码时也是如此。

我在使用GPT-4时从未遇到过这种情况,因此我认为GPT-4在编码方面胜过Gemini Ultra。

就是这样!我没有比较阅读PDF或分析数据集等功能,因为Gemini目前还不支持上传图片以外的文件。此外,这次我也没有进行创造力测试,因为这有点主观,所以我把这个问题留给了你。

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:The PyCoach
翻译作者:Qing
美工编辑:过儿
校对审稿:Jason
原文链接:https://medium.com/artificial-corner/gemini-ultra-vs-gpt-4-did-google-beat-gpt-4-this-time-b3e8446773b9