这份人工智能通讯包含了你需要的最热消息!

这份人工智能通讯包含了你需要的最热消息!

本周,我们再次关注了人工智能机器人和LLM的发展。英伟达(Nvidia)和美国宾夕法尼亚大学(UPenn)合作发布了一个新的开源模型DrEureka,该模型使用LLM代理编写代码,在模拟中训练机器人,然后编写进一步的代码转移到现实世界的部署中。特斯拉(Tesla)也发布了关于其Optimus机器人进展的最新视频,展示了许多机器人通过人类远程操作完成不同任务的训练过程。神经网络端到端运行(即摄像头和传感器数据输入,联合控制序列输出),两个机器人已开始在真实工厂工作站进行早期测试。

如果你想了解更多关于人工智能的相关内容,可以阅读以下这些文章:
2024年每个开发人员都需要掌握的生成式人工智能技能
Google的Gemini AI模型:揭开人工智能的未来
世界上最好的人工智能模型:谷歌DeepMind的Gemini已经超过了GPT-4!
我尝试了50种人工智能工具,以下是我的最爱

在LLM领域,Deepseek v2给我们留下了深刻印象,这是一个来自Deepseek(一家中国公司)的236bn新开源专家混合模型。该模型在8.1万亿个代币上进行了训练,拥有210亿个激活参数。该模型在MMLU基准测试中得分77.8,在HumanEval测试中得分81.1。该模型通过API提供,代币输入价格为0.14 美元/m,输出价格为0.28 美元/m。虽然我们通常对API定价的可持续性持怀疑态度(因为这可能是一项客户获取成本),但该模型的性能与活动参数的对比令人印象深刻。该公司指出,多头潜意识(Multi-head Latent Attention)的进步(更好的注意力和高效的推理)和新颖的稀疏架构降低了训练成本。也许美国对中国的人工智能芯片出口禁令对推动关注创新和效率产生了一些影响。

另外,本周的LLM世界—人们一直在关注chat.lmsys.org上测试的神秘新模型:“gpt2-chatbot”,几天后又出现了“im-a-good-gpt2-chatbot”和“im-also-a-good-gpt2-chatbot”。Sam Altman总是善于让人们关注OpenAI,他的神秘推文大大助长了人们对OpenAI正在测试的新模型的猜测!最初的GPT-2有15亿个参数—所以这也许暗示着OpenAI正在测试一种新的、更小的模型(与GPT-4或GPT-3相比)。众所周知,OpenAI会在较小规模的模型中测试新想法,并利用缩放定律来预测较高参数/训练标记计数下的性能,因此这里或许就是这种情况。

为什么要关注?

人工智能机器人技术在过去一年中发展速度明显加快,现在,许多不同的团队都在使用截然不同的策略和架构途径来提升能力。虽然现在还很难预测未来的发展速度,但我们认为人工智能机器人技术会产生巨大的影响,其功能将大大超过传统的人工编码机器人技术。关于这个话题,本周,RethinkX发布了一篇关于仿人机器人潜在影响的深思博文:这一次,我们是马:仿人机器人对劳动力的颠覆https://www.rethinkx.com/blog/rethinkx/the-disruption-of-labour-by-humanoid-robots

——Louie Peters—迈向人工智能联合创始人兼首席执行官

本期内容由Latitude.sh提供http://ws.towardsai.net/gh6

图片来自作者

推出迄今为止最强大的容器GPU平台Launchpad。

Launchpad利用每一块硬件来启动你的模型,带来无与伦比的性能,让其他容器GPU工具感觉太慢了。通过Latitude.sh,你可以微调和部署机器学习模型,按小时计费,起价为1.32美元/小时。

容器配置在超快的NVMe驱动器上,并利用不受限制的高吞吐量网络,使你可以访问高达100 Gbps的速度。

立即部署:

  • NVIDIA L40S GPU (48GB) @1.32美元/小时
  • NVIDIA H100 Tensor Core GPU (80GB) @2.10美元/小时

使用Latitude的Launchpad扩展你的ML推理和微调工作负载http://ws.towardsai.net/gh6

最热新闻

1.OpenAI首席执行官Sam Altman称GPT-4是你将不得不再次使用的最愚蠢的人工智能模型

链接:https://stanforddaily.com/2024/04/25/openai-ceo-sam-altman-talks-ai-development-and-society/

OpenAI的Sam Altman最近在斯坦福大学出席活动时表示,GPT-4是用户将遇到的最初级的人工智能,公司将逐步开发GPT-5等更复杂的模型,GPT-5预计将具备视频生成等增强功能。他预计,人工智能将发展成为高效的助手,可以毫不费力地执行任务并提供解决方案。

2.GitHub推出Copilot工作空间

链接:https://github.blog/2024-04-29-github-copilot-workspace/

GitHub推出了Copilot Workspace,这是一个全面的开发者环境,可通过自然语言命令促进整个编码过程,包括规划、编码、测试和部署。这为人工智能行业的专业人士提供了简化开发工作流程的综合解决方案。

3.Amazon Q,一款面向企业和开发者的人工智能生成式助手

链接:https://www.aboutamazon.com/news/aws/amazon-q-generative-ai-assistant-aws

亚马逊正在加倍努力发展企业人工智能,发布了人工智能聊天机器人Q。该聊天机器人充当亚马逊网络服务(AWS)用户的助手,从公司的数据和工作流程中学习,以便员工可以提出有关其业务的问题。

4.一个神秘的“gpt2-Chatbot”人工智能模型突然出现在LMSYS排行榜上

链接:https://rentry.co/GPT2?

一个名为“gpt2-chatbot”的神秘AI模型出现在lmsys.org上,显示出类似GPT-4.5的能力,引发了人们对它是OpenAI下一次迭代的非官方测试的猜测。响应质量、OpenAI特有的特征和速率限制等关键标识符表明,该机器人具有很高的复杂性,这可能暗示着OpenAI正在进行一项谨慎的基准测试。

5.传言下周将推出ChatGPT搜索引擎

链接:https://mashable.com/article/chatgpt-search-announcement-what-we-know

据传,OpenAI将在“search.chatgpt.com”推出基于ChatGPT的搜索引擎,旨在通过将聊天机器人功能与传统搜索结果相整合,与谷歌一较高下。这反映了人工智能有可能彻底改变标准网络搜索方法的行业趋势。

五段5分钟阅读/视频,让你持续学习

1.使用RAG比较Llama-3和Phi-3

链接:https://lightning.ai/lightning-ai/studios/compare-llama-3-and-phi-3-using-rag

本指南分享了如何创建一个自托管的“与文档聊天”应用程序,将Meta AI的Llama3和微软的Phi3语言模型集成到一个检索增强生成(RAG)系统中。它采用了复杂的设置,包括自定义知识库、文档分块策略、嵌入和向量数据库,以改善用户与文档的交互。

2.推进人工智能的认知视野:8篇关于LLM推理的重要研究论文

链接:https://www.topbots.com/llm-reasoning-research-papers/

人工智能领域的最新研究集中于增强LLM的推理能力。本文总结了为提高LLM的推理能力而开发的一些最突出的方法,包括思维链提示、策略和知识增强以及与计算引擎的集成。

3.提示是编码的未来吗?

链接:https://every.to/chain-of-thought/is-prompting-the-future-of-coding

这篇文章探讨了人工智能如何改变我们与计算机的交互方式。文章探讨了“提示编程”—通过提示LLM进行编码—如何成为一种新的编程语言,以及它将如何大大降低计算机编程的门槛等等。

4.在10分钟内构建RAG Discord聊天机器人

链接:https://www.youtube.com/watch?v=lXAGumaQuS8

本视频展示了如何在10分钟内运行Discord聊天机器人。该机器人可以回答有关数据的任何问题,这些数据可以是课堂课本、公司数据或其他任何你想要的东西。机器人既可以使用OpenAI密钥来利用GPT模型,也可以使用任何HuggingFace托管的开源模型。

5.Huggingface入门综合指南

链接:https://medium.com/towards-artificial-intelligence/a-comprehensive-guide-for-getting-started-with-huggingface-94aeea38692f?sk=f4cfe2e0bd37fb0ed24c8f201066dd76

本教程探讨了HuggingFace平台,包括其组件、开放式LLM排行榜、如何访问该平台以及如何将其用于不同目的。

资源库与工具

1.Secret Llama是一款基于浏览器的私人聊天机器人,采用Llama 3和Mistral模型。它可独立运行,无需依赖服务器。

链接:https://github.com/abi/secret-llama

2.PLLaVA是一种将图像模型扩展到视频模型的无参数方法,旨在克服性能饱和和提示敏感性等问题。

链接:https://github.com/magic-research/PLLaVA

3.OpenUI可让你用想象力来描述用户界面,并将你的想法变为现实。

链接:https://github.com/wandb/openui

4.Candle是Rust的极简ML框架,注重性能(包括GPU支持)和易用性。

链接:https://github.com/huggingface/candle

5.Dify是一个开源的LLM应用程序开发平台,它结合了人工智能工作流、RAG管道、代理功能、模型管理、可观测性功能等。

链接:https://github.com/langgenius/dify

本周最佳论文

1.通过多标记预测实现更快更好的大型语言模型

链接:https://arxiv.org/abs/2404.19737

这项研究介绍了一种改进的大型语言模型训练方法,它能同时预测多个未来标记,在代码和自然语言任务中展示了更高的采样效率和性能。这种多标记预测方法在不增加训练时间的情况下实现了更快的推理速度,快达三倍。

2.Prometheus 2:专门用于评估其他语言模型的开源语言模型

链接:https://arxiv.org/abs/2405.01535

Prometheus 2是一款开源语言模型评估工具,它在早期模型的基础上进行了改进,提供了多种评估功能,包括直接评估、配对排名和自定义评估标准。它旨在提供更符合人类判断的评估结果,并可对标准和专有语言模型(如GPT-4)进行定制评估。

3.ChatQA:构建GPT-4级别的会话质量保证模型

链接:https://arxiv.org/abs/2401.10225

本文介绍了ChatQA,这是一个能获得GPT-4级准确度的会话问答(QA)模型系列。它采用了一种两阶段指令调整方法,可显著改善LLMs的零点对话QA结果。

4.指令层次结构:训练LLM以优先处理特权指令

链接:https://arxiv.org/abs/2404.14219

这是phi-3-mini的正式论文,它是一个在3.3万亿个词库上训练出的38亿参数语言模型。根据学术基准和内部测试的结果,它的整体性能可与Mixtral 8x7B和GPT-3.5等模型相媲美。作者提出了一种指令层次结构,将可信指令优先于其他指令,从而增强了模型的鲁棒性。

5.X-LoRA:低秩适配器专家混合物,一种灵活的大型语言模型框架,在蛋白质力学和分子设计中的应用

链接:https://arxiv.org/abs/2402.07148v2

本文报告了一种混合专家策略,该策略使用基于低阶适配(LoRA)的深度层级令牌方法创建微调LLM。X-LoRA模型可以在不修改底层结构的情况下轻松地在任何现有LLM上实现。

快速链接

1.CoreWeave募集11亿美元,用于扩展其GPU云基础设施网络。该公司表示,将利用新投资推动其所有业务领域的增长,并向新的地区扩张。

链接:https://venturebeat.com/ai/coreweave-raises-1-1b-to-expand-its-gpu-cloud-infrastructure-network/

2.Anthropic为Claude推出iOS应用程序。它可以充当聊天机器人,用户还可以将照片直接上传到应用中进行“图像分析”。Claude应用程序将免费提供给Claude AI模型的所有用户,包括免费用户。

链接:https://www.theverge.com/2024/5/1/24145983/anthropic-claude3-model-mobile-app-team-plan

3.微软的首份《负责任的人工智能透明度报告》概述了该公司去年为发布负责任的人工智能平台所采取的措施。该公司表示,在过去一年里,它创建了30个负责任的人工智能工具,壮大了其负责任的人工智能团队,并要求制作生成式人工智能应用程序的团队在整个开发周期中测量和绘制风险地图。

链接:https://www.theverge.com/2024/5/2/24147573/microsoft-ai-transparency-responsible-ignore-mario

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:Towards AI Editorial Team
翻译作者:Qing
美工编辑:过儿
校对审稿:Jason
原文链接:https://pub.towardsai.net/this-ai-newsletter-is-all-you-need-98-3abfda367a65