每周AI和NLP新闻——2024年7月第2周
以下是NLPlanet为你挑选的关于NLP和AI的新闻!如果你想了解更多关于AI和NLP的新闻,可以阅读以下这些文章:
每周AI新闻——2024年7月第1周
每周AI和NLP新闻——2024年6月第2周
每周AI和NLP新闻——2024年6月第1周
每周AI和NLP新闻——2024年5月第4周
网络新闻
- 苹果的Phil Schiller据报道将加入OpenAI董事会。苹果应用商店负责人Phil Schiller可能被任命为OpenAI非营利董事会的观察员,以加深他对AI的理解,因为苹果正在将ChatGPT集成到其操作系统中。他将参加会议但没有投票权。链接:https://www.theverge.com/2024/7/2/24191105/apple-phil-schiller-join-openai-board
- Adept加入亚马逊。Adept团队,包括其联合创始人,正在整合到亚马逊的AGI部门,旨在推进通用智能的努力。亚马逊已经获得了Adept的先进多模态代理技术的许可,并收购了部分数据集。链接:https://www.adept.ai/blog/adept-update
- 埃隆·马斯克:Grok 2 AI将于8月推出。埃隆·马斯克公布了Grok 2的新AI模型计划,该模型预计将在2024年8月推出,承诺提升效率。他的公司预计在同年年底升级到Grok 3,利用最先进的Nvidia GPU技术。链接:https://www.pcmag.com/news/elon-musk-grok-2-ai-arrives-in-august
- YouTube 现在允许请求删除模拟面部或声音的 AI 生成内容。YouTube 修订后的隐私政策现在允许用户请求、删除、复制其肖像的深度伪造内容(如果此类内容引发隐私问题的话),但会考虑内容背景和公共利益。链接:https://techcrunch.com/2024/07/01/youtube-now-lets-you-request-removal-of-ai-generated-content-that-simulates-your-face-or-voice/
网络指南
- 为什么大多数大型语言模型(LLM)只使用解码器?大型语言模型通常使用仅解码器的架构,因为它对于生成预训练来说效率高且成本效益好,表现出强大的零样本泛化能力。尽管编码器-解码器模型在多任务微调中表现出色,但经过大量训练后,性能差异会减小,因此在各种应用中,仅解码器模型更受青睐。链接:https://medium.com/@yumo-bai/why-are-most-llms-decoder-only-590c903e4789
- AI扩展神话。文章质疑了简单扩展语言模型就能产生人工通用智能的观点,强调了诸如被夸大的扩展定律、关于突现能力的误解以及数据稀缺和成本上升等实际限制问题。链接:https://www.aisnakeoil.com/p/ai-scaling-myths
- 什么是“认知架构”?本文讨论了认知架构在开发由 LLM 驱动的应用程序中的作用,描绘了从基本硬编码脚本到复杂的自治代理的自主范围,并强调了其在部署支持 LLM 的决策系统中的重要性。链接:https://blog.langchain.dev/what-is-a-cognitive-architecture/
- 使用llama3的RAG聊天机器人。文章描述了一个由llama3语言模型驱动的检索增强生成(RAG)聊天机器人的开发,详细介绍了外部知识的整合、必要库和数据集嵌入的设置,以及使用faiss索引进行高效信息检索。链接:https://blog.langchain.dev/what-is-a-cognitive-architecture/
有趣的论文和存储库
- Meta 3D Gen。Meta 3D Gen (3DGen) 是一种 AI 驱动的管道,可以根据文本描述快速生成详细的 3D 模型和纹理,并具有基于物理的资产渲染和重新纹理功能。链接:https://ai.meta.com/research/publications/meta-3d-gen/
- GraphRAG:GitHub 上发布了用于复杂数据发现的新工具。微软在 GitHub 上发布了 GraphRAG,这是一款先进的检索增强生成工具,其性能优于传统的 RAG 系统。它采用大型语言模型从文本构建分层知识图谱,通过强调实体关系来增强数据的全面性和多样性。链接:https://www.microsoft.com/en-us/research/blog/graphrag-new-tool-for-complex-data-discovery-now-on-github/
- GPT4All 一周年。Nomic 发布了 GPT4All 3.0,这是一次重大更新,其新 UI 专注于隐私和可访问性。此版本支持各种操作系统上的各种 LLM,标志着该项目一周年的里程碑,社区参与度很高。链接:https://blog.nomic.ai/posts/one-year-of-gpt4all
- 无代理:揭开基于 LLM 的软件工程代理的神秘面纱。文章讨论了一种无代理的软件开发方法,通过简单的两阶段本地化和修复过程,在成本效益和性能上可超越传统的基于代理的系统,这在SWE-bench Lite基准测试中得到了验证。链接:https://arxiv.org/abs/2407.01489
- Haystack概要。对长上下文LLM和RAG系统的挑战。“Haystack概要”(SummHay)任务旨在测试长上下文语言模型和检索增强生成系统,通过评估它们从具有重复特定见解的文档中总结和引用的能力。链接:https://arxiv.org/abs/2407.01370
- landing-ai/vision-agent:视觉代理。视觉代理是一种工具,根据自然语言描述自动生成计算机视觉任务的代码。链接:https://github.com/landing-ai/vision-agent
感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/。
原文作者:Fabio Chiusano
翻译作者:诗彤
美工编辑:过儿
校对审稿:Jason
原文链接:https://medium.com/nlplanet/weekly-ai-news-july-8th-2024-9d9640304545