每周AI新闻:Character. AI的首席执行官Noam Shazeer回归谷歌;戴尔科技公司裁员约12,500人
以下是为你精选的每周AI新闻!如果你想了解更多关于AI的新闻,可以阅读以下这些文章:
每周AI新闻:Instagram将允许网红制作自己的AI聊天机器人;英特尔将裁员1.5万多人
每周AI新闻:Meta发布了Llama 3.1, OpenAI测试搜索引擎
每周AI和NLP新闻——2024年7月第3周
每周AI和NLP新闻——2024年7月第2周
网络新闻
- Character. AI的首席执行官Noam Shazeer回归谷歌:“我非常高兴能重返谷歌,成为谷歌 DeepMind 团队的一员。我为我们过去 3 年在 Character.AI 所创造的一切感到自豪。我相信,来自谷歌非独家许可协议的资金,加上出色的 Character.AI 团队,将为 Character.AI 未来继续取得成功奠定基础,” Character.AI 联合创始人兼首席执行官Shazeer 在给 TechCrunch 的声明中表示。Noam Shazeer 于 2021 年 10 月离开谷歌,创办了这家由 a16z 支持的聊天机器人初创公司. 在之前的工作中,Shazeer 带领研究团队构建了 LaMDA(对话应用语言模型),这是一种用于对话式 AI 工具的语言模型。Character.AI 联合创始人 Daniel De Freitas 也将与这家初创公司的一些其他员工一起加入谷歌。该公司指出,大多数员工都留在了 Character.AI。谷歌还与 Character.AI 签署了一项非独家协议,以使用其技术。链接:https://techcrunch.com/2024/08/02/character-ai-ceo-noam-shazeer-returns-to-google/
- YouTube前首席执行官、谷歌资深高管Susan Wojcicki去世,享年56岁:Susan Wojcicki去世,她是一位开创性的科技高管,曾帮助塑造谷歌和 YouTube,她的丈夫说,她去世了。她享年 56 岁。Wojcicki在谷歌的创立中发挥了关键作用,并担任了 9 年的 YouTube 首席执行官,去年辞职,专注于“家庭、健康和我热衷的个人项目”,她当时表示。链接:https://en.wikipedia.org/wiki/Susan_Wojcicki
- Nvidia因设计缺陷推迟Blackwell B200 AI GPU出货:Nvidia 即将推出的 Blackwell 系列 AI 芯片(特别是 B200 型号)由于在生产过程后期发现的设计缺陷而遭遇了重大延迟。台湾半导体制造公司 (TSMC) 发现了这一缺陷,因此需要进行额外的测试和调整,从而将这些芯片的预期量产推迟到 2025 年第一季度。预计此次延迟将影响包括微软、谷歌和 Meta 在内的主要客户,这些客户在 AI 运营中严重依赖 Nvidia 的芯片。Nvidia 以相当大的份额主导着 AI 芯片市场,它不能承受任何错误,尤其是在涉及高风险的情况下——每个 AI 超级芯片的成本高达 70,000 美元,而完整的服务器机架可能超过 300 万美元。尽管遭遇了这一挫折,但 Nvidia 的整体生产计划仍将在今年晚些时候加速,尽管这一延迟可能会影响公司的收入来源和客户的战略计划。该公司面临着迅速解决这些问题的压力,以保持其在 AI 硬件领域的领先地位。链接:https://winbuzzer.com/2024/08/05/nvidia-postpones-blackwell-b200-ai-gpu-shipments-xcxwbn/
- Stability AI最近推出了一款突破性的生成式AI模型,名为Stable Fast 3D:该模型允许在大约半秒内从单个 2D 图像快速创建 3D 模型。这个新模型建立在 TripoSR 框架上,代表了 3D 重建任务在速度和质量方面的重大进步。Stable Fast 3D 专为各种应用而设计,包括游戏、虚拟现实、建筑和电子商务。它生成高质量、带纹理的 3D 输出,使其成为设计师和开发人员的强大工具。该模型可以生成详细的 3D 资产,包括 UV 展开网格和逼真的材料参数,并且比以前的技术快得多。例如,它的前身 Stable Video 3D 最多需要 10 分钟才能生成类似的输出,这突显了处理时间的显著改善。该模型可通过 Stability AI 的 API 和 Hugging Face 等平台供开发人员使用,并且根据社区许可发布,允许非商业用途和一些商业用途。链接:https://stability.ai/news/introducing-stable-fast-3d
- Canva 收购了生成式 AI 内容和研究初创公司 Leonardo.ai,该公司希望拓宽其 AI 技术堆栈的范围:交易的财务条款尚未披露,但 Canva 联合创始人兼首席产品官 Cameron Adams 表示,交易方式为现金和股票混合。Leonardo.ai 的 120 名员工都将加入 Canva,包括高管团队。Adams 告诉 TechCrunch:“Leonardo 将继续独立于 Canva 运营,专注于快速创新、研发,目前由 Canva 的资源提供支持。” “我们将继续提供 Leonardo 现有的所有工具和解决方案。此次收购旨在帮助 Leonardo 开发其平台并通过我们的投资深化其用户增长,包括扩展其 API 业务和投资基础模型研发。”链接:https://techcrunch.com/2024/07/29/canva-acquires-leonardo-ai-to-boost-its-generative-ai-efforts/
- 谷歌发布了三款新的“开放式”生成式人工智能模型:并称它们比大多数模型“更安全”、“更小”和“更透明”——这无疑是一个大胆的宣称。它们是谷歌 Gemma 2 系列生成式模型的补充,该系列模型于 5 月首次亮相。新模型 Gemma 2 2B、ShieldGemma 和 Gemma Scope 的设计针对略有不同的应用程序和用例,但共同具有安全性倾向。谷歌的 Gemma 系列模型与 Gemini 模型不同,因为谷歌不提供 Gemini 的源代码,该源代码由谷歌自己的产品使用,也可供开发人员使用。相反,Gemma 是谷歌在开发者社区中培养善意的努力,就像 Meta 试图用 Llama 做的那样。链接:https://www.stork.ai/blog/googles-new-open-ai-models-smaller-safer-and-transparent
- 戴尔科技公司裁员约 12,500 人,约占其全球员工总数的 10%:最新一轮裁员是戴尔精简运营并将重点转向人工智能驱动计划的努力的一部分。该公司旨在通过整合团队(尤其是其销售和营销部门)和减少管理层级来实现“精简”。此举是继去年裁员 13,000 人之后的又一次裁员。过去 15 个月的裁员总数已达到 24,500 人。戴尔高管 Bill Scannell 和 John Byrne 强调,这些变化需要更好地与公司的战略投资保持一致并提高效率。受影响的员工中,许多人是拥有数十年经验的经理和高级经理,他们对公司内部的工作保障和成长机会表示沮丧和担忧。链接:https://www.livemint.com/companies/company-results/dell-fires-12-500-employees-in-major-shift-toward-ai-report-11723004175038.html
- ZOOM 用户可以选择在视频通话应用中打开文档工具:还根据会议内容创建可共享的文件,但他们也会被提示使用生成式 AI 来帮助他们编写和编辑文件。这项新功能本质上是 Zoom 版的 Google Docs,是 Zoom 与微软和谷歌竞争成为企业万能工作场所的最新举措。文档采用了 Zoom 的 AI Companion,这是一款基于 OpenAI、Anthropic、Meta 的 LLM 模型以及该公司自己的模型构建的生成工具,于去年秋天发布。它可以获取会议记录并将其组织成模板,或者制作表格、清单和跟踪器来组织流程和任务。然后可以将文档集成到 Zoom 会议中进行共享和编辑。链接:https://www.wired.com/story/zoom-is-going-after-google-and-microsoft-with-ai-driven-docs/
- 谷歌严厉打击明显的 Deepfakes:几周前,在谷歌上搜索“詹妮弗·安妮斯顿的深度伪造裸照”,至少会出现 7 条排名靠前的结果,这些结果据称是该女演员的 AI 生成的露骨图片。现在它们消失了。谷歌产品经理 Emma Higham 表示,今年公司对搜索结果排名方式进行了新的调整,在搜索特定人物的露骨图片内容时,这些调整已经将虚假露骨图片的曝光率降低了 70% 以上。谷歌的算法旨在推广新闻文章和其他非露骨内容,而这些结果曾经可能出现问题。安妮斯顿搜索现在返回的文章包括“泰勒·斯威夫特的深度伪造 AI 色情片如何构成威胁”和其他链接,例如俄亥俄州总检察长警告消费者“深度伪造名人代言骗局”。链接:https://www.wired.com/story/google-tries-to-crack-down-on-explicit-deepfakes/
- OpenAI 发布了系统卡,概述了发布 GPT-4o 之前开展的安全工作:GPT-4o 是一个自回归全向模型,它接受文本、音频、图像和视频的任意组合作为输入,并生成文本、音频和图像的任意组合输出。它在文本、视觉和音频方面进行了端到端训练,这意味着所有输入和输出都由同一个神经网络处理。GPT-4o 可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,与人类在对话中的响应时间[2] 相似。它在英语和代码文本上的表现与 GPT-4 Turbo 相当,在非英语语言文本上的表现有显著改善,同时在 API 上也更快、便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。根据我们对安全构建人工智能的承诺以及我们对白宫[3] 的自愿承诺,我们正在分享 GPT-4o 系统卡,其中包括我们的准备框架[4] 评估。在此系统卡中,我们详细介绍了 GPT-4o 的功能、局限性以及多个类别的安全性评估,重点关注语音转语音(语音)1,同时评估文本和图像功能,以及我们为确保模型安全一致而实施的措施。我们还包括对危险功能的第三方评估,以及对 GPT-4o 文本和视觉功能的潜在社会影响的讨论。链接:https://cdn.openai.com/gpt-4o-system-card.pdf
感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/。
美工编辑:过儿
校对审稿:Jason