机器学习工程师和数据科学家必须了解的5种数据结构(一)
数组、堆、哈希表、树和图——这些理论概念和实用工具——可以帮助模型运行得更快、占用更少的内存,并处理更复杂的任务。本文将介绍这五种核心数据结构,揭示它们在各种机器学习应用中的关键作用,以及如何提升你的建模能力。
生成式AI与深度学习如何推动销售增长:3个实际用例
随着ChatGPT等工具的普及,解决方案的想法很容易被限制在人工智能助手范式中。为了帮助扩展可能性的空间,我分享了本文中的3个使用替代方法的实际AI用例。
小语言模型:你必须了解的未来趋势
当人工智能模型公司现在发布新模型时,他们倾向于分层发布——所以通常是模型的大、中、小版本。“小”的定义可以根据较大模型的大小而变化,但是可以肯定地说,小语言模型(SLM)可以被视为参数少于100亿个的任何模型。因为SLM可以针对特定领域的任务进行微调,所以对于那些想要自己定制模型的公司来说,它们非常有吸引力。
多模态RAG深度解析:揭秘AI新技术
多模态检索增强生成(Multimodal Retrieval Augmented Generation,简称RAG)是一种新兴的设计范式,允许AI模型与文本、图像、视频等多种信息存储接口进行交互。在理解了多模态RAG的基本概念后,我们将使用Google Gemini和一种类似CLIP的编码模型来构建一个多模态RAG系统。
查找时间序列数据中异常值的终极指南(第2部分)
本文是四篇系列文章中的第二篇,专门讨论时间序列数据中异常值的识别和管理。对于具有多个变量的数据,隔离森林、LOF和自动编码器自然适合处理高维数据。我们将在本文中探讨这些方法。
查找时间序列数据中异常值的终极指南(第 1 部分)
本文是关于时间序列数据中异常值识别和管理的三部曲系列的第一部分。在这篇初始文章中,我们将探索有效识别时间序列数据中异常值的可视化和统计方法。这些基础知识对于任何希望提高分析准确性的人来说都是至关重要的。在第二篇文章中,我将专门讨论机器学习方法,鉴于其重要性和复杂性,它们值得专门讨论。