机器学习

Feb
23

语言模型在虚假信息活动中存在误用——如何降低风险?

我们认为,关键是要分析AI影响Influence Operations后产生的威胁,以果推因,概述在大规模使用语言模型之前可以采取的措施。我们希望我们的研究能为AI或虚假信息领域的新政策制定者提供帮助,并帮助AI开发人员、政策制定者和虚假信息研究人员对解决办法进行深入研究。

By Zhang Bonnie | Blog
DETAIL
Feb
13

助手类(Helper Classes)工具:帮助你精通数据科学工作流

在计算机编程中,类是组织数据(属性)和函数(方法)的有用方法。你可以定义一个类,然后用来定义与机器学习模型相关的属性和方法,比如,此类类的实例可能具有诸如训练数据文件名、模型类型等属性。与这些属性相关的方法可以是拟合、预测和验证。

By Zhang Bonnie | Blog
DETAIL
Feb
06

打好数据科学和机器学习的基础——6本书带你学数学

众所周知,数学基础扎不扎实,可能决定了在数据科学和机器学习等领域能否取得成功。这些学科在很大程度上依赖于统计分析、概率论、线性代数等数学概念。无论你是希望进入数据科学和机器学习领域的初学者,还是希望提高数学技能的经验丰富的专业人士,本文的书籍都能提供一系列资源满足你的需求。从复杂数学概念的直观解释到动手练习和示例,这些书籍将助你一臂之力。

By Zhang Bonnie | Blog
DETAIL
Feb
03

数据科学面试中的机器学习问题类型以及如何准备这些问题?

在本文中,我们将讨论数据科学面试中的四种机器学习问题,以及一些最常被问到的问题。机器学习的四种问题是:机器学习基础知识、基于简历的机器学习问题、机器学习编码问题、应用机器学习问题,前两种类型可以出现在任何数据科学面试中,后两种类型更常见于以算法或机器学习为中心的数据科学家职位。

By Zhang Bonnie | Blog
DETAIL
Jan
10

新的聊天机器人ChatGPT擅长和不擅长的

重要的是不要被这种炒作冲昏了头脑,因为最终这并不是一个新的感知智能——它只是一个经过更好训练的大型语言模型。大型语言模型随着每一个版本的发布而变得更好,而这个版本无疑在真正帮助人们并节省人们时间的方面开辟了新的天地。但在许多情况下,这种新模型的实用性会失效,依赖它将是愚蠢的。让我们来看看一些它擅长和不擅长的领域。

By Zhang Bonnie | Blog
DETAIL
Jan
10

Google Sheets引入简易ML(机器学习)

ML不是某些人的专利,我们一直在为此努力。简易ML是TensorFlow团队为Google Sheets开发的一个插件,能让所有人都使用上ML。任何一个哪怕是不具备编程或ML专业知识的人,只需点击几下,就可以在Google Sheets中使用ML。

By Zhang Bonnie | Blog
DETAIL
Dec
26

七个实用的Python机器学习库

谚语说“你不必重新发明轮子”,数据库就是最好的例子。它帮助你以简单的方式编写复杂而耗时的功能。根据我的说法,一个好的项目需要一些最好的数据库。在这里,我整理了七个有用的Python库,这些数据库将有效帮助你进行机器学习的开发。

By Zhang Bonnie | Blog
DETAIL
Dec
20

DeepAR——通过深度学习掌握时间序列预测

几年前,时间序列模型只适用于一个序列。因此,如果我们有多个时间序列,一个选项是为每个序列创建一个模型。或者,如果我们能够将数据“表格化”,我们就可以应用梯度增强的树模型——即使在今天也能有很大的作用。第一个可以在多个时间序列上运行的模型是DeepAR,这是亚马逊开发的自回归递归网络。在本文中,我们将了解DeepAR是如何深入工作的,以及为什么它是时间序列社区的里程碑。

By Zhang Bonnie | Blog
DETAIL