Blog

Feb
13

助手类(Helper Classes)工具:帮助你精通数据科学工作流

在计算机编程中,类是组织数据(属性)和函数(方法)的有用方法。你可以定义一个类,然后用来定义与机器学习模型相关的属性和方法,比如,此类类的实例可能具有诸如训练数据文件名、模型类型等属性。与这些属性相关的方法可以是拟合、预测和验证。

By Zhang Bonnie | Blog
DETAIL
Feb
13

为什么在R和Python之间选择?

R中的reticulate包允许你在R会话中执行Python代码。它实际上已经存在了几年并且一直在不断改进,所以我想写一个简要的教程来介绍它是如何工作的。如果你是R的原生用户,建立和运行reticulate需要你对Python的工作原理有一些了解——以及它通常如何进行环境管理——因此,本教程可能会帮助你更快地设置好它而不是你自己去解决。

By Zhang Bonnie | Blog
DETAIL
Feb
09

MLOps简介:机器学习的实验跟踪

想象一下,你正在尝试开发一种最好的巧克力饼干的食谱。第一次尝试后,你可能会增加面粉的量。有一次,你可能会加更多的巧克力片。下次你可以试着加点核桃。最后,你可能尝试了十几种食谱,但哪一种是最好的呢?我相信你也同意在这个过程中做笔记是个好主意。

By Zhang Bonnie | Blog
DETAIL
Feb
09

2023年,你可以做10件简单的事情来提高你的数据科学技能

成长、发展和进步的机会。一个重新开始的机会——放下2022年的困难,培养光明、成功的12个月。如果你是一名数据科学家,你将有机会在这个不断增长和具有影响力的领域继续发展你的技能,努力为世界做善事。还有什么比这更好的决议吗?请允许我在你的路上帮助你——你必须做的10件事,让你的2023年数据科学领域达到一个全新的水平。

By Zhang Bonnie | Blog
DETAIL
Feb
06

打好数据科学和机器学习的基础——6本书带你学数学

众所周知,数学基础扎不扎实,可能决定了在数据科学和机器学习等领域能否取得成功。这些学科在很大程度上依赖于统计分析、概率论、线性代数等数学概念。无论你是希望进入数据科学和机器学习领域的初学者,还是希望提高数学技能的经验丰富的专业人士,本文的书籍都能提供一系列资源满足你的需求。从复杂数学概念的直观解释到动手练习和示例,这些书籍将助你一臂之力。

By Zhang Bonnie | Blog
DETAIL
Feb
06

数据科学家或将成为历史?——无代码数据科学的诞生

值得注目的是,无代码平台已经开始提供以数据为中心的服务,公司在不了解数据科学的复杂性的情况下,也可以开始进行数据分析或开发机器学习模型。当然,问题来了——随着无代码数据科学服务的不断改进,数据科学家是否不再被需要?

By Zhang Bonnie | Blog
DETAIL
Feb
03

每个数据科学家都必须遵循的技巧

数据科学家使用各种工具和技术,如机器学习、统计分析和可视化,来分析数据并从中获得见解。数据科学用于各种行业,如金融、医疗保健、营销和零售业,以帮助企业做出数据驱动的决策。要在数据科学领域工作,你通常需要具备强大的编程、统计和数学技能,以及取决于你所从事行业的特定领域知识。在这篇文章中,我们将介绍一些每个数据科学家为了获得更好的职业生涯必须了解的技巧。让我们开始吧!

By Zhang Bonnie | Blog
DETAIL
Feb
03

数据科学面试中的机器学习问题类型以及如何准备这些问题?

在本文中,我们将讨论数据科学面试中的四种机器学习问题,以及一些最常被问到的问题。机器学习的四种问题是:机器学习基础知识、基于简历的机器学习问题、机器学习编码问题、应用机器学习问题,前两种类型可以出现在任何数据科学面试中,后两种类型更常见于以算法或机器学习为中心的数据科学家职位。

By Zhang Bonnie | Blog
DETAIL