Blog

Sep
25

提高ML模型稳健性的5种交叉验证方法

在一个接受交叉验证的世界里,这些问题得到了解决。交叉验证的神奇之处在这个5-fold交叉验证过程的示例中得以展现:新模型在四个fold上进行训练,并在每次迭代的最后一个fold上测试,以确保使用所有数据。平均分数及其标准差作为置信区间报告,提供了对模型性能的真实度量。交叉验证有很多变体,我们将在本文中介绍最重要的五种。

By Zhang Bonnie | Blog
DETAIL
Sep
25

掌握ChatGPT的反向提示

无论你是新手还是经验丰富的用户,本指南都将为你提供有效利用这令人难以置信的功能所需的知识和工具。“反向提示就像翻动脚本。通常情况下,你给AI模型一个提示,它就会给你一个输出。但在反向提示中,你将输出给AI,并询问最初创造输出的输入是什么。”

By Zhang Bonnie | Blog
DETAIL
Sep
21

Jupyter AI:生成式AI+JupyterLab,在VSCode中,你将不需要Copilot

JupyterLab是新手数据科学家的最好伙伴之一。即使对于老手来说,它也是代码进入生产之前最常用的实验场所之一。在Notebook中的模型和提高早期生产力中它确实是一种强大且对用户友好的方法。在某些情况下,例如Netflix,整个数据管道,包括定期作业,都是使用JupyterLab运行的。

By Zhang Bonnie | Blog
DETAIL
Sep
21

畅销编程书籍中的10个编码秘密

在我们这个快节奏的世界里,时间是我们似乎永远都不够的东西。由于任务、责任和爱好层出不穷,书籍往往让人觉得是很少人能负担得起的奢侈品。我知道,尽管我们很想从这些书中吸收每一点知识,但时间总是在流逝。这就是为什么我决定为你跑腿的原因。好的,让我们开始吧!

By Zhang Bonnie | Blog
DETAIL
Sep
16

苹果面试流程:数据科学家的完整指南

在接下来的文章中,我们将通过把面试分成几个阶段来探索苹果公司的面试过程,并向你展示编程或非编程问题的来源,这些问题将在面试过程中对你有所帮助。你们中的一些人可能是不同领域的数据科学家,而其他的则可能是渴望学习数据科学的人。有一件事可以肯定,如果你之前没有在苹果工作过,你可能会对此感到疑惑。在进入苹果公司的面试流程之前,首先让我们看看数据科学家可以在苹果公司工作的不同领域。

By Zhang Bonnie | Blog
DETAIL
Sep
13

关系数据库系统正在成为一个问题——如何解决它?

如果你不喜欢SQL,你就不会喜欢RDBMS,因为SQL本身就是一个奇幻的世界。并不是所有的SQL都是相同的,你了解MySQL和它自己的术语,你了解微软的T-SQL和世界著名的Oracle PL/SQL,也许不必在意它们彼此都不兼容。这些我都见过——金融、交通、酒店、社交媒体、视频流服务等等。无论你去哪里,都可能找到关系数据库,这个世界似乎完全是在关系数据库上运行的。

By Zhang Bonnie | Blog
DETAIL
Sep
13

2023年面向开发者的十大机器学习(ML)工具

随着行业的不断发展和机器学习工具的进步,保持最具影响力和技术强大的工具的更新是必不可少的。该列表包含了最有效的机器学习工具,为寻求增强机器学习工具包并推动人工智能革命向前发展的开发人员提供了有价值的指南。让我们从最好的机器学习(ML)开发工具开始。

By Zhang Bonnie | Blog
DETAIL
Sep
08

Airflow 2.7的重要更新有哪些?

Apache Airflow 2.7.0终于发布了,我们都对这个最新版本中的所有显著功能感到兴奋。新版本包括40个新功能,53个错误修复,49个改进和15个文档更新。此版本的主要焦点是安全性,但同时也提供了许多令人兴奋的与安全性无关的功能。从Airflow 2.7.0开始,在Airflow UI的顶层菜单中引入了一个新的选项卡,称为Cluster Activity…

By Zhang Bonnie | Blog
DETAIL