Blog

Sep
08

Airflow 2.7的重要更新有哪些?

Apache Airflow 2.7.0终于发布了,我们都对这个最新版本中的所有显著功能感到兴奋。新版本包括40个新功能,53个错误修复,49个改进和15个文档更新。此版本的主要焦点是安全性,但同时也提供了许多令人兴奋的与安全性无关的功能。从Airflow 2.7.0开始,在Airflow UI的顶层菜单中引入了一个新的选项卡,称为Cluster Activity…

By Zhang Bonnie | Blog
DETAIL
Sep
07

谷歌的新WebAgent对其自身的生存构成威胁?

WebAgent在自主网络搜索方面树立了新的技术标杆,通过引入模块化、局部-全局注意力等几个概念,让我们看到了人工智能架构的未来,这些概念让我们更接近这样一个未来:你只需简单地提出需求,互联网将轻松满足你。

By Zhang Bonnie | Blog
DETAIL
Sep
07

每个数据科学家都应该知道的关于回归的三个简单的事情

一个模型的好坏取决于你对它的理解,我担心很多人在运行模型时,只接受从模型中得出的第一个结果。说到回归建模(最常见的建模形式之一),如果你能理解这些模型是如何工作的,以及为什么它们是以这种方式建立的,你就会成为一名更好的数据科学家。

By Zhang Bonnie | Blog
DETAIL
Sep
04

5个ChatGPT插件,让你领先于99%的数据科学家!

如今,插件越来越受欢迎。它们通过使用ChatGPT的功能来增强你所完成的任务,还可以帮助你节省时间。正如我所说,一段时间后,这种熟练程度将被添加到职位描述中,我已经在Upwork的职位描述中看到了ChatGPT。我已经在当前的工作中使用ChatGPT,但我想看到更多,但我们无法就价格达成一致。这就是为什么,ChatGPT插件绝对会增加你实现梦想工作的机会。在这篇文章中,我将向你展示5个ChatGPT插件,让你领先于99%的数据科学家。

By Zhang Bonnie | Blog
DETAIL
Sep
04

如何建立一个全自动的数据漂移检测管道

当生产环境中的输入特征分布与训练数据不同时,就会发生数据漂移,从而导致潜在的不准确性和模型性能下降。为了减轻数据漂移对模型性能的影响,我们可以设计一个工作流来检测漂移,通知数据团队,并触发模型再训练。工作流包括两种类型的任务:数据科学和数据工程任务。

By Zhang Bonnie | Blog
DETAIL
Aug
31

求职必杀技!Linkedin中的个人品牌塑造(针对IT和数据专业人士)

在当今竞争激烈的就业市场中,数据工程师仅仅依靠技术技能和经验已经不够了。个人品牌已经成为一种强大的工具,可以帮助各级数据工程师从人群中脱颖而出,并获得新的工作机会。本文旨在阐明个人品牌对各级数据工程师的重要性,并就如何建立和利用强大的个人品牌提供实用的见解。我个人发现把我的个人品牌放在linkedin上有很多好处,我的收件箱总是充满了关于工作机会以及与各个专业水平的人建立联系的信息。

By Zhang Bonnie | Blog
DETAIL
Aug
31

数据科学初学者必备的7个备忘单!

作为初学者的Python数据科学家,你可能想知道如何学习和理解该语言的关键概念和库。现在你可以访问有用的备忘单,它们可以为你提供很大帮助。备忘单是简洁、快速的参考资料,可以快速有效地学习和复习关键概念。对于数据科学的初学者特别有益,因为它们以易于理解的格式提供了各种主题的全面概述。在本文中,我将向你提供7个广泛使用的、精心设计的Python数据科学备忘单,我希望在开始学习之前就知道这些备忘单。

By Zhang Bonnie | Blog
DETAIL
Aug
27

数据科学家必备:Git操作指南

为什么选择Git作为你的数据科学项目?Git是一个广泛用于软件开发的版本控制系统,但它是你的数据科学项目的正确选择吗?绝对的。以下是为什么Git对于数据科学是无价的一些原因。通过采用Git并利用它的特性以及这些补充工具,你可以提高生产力,维护代码质量,并有效地与团队成员协作。

By Zhang Bonnie | Blog
DETAIL