如何建立一个全自动的数据漂移检测管道
当生产环境中的输入特征分布与训练数据不同时,就会发生数据漂移,从而导致潜在的不准确性和模型性能下降。为了减轻数据漂移对模型性能的影响,我们可以设计一个工作流来检测漂移,通知数据团队,并触发模型再训练。工作流包括两种类型的任务:数据科学和数据工程任务。
求职必杀技!Linkedin中的个人品牌塑造(针对IT和数据专业人士)
在当今竞争激烈的就业市场中,数据工程师仅仅依靠技术技能和经验已经不够了。个人品牌已经成为一种强大的工具,可以帮助各级数据工程师从人群中脱颖而出,并获得新的工作机会。本文旨在阐明个人品牌对各级数据工程师的重要性,并就如何建立和利用强大的个人品牌提供实用的见解。我个人发现把我的个人品牌放在linkedin上有很多好处,我的收件箱总是充满了关于工作机会以及与各个专业水平的人建立联系的信息。
数据科学初学者必备的7个备忘单!
作为初学者的Python数据科学家,你可能想知道如何学习和理解该语言的关键概念和库。现在你可以访问有用的备忘单,它们可以为你提供很大帮助。备忘单是简洁、快速的参考资料,可以快速有效地学习和复习关键概念。对于数据科学的初学者特别有益,因为它们以易于理解的格式提供了各种主题的全面概述。在本文中,我将向你提供7个广泛使用的、精心设计的Python数据科学备忘单,我希望在开始学习之前就知道这些备忘单。
数据科学家必备:Git操作指南
为什么选择Git作为你的数据科学项目?Git是一个广泛用于软件开发的版本控制系统,但它是你的数据科学项目的正确选择吗?绝对的。以下是为什么Git对于数据科学是无价的一些原因。通过采用Git并利用它的特性以及这些补充工具,你可以提高生产力,维护代码质量,并有效地与团队成员协作。
ChatGPT和LLM的10个关键术语和概念
本文旨在帮助那些想了解LLM但由于技术术语或领域概念而难以理解LLM内容的人。数据科学和人工智能是非常广泛的领域,即使你在这些领域工作,LLM相关的内容可能一开始对你来说也很难理解。因此,事先了解这些术语和概念的含义可以更容易的消化其他与LLM相关的内容。
Midjourney的新功能太疯狂了!
如果你像我一样是Midjourney的忠实粉丝,我敢打赌你对Midjourney 5.2充满期待!每次Midjourney的更新都让人惊叹不已,并带来令人难以置信的东西。而这一次,有更多令人惊叹的功能,你肯定会喜欢!在这篇文章中,我们将看到最好的新功能,所以确保你已经启用了MJ 5.2版本(你可以使用/settings命令来进行设置)。
SQL技能大突破!改掉这10个错误习惯!
作为一名在Python和数据分析方面有超过十年经验的数据工程师,我在SQL方面有着丰富的经验。它是一种处理数据库的强大语言,多年来,我学到了很多关于如何有效使用它的技巧。回顾过去,随着我在SQL方面的技能提升,我已经放弃了一些习惯和做法。在这篇文章中,我将分享我使用SQL的时候不会再做的10件事,以及我在此过程中学到的经验教训。