全栈数据科学的可预测崛起
在2024年,数据科学家在整个机器学习项目生命周期中都参与其中,从项目范围定义到模型部署和用户界面设计,这已经不足为奇。新潮人士称这种新趋势为“全栈数据科学”,在本文中,我将探讨其起源,并探讨它对我们数据工作者可能产生的一些影响。
14场Kaggle比赛,开启你的数据科学之旅
如果你是一个有野心、希望更进一步的数据科学家,我建议你尽可能多地利用好Kaggle。它可以为你提供很多,其中最重要的是,它可以为你提供其他用户上传的现成的notebooks。你只需要通过复制和阅读就可以了解其他人是如何面对问题、解决问题的。不需要从零开始,你完全可以复制一个notebook并按照你的想法加以改进。
Spotify数据科学家的终极指南
如果你是一名数据科学家,渴望加入科技界的魔法世界,那就别再等了。这里有一封信会让你飞向梦想中的公司。在这本魔法书(呃,文章)中,我将与你分享将你变为数据魔法师的顶级技能,让你在神秘的技术领域找到自己的位置(来自技术女巫本人)。让我们进入数据世界,揭开魔法的神秘面纱,好吗?
2024年每个开发人员都需要掌握的生成式人工智能技能
今天我们就来谈谈:开发人员技能发展框架;如何从零开始成为生成式人工智能开发人员;关于2024年的人工智能集成,每个开发人员都应该知道些什么; 数据分析师需要了解的2024年人工智能整合知识。
“下一件大事”:将改变世界的8项新技术
2020年,我写了一篇题为《科技领域的下一件大事:改变世界的20项发明》的文章。这篇文章至今已被阅读了10万多次,并在社交媒体上被分享了5000多次。但今天读到它的人都会注意到,当时写的内容现在已经过时了。更新是必要的,重点介绍当今正在兴起的关键技术,这些技术到2030年(或2028年……或2032年……)将成为热门,以下是未来几年将改变世界的8项发明。
神奇的Python装饰器:可将代码减少一半!
今天,我将与你分享一些神奇的Python装饰器,它们可以将你的代码减少一半。Python装饰器是一种强大而优雅的方法,可以在不改变源代码的情况下修改函数或类的行为。它们可以帮助你减少一半的代码,提高代码的可读性,重用代码,分离关注点,并扩展现有代码的功能。
pandas中的4种if-else技术,你应该使用哪一种?
在这篇博客中,我们探索了不同的方法来有效地将if-elif-else逻辑应用于Pandas数据帧。尽管选择的方法可能取决于具体的用例,但性能分析显示df.loc[]或pd.cut()对于较大的数据集通常是最高效的。然而,其他方法更灵活,可能在需要更复杂的条件逻辑或自定义分箱的情况下更受欢迎。