Google Sheets引入简易ML(机器学习)
ML不是某些人的专利,我们一直在为此努力。简易ML是TensorFlow团队为Google Sheets开发的一个插件,能让所有人都使用上ML。任何一个哪怕是不具备编程或ML专业知识的人,只需点击几下,就可以在Google Sheets中使用ML。
只会Pandas?来学习这25种Pandas变SQL的方法,让你的数据分析更得心应手!
毫无疑问,SQL和Pandas都是数据科学家处理数据的强大工具。一般来说,SQL是一种用于管理和操作数据库中数据的语言,而Pandas是Python中的数据操作和分析库。此外,SQL通常用于从数据库中提取数据,在Python中进行分析(主要使用Pandas)。它的工具和功能齐全,能很好地处理表格数据,如数据操作、数据分析和可视化等。将SQL和Pandas一起使用,我们就能清理、变换和分析大型数据集,创建复杂的数据管道和模型,这对作为数据科学家大有裨益,也因此,我们必须精通它们。在本文中,我将带你一步一步走,一起将最常见的Pandas操作变为SQL查询。
我在第一份业务分析师工作中学到的五条经验
虽然每个公司都是不同的,作为一个业务分析师的角色可能不需要承担完全相同的职责,但我相信我在这里分享的经验教训适用于无论你在哪个行业或公司工作。根据我的经验,你很有可能像我一样融入团队,并与利益相关者密切合作,优化业务。如果你赶时间,这里有五条经验教训,但我强烈建议你继续阅读这篇文章,以便从中获得最大的收获。
用Python构建Amazon产品推荐系统
如果你主动向客户展示了一系列产品,他们更有可能购买他们原本没有计划购买的产品。冲动购买的现象受到网店配置的极大限制。同样的情况在实体店却不会发生。最大的实体零售连锁店让顾客走一条精确的路径,以确保他们在离开商店之前参观商店的每一条货架间的过道。像Amazon这样的网店可以通过推荐系统重现冲动购买现象。推荐系统识别客户刚刚购买或观看的最相似或互补的产品。其目的是将网店通常缺乏的随机购买现象最大化。在Amazon 上购买使我对机制非常感兴趣,我想重新创建(实际上是部分重新)他们推荐系统的结果。
五本顶级的数据清理和特征工程书籍
数据清理和特征工程是数据科学家日常工作的重要部分,这是每天必做的事情,能够有效地清理数据和设计功能,将达到事半功倍的效果。要想扩展你的知识和技能,你可以找到很多这方面的书,我浏览了大部分,本文将推荐五本顶级的数据清理和特征工程书籍。
三代BI(商业智能)工具的演变
管运营团队已经获得了很大的自主权,但数据团队仍然插手了太多工作。我们要做的,是消除运营团队对数据团队的依赖,让数据团队能够专注于更深层次的工作,让其他团队能够各司其职,不被烦扰。那么,我们要如何做到这一点呢?先让我们看看过去几十年BI的演变吧!三代BI工具分别是:传统BI、自助式BI和增强分析。BI工具发展的特点是逐渐将运营团队/领域专家从数据团队和IT中解放出来。
0经验?一样能成为一名成功的数据科学顾问!
当你提交了300份简历,终于得到一个基础岗位的应聘机会后,还有500个应聘者等着与你竞争这个岗位。但是,不管怎么说,同样是在数据科学行业工作,为什么不去成为一名数据科学顾问呢?当你可以自立门户时,为什么要与那么多应聘者作斗争呢?7分钟时间,让本文告诉你如何成为一名数据科学顾问。