Blog

Nov
08

关于Pandas中最难的pivot_table,stack,unstack详解!

虽然大多数Pandas表达式读起来都像英语,但有时你会遇到真正让人头疼的表达式。是的,它们都有直观的名字,比如cut或pivot,但似乎让人无法理解。因此,我决定写一系列文章,专门介绍我认为最难的Pandas函数。本文将详细地解释其中的三个函数:pivot_table、stack和unstack。

By Zhang Bonnie | Blog
DETAIL
Nov
08

市场上最热门的工作:新生数据科学家

你是否曾经对写着“入门级数据科学家”但要求有多年工作经验的招聘启事感到困惑?在今天的数据科学就业市场上,这种奇怪的矛盾和过高的期望有时真的很有趣。在这篇文章中,我们解读了其中一份来自reddit帖子的工作描述,以幽默的方式看待“新生数据科学家”可能意味着什么,并试图在这个复杂的领域中找到方向。

By Zhang Bonnie | Blog
DETAIL
Nov
05

十大最难的Power BI数据建模面试问题

你在为Power BI建模面试做准备吗?请系好安全带,因为我们即将探索十大最具挑战性的Power BI建模问题,即使是经验丰富的面试者也经常会在此犯错。我将提供代码片段和分析,帮助你掌握这些问题,并增加你在面试中获胜的机会。

By Zhang Bonnie | Blog
DETAIL
Nov
05

为什么我在数据科学面试中没有做好准备?

当谈到数据科学职位的面试时,很容易被技术要求、未来雇主的声望和提问速度所压倒。很多职业顾问都告诉你要为面试做准备。但即便如此,我敢打赌,你和许多其他候选人在面试时仍然会感到毫无准备。我知道我有很长一段时间都有这种感觉。

By Zhang Bonnie | Blog
DETAIL
Oct
30

哪些特征对你的分类模型有害?

如何计算分类器特征的误差贡献,以理解和改进模型。在本文中,我将解释在分类模型上计算这两个量背后的逻辑。我还将展示一个例子,在这个例子中,与使用预测贡献相比,使用错误贡献进行特征选择会产生更好的结果。

By Zhang Bonnie | Blog
DETAIL
Oct
30

为什么流利的英语比数学或编程对ML更重要

拥有流利的英语,你可以:最有效地学习机器学习工作所需的大量信息,与招聘人员甚至首席执行官建立自信的人际关系,不会在面试中结结巴巴导致失败,在项目中获得同事的尊重,在不让自己尴尬的情况下协商薪水并要求升职,通过阅读和实施SOTA研究论文来提升你的技能和职业生涯,参加会议,这样的例子不胜枚举。让我详细地谈谈每个观点,以更好地说服你。

By Zhang Bonnie | Blog
DETAIL
Oct
26

金融中的机器学习:利用随机森林掌握时间序列分类

随机森林是机器学习中的一种集成学习技术,它将多个决策树组合在一起进行预测。它们值得研究,因为它们具有高准确性,可以处理分类和回归任务,并且能够抵抗过度拟合,同时需要最少的超参数调整,使它们成为数据科学和预测建模中强大且多功能的工具。本文展示了如何编写一个简单的分类随机森林模型来预测标准普尔500指数的每日涨跌走势。

By Zhang Bonnie | Blog
DETAIL
Oct
26

香港证券交易所推出基于区块链的结算平台

由于区块链技术,连接香港股市和中国内地股市的港交所“沪港通”(Stock Connect)系统正在升级。

By Zhang Bonnie | Blog
DETAIL