数据科学家/分析师应该避免的5大编程错误
我目前的职位是数据科学经理,与多个数据科学家一起工作,我看到他们中的许多人在研究大数据时犯了一些基本的数据操作错误(我以前也犯过一些这样的错误)。这些错误会导致代码执行时间大幅度增加,有时还会导致大量返工,浪费时间和精力。
SQL & NoSQL,掌握这7点就够了
在许多现实生活场景中,为了便于管理,我们将数据存储在不同的文件中,经常需要将它们合并成一个更大的DataFrame进行分析。Pandas为我们提供了各种方法来合并DataFrame,如concat和merge。此外,它还提供了用于比较的实用程序。我们将通过示例来了解这两种方法的工作原理。对于本教程,我们将假设你具备Python和Pandas的基本知识。
快速上手Pandas数据结构合并
在许多现实生活场景中,为了便于管理,我们将数据存储在不同的文件中,经常需要将它们合并成一个更大的DataFrame进行分析。Pandas为我们提供了各种方法来合并DataFrame,如concat和merge。此外,它还提供了用于比较的实用程序。我们将通过示例来了解这两种方法的工作原理。对于本教程,我们将假设你具备Python和Pandas的基本知识。
如何在方差和偏差中取舍,找到平衡点?
无论哪种方式,偏差-方差权衡都是监督机器学习和预测建模中的一个重要概念。当你想训练预测模型时,可以选择各种监督机器学习模型。它们都是独一无二的,有相似之处——但最大的区别是它们的偏差和方差程度。
头大了!NLP, NLU, NLG都是什么?
NLP是来自不同学科的方法的组合,像Siri和Alexa这样的智能助手使用这些方法来理解我们问他们的问题。它结合了人工智能和计算机科学等学科,使人类更容易像与其他人一样与计算机交谈。将人类对话传真到机器上的想法可以追溯到艾伦·图灵(Alan Turing)的一篇开创性论文——这篇论文为我们今天使用的NLP技术奠定了基础。
用 SQL和Tableau做客户流失分析
关于数据分析领域,我最喜欢的事情之一是将杂乱的数据转化为对企业产生影响的可操作项目。几周前我得到了一家电信公司的客户流失数据,并进行了客户流失分析,目的是识别高价值客户/流失风险,提高客户留存率。
Business Analyst如何做Digital Marketing?
今天我们一起来学习商业分析师如何做Digital Marketing的分析。在Wikipedia上有一个简单的说明,我们可以作为参考。今天要讲的是基于互联网和Online的数据技术来做企业的Marketing的方法和策略。