python

Jan
04

Merry Christmas~ 请收下刚从圣诞树上摘下来的6个新年新Flag!

2019 年到了,新的一年,新的 flag,你准备好了吗?

By Zhang Bonnie | Blog
DETAIL
Dec
21

python的线性优化——你需要知道的有哪些?

大数据科学通常通过过数据的预测、规律与表现(通常没有约束的概念)的方式来呈现,但是对做商业情况中的决策是远远不够的。大数据科学的输出或呈现效果必须能够被商业决策所吸收并利用,同时,在商业情况下的优化模型需要有商业条件的约束。
例如在分析超市产业链案例的情况下 – 你的大数据处理过程需要来预测未来的销售数据。你将需要使用初始数据来建立一个优化库存与销售策略的模型。

By romanluo | Blog
DETAIL
Nov
13

【编程&数据处理】pandas 1 | 入门,SO EASY!!!

这些天,我看到了一篇妖艳贱货文“10 Minutes to Pandas (10分钟搞定pandas)”。

我的内心os是:开什么玩笑,怎么可能…

但是pandas官方文档标题就是这么写的。。。

By romanluo | Blog
DETAIL
Aug
14

如何画XGBoost里面的决策树?

最近用XGBoost很多, 训练完模型后, 一般只是看看特征重要性(feature importance score)。我对这种黑箱模型一般是不放心的, 所以喜欢把结果尽可能的画出来看看。XGBoost是一种Boosting Tree方法, 模型中每个决策树是可以画出来看看的。以为这是个很简单问题, 后来发现其实坑还挺多的, 这里简单总结一下。

By KellyZzz | Blog
DETAIL
Jul
24

Python数据处理:关于Pandas你需要知道的都在这里

数据整理是数据科学研究流程中的一个重要步骤。本文要介绍的pandas就是一个广受欢迎的数据整理库。这个应用最早基于NumPy开发,那么NumPy又是什么东西?NumPy其实是Python里进行数学计算的基础工具。Pandas库提供了快速、简捷、易懂的数据结构,简化了数据整理步骤。

By ivankahu | Blog
DETAIL
Jul
24

PolYamoR的简介:Python和R之间的双向翻译器

时至今日,数据科学已经成为Python和R之间的主战场。在数据科学里,存在着让不同编程语言共存的方式。

但是编程语言的共存也有它的规则,就算是 Dataiku Data Science Studio (DSS) 系统可以使其顺畅,但是并非每个人都准备好接受这种共存的状态。

By ivankahu | Blog
DETAIL
Jul
05

数据分析领域里,R和Python到底哪个市场需求大?

有数学背景的人喜欢R,因为他们把R 看做更强大的数据表,许多R的使用者最初都是数据表的使用者,通常这部分人都是统计学家。Python跟R比,是一种更加灵活的语言,它可以应用于数学和统计之外的其他领域。如果相比数学,你的逻辑性更强,思维方式更侧重于过程而不是公式,并且有CS背景,那么相比之下,Python更适合你。

By ivankahu | Blog
DETAIL
Jun
28

机器学习工作流程第一步:如何用Python做数据准备?

这篇的内容是一系列针对在Python中从零开始运用机器学习能力工作流的辅导第一部分,覆盖了从小组开始的算法编程和其他相关工具。最终会成为一套手工制成的机器语言工作包。这次的内容会首先从数据准备开始。

By ivankahu | Blog
DETAIL