Blog

Nov
13

有点意思:一篇关于词嵌入(Word Embedding)的介绍

人类语言是描述人类与世界之间联系的一种惊人有效的方式。大部分情况下,我们只需一些简短的词语就能够互通心意并进行与之相关的活动。
正因为我们可以看到并描述如此之多的复杂事物,所以很多结构被悄然编码成我们的语言。计算机在学习自然语言方面并不容易,因为它如果不知道如何观察世界,则需要了解人类如何观察世界。

By romanluo | Blog
DETAIL
Nov
13

【编程&数据处理】pandas 1 | 入门,SO EASY!!!

这些天,我看到了一篇妖艳贱货文“10 Minutes to Pandas (10分钟搞定pandas)”。

我的内心os是:开什么玩笑,怎么可能…

但是pandas官方文档标题就是这么写的。。。

By romanluo | Blog
DETAIL
Nov
13

从0开始:神经网络分类器

我们的目标只是提供一个从头开始编写的隐藏层完全连接的神经网络分类器(没有深度学习库),以帮助消除神经网络中神秘的黑匣子感觉。
所提供的神经网络对描述属于三类小麦的内核的几何属性的数据集进行分类(你可以轻松地将其替换为你自己的自定义数据集)。假设一个L2丢失函数(lossfunction),并且在隐藏和输出层中的每个节点上使用S形传递函数(sigmoidtransfer function)。权重更新方法使用具有L2范数的梯度下降(gradient descent)的增量规则(deltarule)。

By romanluo | Blog
DETAIL
Nov
11

没时间读?那就听听——Podcasts 轻松学习大数据

人工智能,数据科学,机器学习和机器人
是当今科技时代中最受欢迎的话题
下面的播客节目你可不能错过

By romanluo | Blog
DETAIL
Nov
11

【商业分析师专栏】Business Analyst面试必须准备的63个问题

BA的面试一般分成behavioral和technical interview两种。有一些公司有时不会设置technical interview。下面我们来看看命中率百分之90的面试问题!

By romanluo | Blog
DETAIL
Nov
11

哪些因素影响了数据科学家的薪水呢?

Andres Gonzalez

“在我的职业经历中,目前为止我最感兴趣的部分就是网络数据收集项目。尽管在我们的数据科学拟真课中还有一些其他的更简明的项目,但网络数据收集提取是我最中意的。”

这个项目的目标是

找出最直接影响数据科学家薪水的因素。

By romanluo | Blog
DETAIL
Nov
02

那些年,我掉过的MYSQL 的那些“坑”

假如我有一个名为midterm_score的表
存放一所学校某年级所有学生的期中考试成绩,
有班级编号(class_code),学生名称(student_name)和总分(score)共3个字段。
如果我现在想对每个班级学生的总分进行排名

By romanluo | Blog
DETAIL
Nov
02

使用文本挖掘技术分析Twitter用户对电影Rangoon的评价

使用一些建模分析手段来评价电影的成功已经屡见不鲜,这类预测模型常常使用注入电影制作成本,类型,主演,出品方等结构化数据作为输入。然而,在社交媒体日益发达的现在,人们时常会在Twitter,Facebook等网站上发表自己的意见和建议。社交媒体已然是衡量电影观众情绪的潜在工具了。

By romanluo | Blog
DETAIL