如果你的数据科学生涯只能用3个libraries,学这三个
数据科学库(Data Science Library)无处不在。从数据清理到可视化、机器学习模型的创建到超参数的调优,数据科学库都在发挥着重要作用。每个库的目标都是简化并加快任务,它们涵盖大量常见和基本任务,提供易于使用且直观的语法。本文将带你了解最值得学习的三个数据科学库,满足你在数据操作和分析、数据可视化和机器学习方面的大部分需求。
一篇清单,带你了解决策树Decision Tree术语
如果你刚刚接触学习机器学习领域,你可能会感到非常困惑,尤其是袋装法(Bagging)、提升法(Boosting)、集成方法(ensemble methods)和随机森林(Random forest)这些决策树相关的术语和概念,也难免会抗拒学习这些深奥的知识。 本文创建了一个备忘单(Cheat-Sheet),可以作为快速参考,围绕了决策树学习方法主题做了总体概述。
微软数据科学家面试,都问什么SQL问题?
数据库管理系统 (RDBMS) 是企业们最常用的数据库形式,这也使 SQL 成为必备技能。Microsoft 的数据分析师职位主要设计并构建数据模型,为公司团队提供有意义的数据和模型。本文将展示Microsoft 的面试中可能遇到的真实场景。我们将向你展示如何分解遇到的问题,逐步了解解决问题的逻辑,并讨论如何优化解决方案,提高性能。
数据科学是如何帮助保险公司“管理损失”和“保护客户”的?
在人工智能 (AI) 的帮助下,大数据(Big Data)可以帮助保险公司做出更好的财务决策。数据科学(Data Science)可以帮助公司减少欺诈性索赔、增强风险管理、优化客户支持、和预测未来事件等,从而增加保险公司利润,降低客户保费。本文将探讨大数据帮助保险公司管理损失及保护客户的三种方式,以及为什么数据科学对双方都非常有利。
一小时学会SVM 支持向量机
在机器学习中,支持向量机(SVM,Support-Vector Machines)是具有学习算法的监督学习模型,用于分析数据以进行分类和回归分析。将数据进行分类是机器学习中的一项常见任务。支持向量机在高维或无限维空间中构造超平面或超平面集合,可以用于分类、回归或其他任务。本文将带大家全面了解关于SVM的机器学习算法。
六条鲜为人知的SQL技巧,帮你每月省下100小时!
SQL(结构化查询语言 ) 已经存在了几十年。它是一种用于管理关系数据库中保存的数据的编程语言。大多数大公司都在世界各地使用 SQL。数据分析师可以使用 SQL 访问、读取、操作和分析存储在数据库中的数据,并生成有用的见解,推动明智的决策制定过程。在本文中,我将分享六个我经常使用的SQL技巧。
如何做社交媒体中的情绪分析(Sentiment Analysis)
情绪分析(Sentiment Analysis)是机器学习模型的代表之一,能帮我们理解文本数据的语调,包括正面、负面或中立的语气。捕捉文中的情绪可以帮助公司更好地了解用户的心声 (VOC),甚至可以引导产品开发,从而改进功能。情绪分析通常基于词汇和规则,这意味着该情绪可以标记为正面、负面或中立的单词。本文将介绍基于词汇深度学习的方法。
一篇文章带你了解——数据分析在体育行业的应用
数据在几乎每个行业都扮演着重要的作用。全球体育产业在不断发展,管理层和团队也越来越乐于利用数据了解他们的竞争优势,体育团队现可以摆脱传统的分析方法,投资于更全面的分析数据,并用这些数据评估竞争对手的表现。本文将帮助你深入了解什么是体育的数据分析,以及利用体育数据分析做出的一系列预测。