Kaggle 还是 Github?哪个对数据科学家更有用?
Github和Kaggle 都是培养你的技能、保存你的工作、供个人或商业用途来赚钱的重要组成方式。Kaggle 可以让你在数据分析、机器学习中使用大量 Python 和 R 代码,构建各种类型的作品集,还可以参加各个方面的培训课程,你甚至还可以通过在比赛中获胜来获得奖励。Github 是编程项目和其框架代码的存储库,你可以根据个人需要,设置与所有人共享,或仅你可见。
数据科学的核心三角是什么?
就本质而言,数据科学是一个跨学科领域。要想在这方面出类拔萃,重要的是要从它的所有基本学科中汲取经验。在这篇文章中,我将介绍数据科学的三个组成部分——统计学、计算机科学和主要专业技能——并讨论每一部分对数据科学的重要性,以及探讨如果忽略一个或多个组成部分,会出现什么问题。
Web 3.0时代到来!去中心化技术的互联网将是怎样一番景象
Web 3.0 是最新的互联网技术,它利用机器学习、人工智能和区块链来实现现实世界的人类交流。今天,我们就来讲这个最近比较流行的话题:Web 3.0。本文主要从Web 3.0演变的过程、主要内容、技术的栈,以及在Web 3.0的技术背景下数据科学、人工智能、大数据分析这几个学科有什么变化,需要做什么样的准备。
如何写好 SQL 代码?
想要锻炼你的编程技能,最简单但最有效的方法之一,就是让你的代码更具可读性(readable)。让你的代码具有可读性,可以使你的代码更易于解释、更容易重现、而且更容易调试。提高可读性的最佳方法就是坚持执行一系列的规则或标准,以它保持一致和干净。在本文中,我将给你分享编写优秀的SQL代码的八个小技巧
5种有效方法:提高机器学习模型的准确性
如果想让你的机器学习模型尽可能准确,你需要知道一些改进的方法。在这篇文章中,我们将讨论五种方法,通过使用特征工程、调整超级参数和尝试多种算法等,你可以为自己创造一个真正准确的模型。最重要的是,要不断尝试并从错误中学习,对你的数据和你使用的算法了解的越多,你的模型性能就越好。
如何让你的 Python 图表动起来?
当今世界越来越需要数据。我们可以通过数据来预测股票价格、跟踪运动员的健康状况、研究某个城市的房价……想一想,你宁愿看一行又一行的数据还是几个总结它的图?像大多数人一样,你多半也觉得图表听起来更好。但如果在图表中添加动画,你会发现动画还可以为你的描述提供更多的意义。阅读完本文后,你应该就能为自己的图表创建精美的动画。
机器学习的一站式library清单
Library(库)可以定义为专门用于执行特定任务的,可重复使用功能和模块的集合。不同的库提供不同类型的函数来达到所需的目标。尽管它们在许多方面彼此不同,但大多数库都有一个标准流程,通过这个流程,可以将它们安装并导入到系统中进行处理。本文将带你了解不同可用的库,他们在数据世界中经常被使用。
仪表板设计的Dos and Don’ts
Tableau、Cognos Analytics和Python都是创建仪表板常用的工具。有了这些各种各样的工具,怎样才能打造一个出色的仪表板呢?当一个仪表板非常好用的时候,我们会直接去发现和寻找图中带来的见解!随着时间的推移,我找到了一些有效的技术来制作优秀的仪表板。本文将介绍一些仪表板设计的注意事项,可以帮助你更好地完成下一个数据可视化项目!