关于线性回归:一个关键且经常被误解的事实
多年来,Jupyter Notebook一直是众多数据科学工作中不可或缺的工具,比如用它进行数据挖掘、分析、处理、建模和在每个数据科学项目的周期中的日常试验任务。尽管它很受欢迎,但许多数据科学家也指出了它的缺点。与Jupyter一样,Deepnote是一个数据科学Notebook,旨在为个人和团队提供高效的各类数据科学任务,同时避开了Jupyter的许多缺点。
实战项目必备的5个高级SQL技巧!
在这篇文章中,我想分享我在日常工作中最常用的五种高级SQL技术。通过掌握这些技术,你将能够完成近80%的生产级SQL查询,使你成为任何数据驱动项目的宝贵资产。我有意不包括一些其他常用的技术,例如事务。如果你担任的是分析角色而不是软件工程师角色,此方法列表将非常有用。在整篇文章中,我假设我们在Postgres数据库中。但是现在每个主要的关系数据库都提供类似的功能。
探究OpenAI API的最佳实践:如何优化对话引擎?
如果你刚开始使用OpenAI API,我们建议你先阅读教程。由于指令遵循模型的训练方式或训练数据,有一些特定的提示格式效果极佳,可以更好地与手头的任务相匹配。本文我们将介绍一些比较可靠且效果良好的提示格式——但也请探索除此之外的不同格式,也许最适合你的任务的格式就在其中。
利用ChatGPT,助你彻底掌握数据科学
欢迎阅读本综合指南,带你利用ChatGPT彻底掌握数据科学。当今世界,从医疗保健到金融再到销售,数据科学已成为各个行业不可或缺的一部分。利用机器学习、数据检索和分析以及数据可视化,公司可以产出有价值的见解并依据数据做出正确决策。本文将带你了解数据科学的基础知识,并学习当你利用Python和ChatGPT时可以使用的高级技巧。
数据科学家必备技能:掌握Jupyter完美文本编辑器配置技巧!
JupyterLab允许用户创建和共享包含实时代码、公式、可视化和叙述性文本的文档,是这种互动工作的完美工具。然而,事实是,它的文本编辑器就像Windows记事本一样原始。你可以编写代码,但体验并不理想。我们能做什么呢?我们想要一个可以随时在任何机器上运行的Docker Image,有属于我们自己的工作空间。我们的目标是创建一个JupyterLab Image,其拥有一个功能强大的笔记本编辑器和一个功能丰富的Python IDE。
数据科学家须知:统计学中的5个悖论
统计学是数据科学的重要组成部分,为我们提供了分析和理解数据的各种工具和技术。但有时统计结果可能与我们的感知相悖,甚至自相矛盾,导致了混乱和误解。在这篇文章中,我们将探讨每个数据科学家都应该熟悉的五个统计悖论。我们将解释每个悖论是什么,为什么会发生,以及如何避免掉进悖论的陷阱中。
设计师如何使用ChatGPT和DALL-E快速跟进项目
在过去的几年里,设计师Pau Garcia一直在研究AI。作为OpenAI(一家普及生成AI的初创公司)的早期用户,他说他最初对AI很感兴趣,但并没有期望它在自己的生活中发挥很大作用。后来有一天,他在上网时发现了《瑞克和莫蒂》(Rick and Morty)一集的脚本,而该脚本是由OpenAI的大型语言模型编写的。那一刻,一切都不一样了。“当时,我说,‘好吧,这非常接近我正在做的事情,’”他直言。这促使他踏上使用ChatGPT和DALL-E等AI生成工具进行设计的旅程。
作为一个数据科学家/分析师,不要重复这5个编程错误
在我目前担任数据科学经理的职位上,我与多位数据科学家一起工作,我发现他们中的许多人在处理大数据时犯了一些基本的数据处理错误(我也曾经犯过其中一些错误!)。这些错误会导致代码执行时间急剧增加,有时还会导致大量的返工和浪费精力。在这篇文章中,你将了解到如果想成为一个更好(更高效)的数据科学家,你应该避免的5大编程错误。