撸起袖子干吧:9个值得探索的数据和机器学习项目教程

撸起袖子干吧:9个值得探索的数据和机器学习项目教程

我们深知实际技能对如今的数据和机器学习专业人士的重要性。在竞争激烈的求职环境中,展示你解决复杂现实问题的能力、有效使用尖端工具、以及从最凌乱的数据集中提取有意义的见解,具有额外的价值。

为了帮助你扩展工具库,激励你学习新课题和尝试新工作流程,我们汇集了一些我们最近最有趣的教程。这些教程深入探讨了项目执行的细节,很多教程还附带了大量代码片段供你在自己端进行实验。让我们开始吧!如果你想了解更多关于机器学习的相关内容,可以阅读以下这些文章:
金融中的机器学习:利用随机森林掌握时间序列分类
每个机器学习工程师都应该知道的线性代数!!
2023年面向开发者的十大机器学习(ML)工具
CPU与GPU:哪个更适合机器学习,为什么?

在机器学习和医疗管理的交汇处,Anand Subramanian展示了利用大型语言模型来简化临床编码关键过程的潜力。

在她的最新文章中,Claudia Ng提供了一份详尽指南,教你如何用CSV文件和PyTorch Geometric构建基于图的神经网络。

对于所有地理空间数据爱好者来说,Maria Mouschoutzi博士的首次TDS文章解释了如何应对可视化海上航线的挑战。

在详细的RAG项目演练中,Tahreem Rasul通过串联一套强大的工具,带领我们完成创建语义研究论文引擎所需的步骤。

从不同方向接近检索增强生成,Alok Suresh的指南探讨了如何从视频中提取信息并将其用于性能更好的问答机器人。

想要摆弄一些Python代码吗?Dr. Theophano Mitsa分享了对Yellowbrick和PiML包的简明介绍(并展示了如何利用它们更好地理解模型行为)

计算生物学是受益于AI最新进展最多的领域之一。例证:Yuan Tian的精彩工作展示了如何构建一个基本的蛋白质Transformer模型来预测抗体序列的抗原特异性。

Shiny for Python让以前专注于R的库对更多的数据科学家开放。Deepsha Menghani的分步教程将帮助你充分利用其应用构建能力。

“在这些操作中内部发生了什么?所有这些是如何工作的?”这是Lucas de Lima Nogueira在使用PyTorch时问自己的问题,因此他尝试自己重建这个库。

准备好卷起袖子,花点时间思考更多的理论问题了吗?我们也为你准备了相关内容。

感谢你对我们作者工作的支持!我们喜欢发表新作者的文章,因此如果你最近写了一篇有趣的项目教程、教程或关于我们核心主题的理论反思,请不要犹豫与我们分享。

感谢阅读!你还可以订阅我们的YouTube频道,观看大量大数据行业相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/

原文作者:TDS Editors
翻译作者:文杰
美工编辑:过儿
校对审稿:Jason
原文链接:https://towardsdatascience.com/roll-up-your-sleeves-9-data-and-machine-learning-project-walkthroughs-you-should-explore-9020402249ac