机器学习

Oct
07

NLP不是你想的那样

欢迎来到NLP的故事——一个关于模拟人类语言的编程科学发展的故事。还有那些以个人发展的名义冒充编程科学的人。NLP的两个领域都有其伦理问题和危险。这就是我写这篇文章的原因。这是一种消除歧义的尝试,提高人们对NLP认识的尝试,并使你能够采取小的行动来更有意识地对待语言。这才是有意义的变革可能开始的地方。

By Zhang Bonnie | Blog
DETAIL
Sep
25

提高ML模型稳健性的5种交叉验证方法

在一个接受交叉验证的世界里,这些问题得到了解决。交叉验证的神奇之处在这个5-fold交叉验证过程的示例中得以展现:新模型在四个fold上进行训练,并在每次迭代的最后一个fold上测试,以确保使用所有数据。平均分数及其标准差作为置信区间报告,提供了对模型性能的真实度量。交叉验证有很多变体,我们将在本文中介绍最重要的五种。

By Zhang Bonnie | Blog
DETAIL
Sep
07

谷歌的新WebAgent对其自身的生存构成威胁?

WebAgent在自主网络搜索方面树立了新的技术标杆,通过引入模块化、局部-全局注意力等几个概念,让我们看到了人工智能架构的未来,这些概念让我们更接近这样一个未来:你只需简单地提出需求,互联网将轻松满足你。

By Zhang Bonnie | Blog
DETAIL
Jul
25

50多次ML面试(作为面试官)教会了我什么?

作为面试官,无论结果如何,能做些什么给求职者留下积极的印象?如果你觉得面对技术面试很困难,那就试着去进行面试。我说的不是那些难以对付的面试官,他们给你留下了严厉的印象,在你希望痛苦结束的时候,他们居高临下地看着你,我说的是那些给你留下积极印象的面试官。

By Zhang Bonnie | Blog
DETAIL
Jun
05

CPU与GPU:哪个更适合机器学习,为什么?

想象一下,你和你的朋友准备在各自的笔记本电脑上玩一款游戏——《使命召唤》。现在,你拥有一台配备英特尔i7处理器的笔记本电脑——没有显卡,而你的朋友拥有一台配备i3处理器的笔记本电脑——配有还不错的显卡。那么,哪种笔记本电脑能提供更好的游戏体验?也许当我说GPU会表现得更好时,你会说“对对对”(因为这篇文章就是在突出GPU的应用),但你是否知道其中奥秘呢?

By Zhang Bonnie | Blog
DETAIL
May
29

如何利用ML构建推荐系统?

这场比赛有一个很大的挑战,即参赛者有着大量的商品可供选择,而将所有可用信息输入到复杂模型中需要大量的计算资源。因此,参赛者们通常会两步走:精准推荐/重新排序技术。阶段1,精准推荐,这一步骤将每个用户的潜在推荐数量从数百万减少到大约50到200。为了处理数据,这一步通常会使用一个相对简单的模型。阶段2重新排序:你可以在这一步使用更复杂的模型,例如ML模型。在你对减少后的推荐进行了排序后,你就可以选择排序最高的商品作为推荐。

By Zhang Bonnie | Blog
DETAIL
Apr
24

探究OpenAI API的最佳实践:如何优化对话引擎?

如果你刚开始使用OpenAI API,我们建议你先阅读教程。由于指令遵循模型的训练方式或训练数据,有一些特定的提示格式效果极佳,可以更好地与手头的任务相匹配。本文我们将介绍一些比较可靠且效果良好的提示格式——但也请探索除此之外的不同格式,也许最适合你的任务的格式就在其中。

By Zhang Bonnie | Blog
DETAIL
Apr
20

利用ChatGPT,助你彻底掌握数据科学

欢迎阅读本综合指南,带你利用ChatGPT彻底掌握数据科学。当今世界,从医疗保健到金融再到销售,数据科学已成为各个行业不可或缺的一部分。利用机器学习、数据检索和分析以及数据可视化,公司可以产出有价值的见解并依据数据做出正确决策。本文将带你了解数据科学的基础知识,并学习当你利用Python和ChatGPT时可以使用的高级技巧。

By Zhang Bonnie | Blog
DETAIL