Blog

Dec
11

Meta的数据工程:内部技术栈的高级概述

本文概述了我们作为Meta数据工程师日常使用的内部技术栈。我们的想法是阐明我们所做的工作,以及工具和框架如何使我们的日常数据工程工作更高效,并分享我们在此过程中做出的一些设计决策和技术权衡。

By Zhang Bonnie | Blog
DETAIL
Dec
08

LeMA:对于一个LLM来说,学习数学就是在犯错!

大型语言模型(LLMs)以其解决复杂问题的能力令人惊叹。更大型的模型展现出在数学和问题解决方面的推理能力。此外,通过诸如思维链等提示技术,这些模型取得了显著的成果。当然,模型并不总是得出正确答案。因此,随着时间的推移,人们提出了更多的策略,这仍然是一个活跃的研究领域。例如,模型可以在CoT数据上进行微调(由问题、答案和解释答案的基础构成的数据对)。另一种方法是在大量的数学数据、编码和STEM(科学、技术、工程和数学)方面进行微调。值得一提的例子有谷歌的Minerva和LLemma。

By Zhang Bonnie | Blog
DETAIL
Dec
06

使用生成式AI编写代码的正确方法

测试驱动开发(TDD)的前提是在编写任何代码之前编写所有单元测试。如果你完整地构建单元测试,确保覆盖了所有的业务需求,那么你可以边编写代码边进行测试。几年前,当我还是开发经理时,我认为这是一个很棒的想法。在我之上的高级经理和主管喜欢听我的团队编写了数百个单元测试,以及我们如何为测试划分优先级以保持高质量。我向其他团队介绍了TDD,并展示了我的团队是如何成功使用它的。

By Zhang Bonnie | Blog
DETAIL
Dec
03

通过碎片化NFT实现商业模式创新

NFT的实现可以通过4个简单的步骤来完成:1.规范模板中的资产声明2.使用所有核心生命周期方法(创建,转移等)自动生成碎片化NFT链码3.添加自定义逻辑以处理链码方法的附加市场功能4.使用REST API对碎片化NFT链码进行测试。为了说明使用区块链应用构建器实现碎片化NFT的过程,我们选择了一个房地产市场的使用案例,以模拟对房地产进行部分所有权。

By Zhang Bonnie | Blog
DETAIL
Dec
03

编程职业适合你吗? 要看这10大关键指标

作为一个在编程世界里呆了几年的人,我经常被问到编程职业是否是一个人的正确道路。事实是,编程可能是一个非常有收获和成就感的职业,但它并不适合所有人。为了帮助你确定编程职业是否适合你,我列出了10个需要考虑的关键指标。如果你拥有正确的属性和兴趣,那么编程生涯将会非常有价值。这不仅仅是关于编写代码,还涉及解决问题、创造力和持续学习。

By Zhang Bonnie | Blog
DETAIL
Nov
30

在2024年实现数据科学家更好的工作与生活平衡

工作与生活并不总是平衡的。有时必须采取行动,通过设定边界和不可谈判的事项来实现。距离2024年只有两个月了,现在是开始准备如何平衡工作与生活的最佳时机,让来年成为你最平衡的一年。为了在2024年更好地平衡工作与生活,你需要设定以下五个界限。

By Zhang Bonnie | Blog
DETAIL
Nov
30

大数据源终极指南

作为一名有抱负的数据分析师或数据科学家,你可能会很快意识到,拥有大型数据集来训练和测试您的解决方案是多么重要。以下是我的一些尝试,希望能为寻找用于ML、统计分析和测试的结构化数据的朋友们提供方便,这些数据集是由慷慨向公众提供这些数据集的个人和公司汇编而成的。

By Zhang Bonnie | Blog
DETAIL
Nov
30

GenAI能做和不能做的五件事

你可以用GenAI做很多很酷的事情,但也存在一些误解,商业领导者应该谨慎对待。这篇文章的重点是与你分享GenAI可以做的一些核心事情,同时也减少了人们对它不能做的事情的期望。

By Zhang Bonnie | Blog
DETAIL