电商是如何应用数据科学的?
出于各种原因,我们都非常熟悉电商平台,并且每天都在使用这些平台,包括 Flipkart、Amazon和 Netmeds 等在线购物平台。由于 2020 年和 2021 年新冠病例增加,人们甚至开始在Grofers 等在线零售店购物。
随着人工智能(AI)的引入,电商平台正在有效利用数据,使必需品的供求达到平衡。尽管跨国公司使用机器学习算法的方式多种多样,但本文中,我们只关注在所有电商平台运营中至关重要的算法。以下话题是我们重点关注的内容:
时间序列预测(Time Series Forecasting)、推荐系统( Recommender Systems)、高级 NLP(Advanced NLP)。如果你想了解更多数据分析相关内容,可以阅读以下这些文章:
电商零售业是怎么运用数据分析的?
如何在电商数据分析中做Customer Segmentation客户细分?
数据分析师如何高效地给电商品牌做客户细分?
4个电商常用Customer Segmentation的方法
时间序列(Time Series)在电商中的应用
在讨论时间序列(Time Series)在电商中的应用之前,我们先试着回答几个问题:
- 我们都知道 Flipkart 公司的 Big Billion Days 吧?据 Flipkart 称,Big Billion Days期间的销售额占公司全年总销售额的 40%。而手机又是最畅销的商品之一。那么,如果 Flipkart 经销店的手机在上市第二天就卖完了,会出现怎样的情况?
上述假设情况可能会导致公司收入和用户体验方面出现灾难性的后果。因此,所有电商平台都有必要在大型年度活动前预测库存数量。
在这种情况下,时间序列预测的概念就出现了。时间序列预测包括三个重要组成部分,我们将解释每部分在Amazon和 Flipkart 等大型跨国公司中的应用。
我们将讨论以下两个时间序列分析的主要组成部分。
- 趋势(Trend):从统计学的角度来看,趋势具体表现为平均值随时间出现的变化。趋势提供了与事件相关特征的度量单位,包括每年、每月、每周、每天甚至每小时。关于我们对 Big Billion Days 的讨论,假设我们正在研究数据集,该数据集为我们提供有关每月手机销售额的信息,并且假设我们正在监控手机的销售情况。折线图中的上升/下降描述了销售额是否随着时间的推移而增加/减少。
- 季节性(Seasonality):从统计学的角度来看,季节性具体表现为标准偏差随时间出现的变化。还是用之前提到的例子,我们考虑一个假设的场景。每年10 – 12月,Flipkart的手机销量非常高,而5月份的销量最少。这是因为 10 月和 11 月的“Big Billion Days”和“Diwali Sale”。一年中特定时间的销售额(这里指的是手机)的增长是由季节性决定的。
对于电商平台,用户满意度始终是首要目标。这就是为什么时间序列分析是所有电商平台最常使用的建模技术之一。这些公司通过应用Facebook Prophet、ARIMA 和 SARIMAX 等高级建模架构、机器学习算法以及 LSTM 等高级深度学习算法,获得最准确的预测结果。
电商中的推荐系统(Recommender System)
推荐系统就像一个训练有素的推销员,擅长交叉销售和追加销售产品。推荐系统利用用户对不同产品的评论和评分等信息,推荐质量更好但价格更高的产品。
在电商环境中,推荐系统影响财务绩效以及消费者对话的强度。
具体来说,推荐系统可以通过以下三种方式增加电商销售额:
1. 转换(Conversion)
将网页浏览者(Browsers)转变为买家(Buyers),增加网站访问者的购买量。零售商可以通过推荐系统定位最符合用户兴趣和喜好的商品,这可能涉及由推荐中的偶然性导致的意外购买。
2. 增加交叉销售(Cross-sell)
通过向用户推荐其他产品和服务,推荐系统改进了交叉销售。如果用户喜欢推荐的产品或服务,一般的订单数量会增加。例如,网站可能会基于购物车中已有的产品,在结账过程中推荐其他产品。
3. 建立用户忠诚度
建立用户忠诚度是企业战略的一个重要方面。推荐系统可以通过在地理位置和用户之间建立增值关系,从而提高忠诚度。每当用户访问站点时,系统就会更了解该用户的偏好和兴趣,不断优化自身程序,为用户提供个性化服务。通过为每个用户提供个性化体验,在确保用户返回率的情况下作出相应改进。
基于内容的推荐系统
基于内容的推荐系统的工作原理为:通过匹配商品的轮廓及用户喜欢的配置文件,为用户推荐产品或服务。基于内容的推荐器包含三个重要组成部分:匹配器、商品描述、及用户配置文件。
“用户配置文件”由不同类型的信息组成:
- 用户感兴趣的商品类型的描述
- 用户与推荐系统的交互历史
协同过滤系统(Collaborative Filtering Systems)
协同过滤系统仅根据用户与商品之间的关系做出推荐
在协同过滤 CF 中,我们区分了两个重要的类(Class),基于用户的类及基于商品的类,并补充了几个选项:
基于用户的 CF 算法:首先,找到一组购买商品或评价商品相邻的用户,这些用户与该目标用户的购买商品或评价商品重叠。通过用户相似度值找到想法相似的用户。
另一个算法是基于商品的 CF,该技术将用户购买或评价的每个商品与相关商品进行比较,然后将最相似的商品加至推荐列表。
电商中的 NLP
计算机的设计初衷并不是为了了解人类交流的内容。计算机借助代码交流,而代码由一长串1 和 0 组成。但如果你认为人类和计算机无法实现连接,那你就大错特错了,它们不仅可以连接,还可以交流。例如。计算机每天都会对我们的搜索词作出反应,包括 Siri、Alexa 等智能产品的语音命令。今天,在数据科学的帮助下,一切皆有可能。
如今,大多数零售商的经营模式都为网上销售,他们想要提高用户满意度,NLP 不仅在前端帮助用户(在搜索栏中推荐关键字),在后端也发挥着重要作用。
我们不会在线下购买自己不喜欢的东西,这就是人的天性,但网购时并非如此。收到产品后,用户可以选择退货,为该某产品添加评论,并进行打分。虽说我们可以手动检查评分,但假设某公司有上千种产品,该怎么办?在 NLP 的帮助下,公司可以了解用户对某产品进行的操作,这将有助于公司了解或评估卖家。此外,借助用户的搜索历史及评论,我们可以预测用户的实际需求,向用户展示相关广告,或直接推荐产品,节省时间。
NPL还可以用于验证用户地址,例如,如果用户输入了错误或不完整的地址,在 NLP 的帮助下,我们可以提出解决方案,如果用户输入此类地址,页面将显示错误。此外,零售商拥有大量用户数据及地址,借助这些数据,他们可以建议用户在输入或添加新地址时输入完整地址,对用户来说,这反过来也是一种不错的体验。
高效的用户支持(Efficient Customer Support)
电商平台更加注重自动化,同时也在努力提高用户满意度。涉及客服专员(Customer Support Executives)方面,公司投入大量资源,以便在提单出现时为用户提供服务。但是,由于用户群体不断扩大,公司经常注意到,提单数量与专员数量的比例非常高,公司也就无法照顾到每个用户,从而导致用户满意度不佳。
为了解决这个问题,电商平台正在借助机器学习和深度学习算法,构建聊天机器人。
什么是聊天机器人,其工作原理又是如何?
聊天机器人是由人工智能驱动的自动化程序,可帮助模拟对话。这类似于用户在聊天平台通过专员满足其需求。构建聊天机器人中的主要问题是机器在理解数据的同时,需要存储输入的句子语义信息。聊天机器人的作用不仅仅是了解用户需求,同时还需要回复用户,回复的内容符合一定的语法结构。这就是为什么公司使用 Transformers 和 Berts 等高级自然语言处理工具(Natural Language Processing Tools),简化电商平台运作,对于跨国公司来说,类似于多了一组专员。
结论
- 随着越来越多公司使用自己的语言与消费者交流,对 NLP 解决方案的需求正在不断增加。
- 根据之前的行业研究,NLP 市场将以每年 18.4% 的速度扩张,到 2020 年,其市值达到 134 了亿美元。
- NPL呈现爆炸式发展并不奇怪。首先,零售商必须把自己的事情做好,尤其是在这个不缺乏创意的快消费时代。
- 有效的销售需要双向沟通。这一点不会变,即使我们已经进入数字化时代,这都要因为NLP的存在。
文章到此结束,希望你通过本文学到很多!感谢你的阅读!你还可以订阅我们的YouTube频道,观看大量数据科学相关公开课:https://www.youtube.com/channel/UCa8NLpvi70mHVsW4J_x9OeQ;在LinkedIn上关注我们,扩展你的人际网络!https://www.linkedin.com/company/dataapplab/
原文作者:Jatin
翻译作者:Lia
美工编辑:过儿
校对审稿:Jiawei Tong
原文链接:https://medium.com/almabetter/data-science-in-e-commerce-1acaa5699f20