面试题:如何通过 # + emoji 对用户画像?

面试题:如何通过 # + emoji 对用户画像?

扫视各大社交平台,网红最大的特征,除了脸够雷同还有什么?那就是发个po下面一堆hashtag标签#。为啥呢?通过增加被用户搜索到的可能来增加关注度。今儿,我们就来说说话题标签hashtag#和颜文字emoji。

话题标签#是集合整理一类信息的利器:用户给自己的内容打上标签,标签将同类内容进行归类整理。通过搜索标签,用户可以看到还有谁发表了和自己类似的言论和内容。随着网络信息的日益丰富,网络用语和缩写也越来越普遍,网络语言也在变化和发展。人们不仅可以用语言表达自己的想法,更可以通过颜文字和表情包来表达所思所想。

2000年,笑脸符号开始出现在数字键盘中,此后,表情符号越来越多,也越来越能更好地满足人们的沟通需求。2009年,苹果公司正式向万国码递交了将颜文字融入文本字符集的申请。当然,申请通过,颜文字的普遍使用已经成为一种不可忽略的潮流。自此,2823个颜文字被纳入万国码,这2000多个颜文字包含了表情、食物、饮品、动物、活动等。

颜文字是世界上发展最快速的语言之一。颜文字带来的文化gap和争议是促使其高速发展的原因之一。随着每次推陈出新,颜文字逐渐融入更多的文化、代表更广的人群。颜文字用非文字的形式将幽默感代入了日常网络沟通,提高了网络生活的互动感。聊天文字中使用颜文字和表情,就像肢体动作一样,帮助对方更好地理解自己的意思和感情色彩。

话题标签和颜文字都是网络大火的流行元素。2015年开始,Instagram开始允许用户为颜文字设置标签。一个月内,小红心被tag了50多万次,截止2018年11月26日,小红心被tag了25亿次。

话题标签帮助用户轻易到找到他们感兴趣的/热点内容。当用户创立了标签,系统会识别这个标签,并将同类内容进行匹配。在Twitter上,话题标签帮助用户参与热点话题和运动,其中,#Metoo和#Blacklivesmatter就是两个借助社交网络引起广泛关注的社会运动。通过话题标签 tag 颜文字,用户可以在表达想法的同时更好地表达感情。

那为啥颜文字标签,emoji hashtags,那么好用呢?首先,标签帮助用户更好地了解一个 post 中包含了何种内容。其次,emojis 有趣生动形象,没有什么比画面更能生动地表达感情。再者,用户生成内容时常包含拼写错误和歧义,而颜文字表情可以避免这些问题。一个特定表情的 hashtag 可以清晰准确地归类一类内容,再也不用担心手抖拼错的问题啦。

但是,颜文字标签也不是那么完美的,它给系统识别增加了一定难度。颜文字的表意是多种多样的。万国码中,仅是名叫“笑脸”的颜文字就有八种。不同年龄、性别和文化背景的人给每个颜文字表情赋予不同的含义。颜文字的设计也会影响人们对其感情含义的理解。并且,不容内容和语境也会影响人们对颜文字表情的使用。研究者发现,不同地区的人在对 emoji 的选择和使用上有很大的不同,对相同 emoji 的理解也有很大的不同。比方说,同样是“笑哭了”这个 emoji,人们认为它既有积极的意义也有消极的意义。有些 emoji 更多地出现在句中,有些更多地出现在句末。

即使万国码提供了国际标准,emoji 的设计也是各家有各家的特色。比方说,”捂嘴笑“这个表情,苹果和脸书就有不同的设计。苹果的设计更多地表达了怀疑,脸书的设计更多地表达了满意或者挑逗。因为这些差异,有时候,内容会被错误的分类。即使是同一个用户,在不同的 app 和设备上,同一个 emoji 也可能有不同的解释。

但是,尽管不同的人对 emoji 的解释是不同的,emoji,相比于文字,能更准确地传递信息、分类内容。更重要的是,它们可以表达用户的感情。

在利用 emoji hashtag 进行内容分类的时候,信息架构要符合平台的特征,要使用户能够更轻松地接触、搜索到信息。如果用户对颜文字的表意有相同的理解,颜文字标签能帮助平台更好地维护用户群体,分类系统也更容易创建。但是,如果用户差异很多,设计一个普适性的信息架构就要难得多。

考虑到颜文字标签的优缺点,平台在分析用户生成内容和其产生的信息和标签时,需要更加谨慎,并且尽可能地寻求最佳方案。