用户画像的定义及构建方法

挖数网精选
挖数网精选
挖数网精选
446
文章
0
评论
2020-04-1802:05:00 评论 1,505 1886字
摘要

伴随着大数据技术的发展和更新,用户信息的手机渠道发生了很大的变化。相比传统的线下会员管理、问卷调查、购物车分析,大数据技术第一次使得企业能够通过互联网便利地获取用户更为广泛的行为信息。

一.什么是用户画像

为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像。

很多人都想知道,到底什么是用户画像?关于用户画像的定义,不得不提的就是 Alan Cooper 提出的 persona 概念:

建立在一系列真实数据之上的目标用户模型。通过用户调研去了解用户,根据他们的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型。

用户画像的定义及构建方法

二.如何构建用户画像

用户画像最核心的组成部分其实是其中所包含的用户标签,用户标签其实可以理解成用户特征的一系列符号表示,每个标签可以理解成认识用户的一个角度。用户画像其实是标签的集合,每个标签之间都有一定的联系,整体上看各个维度的标签组合到一起形成了一个完整的用户画像。所以说用户画像其实可以用标签的集合来表示。

一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:18~35岁,地域标签:上海,标签呈现出两个重要特征:第一,语义化,人能很方便地理解每个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求;第二,短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。

人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。

1.数据源的准备与分析

对于现在的互联网产品来说,需要做的事情是将手中拥有的数据进行结构化和清洗,去除噪音和不规整的数据,为后续的建模做好准备。

那如果是产品未成型或者用户量特别少怎么办呢?这个没有特别好的办法,数据数量少的话,只能不断增加数据量。获取数据有两种方法,第一种为免费方法,有一些公开的数据,企业可以从统计局网站或者公开的网站进行搜集和下载;第二种为付费方法,企业可以付费获取行业用户数据,这样得来的数据一般比较准确。除此之外,企业也可以进行一些实际的用户调研(可以外包),获取用户调研的数据。

数据源可以划分为静态数据和动态数据。

静态数据是用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息自成标签,如果企业有真实信息则无需过多建模预测,更多需要的是数据清洗工作。

动态信息是指用户不断变化的行为信息。当消费者行为反馈在互联网上,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞"双十一大促给力"的微博消息。等等均可看作互联网用户行为。在互联网上,用户行为可以看作用户动态信息的唯一数据来源。

用户画像的定义及构建方法

2. 用户分类

通过对用户静态数据的分析,对用户可以进行基本的分类,比如根据性别,将用户分为男性、女性用户,根据常住城市,可以将用户分为一线城市、二三线城市等,另外,还可根据年龄段、用户来源、收入水平和职业来对用户进行划分。

静态数据获取后,需要对人群进行因子和聚类分析,不同的目的分类依据不同:如对于产品设计来说,按照使用动机或使用行为划分是最为常见的方式,而对于营销类媒体来说,依据消费形态来区分人群是最为直接的分类方式。

3. 用户标签的定义与权重

有了静态和动态的数据之后,我们就要为每个用户打上标签,以及该标签的权重。

权重如何来定义呢?有时候,权重的定义是由经验丰富的营销人员来定的,他们对用户或者行业大致情况比较了解,因此通过经验来进行定义仍然具有较高的可信度。

当然这个权重可能会随着时间的推移而改变,用户处在不同的生命周期中,他们的不同行为以及时长的变化都会对这个权重产生影响。在模型中,权重需要在后期不断优化。

根据特征值对群体进行定义,有助于一目了然掌握该群体的特性。特征值是指用一个特征很鲜明的词来描述一群人,如"时尚潮人","运动达人",可以让人很快速清晰的知道这类人的特点是什么。

用户画像的定义及构建方法

4.数据建模

数据建模要解决的事情是,如何根据用户行为,来自动为用户添加标签、设置权重,如何通过用户行为对不同用户进行相似性衡量,如何通过相似性度量进行针对性的推荐,这些可能是用户数据量达到一定规模之后需要考虑的事情。

目前比较常用的协同过滤的推荐思想,就是在对用户的行为数据进行定量化分析和相似性度量之后,自出的自动化决策。

当然并不是只有推荐系统,精准化的分析和决策、个性化的管理、甚至自动化的运营都是建立在这个基础之上。

End.

作者:易观方舟

来源:简书

本文均已和作者授权,如转载请与作者联系。

  • 我的微信公众号
  • 微信扫一扫
  • weinxin
  • 我的微信公众号
  • 微信扫一扫
  • weinxin
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: