编辑推荐: |
本文本文重点介绍了用户画像的目的与意义、构建步骤,用户画像的整体技术流程以及用户画像数据应用实践,了解更多请阅读下文。
本文来自于CSDN,由火龙果软件Alice编辑、推荐。 |
|
(一)用户画像的目的与意义、构建步骤
用户画像(persona)的概念最早由交互设计之父Alan Cooper 提出:是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。随着互联网的发展,现在我们说的用户画像是根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型。通过各个维度对用户或者产品特征属性的刻画,并对这些特征分析统计挖掘潜在价值信息!完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。构建用户画像的核心工作,主要是利用存储在服务器上的海量日志和数据库里的大量数据进行分析和挖掘,给用户贴“标签”,而“标签”是能表示用户某一维度特征的标识。
为了能解决业务问题,用数据来帮助企业了解用户和定位产品,更好地解决业务问题,首先必须明确业务目标。用户画像是帮助企业明确目标客群,当企业了解了自己的用户都长什么样子以后,接下来的任务就是如何将有类似画像特征人群的潜在用户变成自己的用户,也就是在营销上获新客的过程。
所以,从大的框架来看,用户画像承载了两个业务目标:
一是如何准确的了解现有用户;
二是如何在茫茫人海中通过广告营销获取类似画像特征的新用户。
那么用户画像具体有什么作用,能帮助我们达到哪些目标呢?大体上可以总结为以下几个方面:
1. 精准营销:精准直邮、短信、App消息推送、个性化广告等。
2. 用户研究:指导产品优化,甚至做到产品功能的私人定制等。
3. 个性服务:个性化推荐、个性化搜索等。
4. 业务决策:排名统计、地域分析、行业趋势等。
(二)用户画像的整体技术流程
技术流程分为数据仓库,标签构建,系统技术框架三个过程。
2.1 数据源的集成
来自业务数据库的数据和用户行为日志数据,数据仓库需要基本涵盖了机票、酒店、火车票以及保险等业务系统的数据,来从全方位数据构建一个用户的画像,在此基础上,建立相应的数据存储框架。用户画像数据来源:往返地数据信息,票务信息数据,保险信息,酒店数据信息,退改签信息等
在此从数据仓库和用户业务角度进行划分。从用户画像的角度观察数据,可分为多个维度进行,如航班行程、乘机人属性、用户行为、用户RFM等。
画像数据仓库的构建基于基础数据仓库进行构建,并按照维度进行划分。
用户唯一标识是整个用户画像的核心,它把从用户开始使用app或网站到下单到售后整个所有的用户行为轨迹进行关联,可以更好的去跟踪和描绘一个用户的特征。
2.2特征提取
用户特征的提取即用户画像的生产过程,大致可以分为以下几步:
1)用户建模,指确定提取的用户特征维度,和需要使用到的数据源。
分析的维度:可以按照人口属性和产品行为属性进行综合分析;
人口属性:地域、年龄、性别、文化、职业、收入、生活习惯、消费习惯等;产品行为:产品类别、活跃频率、产品喜好、产品驱动、使用习惯、产品消费等;
2)数据收集,从不同数据源抽取要计算标签的数据原材料。通过数据收集工具,如Flume 或自己写的脚本程序,把需要使用的数据统一存放到Hadoop
集群。
3)数据清理
(a)数据标准化:针对抽取的数据将其清洗为标准格式,将其中的错误数据和无效数据剔除。此过程通常位于Hadoop
集群,也有可能与数据收集同时进行,这一步的主要工作,是把收集到各种来源、杂乱无章的数据进行字段提取,得到关注的目标特征。
(b)数据打通:不同来源的数据有不同的主键和属性,如何将这些数据关联起来是数据打通的关键,比如有设备的wifi信息,又有设备的poi信息,就可以通过wifi将设备终端和POI建立起关联。
4)标签构建-构建策略
用户标签特征属性
用户的特征属性可以是事实的,也可以是抽象的;可以是自然属性,比如性别,年龄,星座等,可以是社会属性,比如职业,社交,出生地等;还可以是财富状况,比如是否高收入人群,是否有豪车豪宅等固定资产,对于机票用户来讲位置特征也是比较重要的属性,比常驻地,常出差地,老家等。这些属性都可以清楚的描绘一个用户的画像特征。
1、画像标签一般根据公司的业务体系来设计,存储有HDFS,Hbase,ES。
2、标签的更新频率:每日更新,每周、每月更新。
3、标签的生命周期:有的数据随时间衰减迭代。
用户标签分类及特征项
提到用户画像就不得不提到一个词“标签”。标签是表达人的基本属性、行为倾向、兴趣偏好等某一个维度的数据标识,它是一种相关性很强的关键字,可以简洁的描述和分类人群。标签的定义来源于业务目标,基于不同的行业,不同的应用场景,同样的标签名称可能代表了不同的含义,也决定了不同的模型设计和数据处理方式。我们给机票用户画像打标签分类为两大类,基础类标签和个性化标签,这些标签可以有重复,但是都是通过不同的角度去定义和刻画一个用户,来满足不同的业务营销需求。
(a)模型训练,有些特征可能无法直接从数据清理得到,比如用户感兴趣的内容或用户的消费水平,那么可以通过收集到的已知特征进行学习和预测。
(b)属性预测,利用训练得到的模型和用户的已知特征,预测用户的未知特征。
5)数据分发,对于合并后的结果数据,分发到精准营销、个性化推荐、CRM 等各个平台,提供数据支持。
2.3用户标签库构建
(a)用户画像的标签体系
基础标签:用户ID、用户姓名(加密)、手机号码(加密),证件类型、证件号码(加密)、注册时间、手机运营商名称
地域标签:缴费省名称、所属城市名称、缴费户表数量
交易行为标签:用户累计订单数、累计订单金额、累计小红包抵扣金额、首次交易时间、末次交易时间、
个人偏好标签:缴费渠道偏好标签
风控标签:手机验证状态、邮箱验证状态、登录失败次数累计、最后一侧登录失败时间、密码锁定状态、实名认证状态
(b)用户画像的核心工作是为用户打标签,需要制定严密的公式和模型,根据场景的需要,制定规则和参数,对采集的信息做计算
(三)用户画像的整体技术架构
(四)用户主题分析及数据挖掘:
有了丰富的画像数据后,产品和运营人员可以根据用户主题进行数据分析和数据挖掘相关的工作。用户主题Cube的定义如下:
1、Measure:–订单数量–订单金额–搜索次数–Booking次数
2、Dimension:–下单时间–出发时间–航司信息–舱位信息–航班(出发地、目的地)–基本信息(年龄、性别等自然属性)。
(五)用户画像数据应用实践
5.1 用户群体特征分析
设计目标:
–根据条件可选项,输出筛选用户群体
–图形展示用户群体属性特征
应用场景:
–如果筛选的用户群组满足业务的要求,将筛选条件形成参数
–根据参数提供接口查询
5.2 客户行为预测
客户行为预测建立步骤
1、建模数据准备
2、客户流失节点判断
3、模型应用变量确定
4、模型构建
5、模型应用
6、模型验证
可以对用户流失做及时预测指导建议用户维系运营。
5.3 数据和业务在一起
用户画像与业务产品互相依赖,相辅相成
1、用户画像标签库丰富优化
2、快速提供数据服务
3、数据分析+机器学习+模型训练
|