关于客户细分及特征描述的汇总

20
数据挖掘实务 关于客户细分及特征描述的汇总 -关于客户细分及特征描述的汇总- 2011年12月

Transcript of 关于客户细分及特征描述的汇总

数据挖掘实务

关于客户细分及特征描述的汇总-关于客户细分及特征描述的汇总-

2011年12月

文心武行-王建斌个人简介文心武行 王建斌个人简介

王建斌王建斌咨询总监

华院分析技术有限公司新浪微博:weibo.com/wenxinwuxing

2

客户细分的业务假设客户细分的业务假设

“对所有客户使用相同的方法"

完全相同的价值/需求

完全相同的服务/产品

“对每个客户使用不同的方法 (一个人就是一个客户群)”不同的价值/需求

完全个性化的服务/产品

“对一个客户群内的客户使用相似的方法"

同类的客户具有相似的价值/需求

有针对性的产品/服务

3

传统客户细分方法一般利用原始变量直接进行聚类等操作直接进行聚类等操作

通话范围

本地通话d_localt_local

省内长途通话d_toll_inprnt toll inprn 与各运营商联

网内通话比例d_mob_vs_Ttlt_mob_vs_Ttl

联通通话比例d_uni_vs_Ttlt uni vs Ttl通话范围

t_toll_inprn

省间长途通话d_toll_btwprnt_toll_btwprn

国际、港澳台长途通话

d_toll_htm+iddt toll htm+idd

与各运营商联系程度

t_uni_vs_Ttl

小灵通通话比例d_phs_vs_Ttlt_phs_vs_Ttl

固话通话比例d_fix_vs_Ttlt fix vs Ttl通话 t_toll_htm+idd

活动范围

省内漫游通话d_rm_inprnt_rm_inprn

省际漫游通话d_rm_btwprnt rm btwprn

t_fix_vs_Ttl

呼转行为d_fwd_totalt_fwd_total

WAP使用d_wapt wapt_rm_btwprn

国际漫游通话d_rm_iddt_rm_idd

IP使用情况 IP通话d_ipt ip

数据业务使用情况

t_wap点对点及网间短信发送次数

t_sms_total

梦网短信发送次数 t_sms_montt_ip

客 服到营业厅次数 t_service拨打1860次数 t_1860拨打1861次数 t_1861注:其中d_X代表时长,t_X代表次数

4

通过强弱势特征解释结果,结果的解释性与解释者经验相关释性与解释者经验相关

强势特征组号 弱势特征百分比人数分类 强势特征组号 弱势特征百分比人数分类

IP呼叫 转移呼叫

繁忙时段月均呼叫次数、漫游地区呼叫、香港呼叫次数

语音每次呼叫时间、香港(澳门)呼叫、非繁忙时段呼叫

转移呼叫、短信、转移3.36%12,203#2

繁忙时呼叫、IP呼叫、短信、转移3.46%12,585#1

IP呼叫 转移呼叫

繁忙时段月均呼叫次数、漫游地区呼叫、香港呼叫次数

语音每次呼叫时间、香港(澳门)呼叫、非繁忙时段呼叫

转移呼叫、短信、转移3.36%12,203#2

繁忙时呼叫、IP呼叫、短信、转移3.46%12,585#1

非繁忙时段呼叫

IP呼叫、短信

IP呼叫

IP呼叫、转移呼叫0.88%3,187#4

短信、转移6.88%24,998#6

非繁忙时段呼叫1.15%4,174#9

漫游地区呼叫、转移、短信5.43%19,745#12

优质客户群

103,664

28.51%

非繁忙时段呼叫

IP呼叫、短信

IP呼叫

IP呼叫、转移呼叫0.88%3,187#4

短信、转移6.88%24,998#6

非繁忙时段呼叫1.15%4,174#9

漫游地区呼叫、转移、短信5.43%19,745#12

优质客户群

103,664

28.51%

短信

繁忙时段月均呼叫次数、转移呼叫、香港(澳门)呼叫

繁忙时段月均呼叫次数

,

IP呼叫

漫游呼叫、非繁忙呼叫、转移

#8

#16

#14

3 31%12 046

1.56%5,680

转移呼叫 IP

5.8%21,092

短信

繁忙时段月均呼叫次数、转移呼叫、香港(澳门)呼叫

繁忙时段月均呼叫次数

,

IP呼叫

漫游呼叫、非繁忙呼叫、转移

#8

#16

#14

3 31%12 046

1.56%5,680

转移呼叫 IP

5.8%21,092

语音每次呼叫时间

漫游地区呼叫

转移呼叫

短信

繁忙时段月均呼叫次数、短信2.87%10,418#11

短信、繁忙呼叫次数

#3

#15

#8 3.31%12,046

8.85%32,170 繁忙时段次数、短信

8.9%32,352

转移呼叫、IP普通客户群

54,816

15.08%

语音每次呼叫时间

漫游地区呼叫

转移呼叫

短信

繁忙时段月均呼叫次数、短信2.87%10,418#11

短信、繁忙呼叫次数

#3

#15

#8 3.31%12,046

8.85%32,170 繁忙时段次数、短信

8.9%32,352

转移呼叫、IP普通客户群

54,816

15.08%

呼入/呼出比

繁忙时段次数、呼入/呼出比、每次呼叫时间16.41%59,676#10

繁忙时段次数、每次呼叫时间、短信

短信9.57%34,784#7

弱势客户群

205,071

56.41%

18.19%66,134#5

呼入/呼出比

繁忙时段次数、呼入/呼出比、每次呼叫时间16.41%59,676#10

繁忙时段次数、每次呼叫时间、短信

短信9.57%34,784#7

弱势客户群

205,071

56.41%

18.19%66,134#5

5

繁忙时段月均呼叫次数3.39%12,307#13 繁忙时段月均呼叫次数3.39%12,307#13

常见的强弱势特征提取评分表常见的强弱势特征提取评分表

6

传统的客户细分方法由于直接利用原始变量分析 易造成特征交混问题始变量分析,易造成特征交混问题

传统长途趋势传统长途趋势

5

10

SS1

SS2

SS3 趋势平均费用使用比例统计指标 趋势平均费用使用比例统计指标

10

-5

00 50 100 150 200 SS4

SS5

SS6 2.54 -7.96 70.41 44.51 55.54%84.49%传统长途

6.65 -18.05 138.11 102.43 73.28%100%长话

5.38 -14.79 220.59 171.98 89.65%100%市话

13.13 -33.29 371.75 279.75 91.22%100%总费用

总体SS3总体SS3总体SS3

2.54 -7.96 70.41 44.51 55.54%84.49%传统长途

6.65 -18.05 138.11 102.43 73.28%100%长话

5.38 -14.79 220.59 171.98 89.65%100%市话

13.13 -33.29 371.75 279.75 91.22%100%总费用

总体SS3总体SS3总体SS3

-10

IP趋势20

SS1

6.56 -3.15 62.50 41.44 27.29%28.61%200

5.17 -6.28 57.80 32.20 7.07%6.27%国际

5.94 -15.36 111.35 89.66 72.77%99.95%国内

-0.12 -0.47 7.33 4.23 38.83%52.18%其他IP市话

3.07 -10.95 81.09 57.84 59.26%96.55%IP6.56 -3.15 62.50 41.44 27.29%28.61%200

5.17 -6.28 57.80 32.20 7.07%6.27%国际

5.94 -15.36 111.35 89.66 72.77%99.95%国内

-0.12 -0.47 7.33 4.23 38.83%52.18%其他IP市话

3.07 -10.95 81.09 57.84 59.26%96.55%IP

0

10

0 50 100 150 200

SS1

SS2

SS3

SS4 25.24 149.07 0.00%0.00%其它数据

9.09 -31.98 317.63 265.15 89.66%100%语音

37.36 -26.21 524.05 292.65 8.36%2.32%数据

29.48 -26.49 340.57 279.01 7.24%2.07%ADSL

3.43 -6.40 68.61 40.04 15.97%18.08%港澳台

25.24 149.07 0.00%0.00%其它数据

9.09 -31.98 317.63 265.15 89.66%100%语音

37.36 -26.21 524.05 292.65 8.36%2.32%数据

29.48 -26.49 340.57 279.01 7.24%2.07%ADSL

3.43 -6.40 68.61 40.04 15.97%18.08%港澳台

-20

-10 SS5

SS6

其 数据

-2.18 -3.62 27.86 22.82 20.13%16.70%总窄带

其 数据

-2.18 -3.62 27.86 22.82 20.13%16.70%总窄带

7

改进的框架式客户细分方法会首先对原始变量进行特征泛化原始变量进行特征泛化

价值分段价值分段

基础上的

分群整合

分群宽表 使用数据挖掘工具中的数据探索功能

分群整合

生命期分段

基础上的分群宽表

数据准备

使用数据挖掘工具中的数据探索功能

将原始变量转化为 特特 征征根据数据整体分布进行基础整合分群

基础上的

分群整合

多种分段

… …

基础上的

分群整合

8

在多维度的特征基础上建立多维的客户基础分群模型体系户基础分群模型体系

价值价值 实际收益贡献

价值成色

客户生命期客户生命期 在网时长

年龄

套餐套餐//承诺承诺 套餐使用度

套餐变动度

价值潜力

高端评定

入网年龄 承诺期限

风险风险 综合流失风险

欠费流失风险

发展趋势发展趋势 发展趋势 行为特征行为特征 忙/闲

增值业务

竞争

抱怨通话量欠费流失风险

非欠费流失风险

部分流失风险

增值业务

通话长短

呼转类型

抱怨

异动

睡眠

通话量

通话类型

费用敏感性部分流失风险 呼转类型

活动范围

睡眠费用敏感性

呼入/呼出

9

宏观分群宏观分群 微观分群微观分群中观分群中观分群

如根据行为特征得到的分群示例如根据行为特征得到的分群示例

通话密集型 话霸一族 呼出积极型 精打细算型

非通话密集 非话霸一族 非呼出积极 非精打细算

行为类型 费用敏感性 费用敏感性呼入/呼出 呼出积极型通话量 通话密集型 呼叫时长 话霸一族

非通话密集型

非话霸 族 非呼出积极型

非精打细算型

通话稀少型 长话短说型 接听积极型 拇指一族

非通话稀少型

非长话短说型

非接听积极型

非拇指一族

有朋远方型 座机型手机 工作活跃型 彩信新贵

增值业务 拇指一族

彩信新贵

接听积极型

忙/闲 工作活跃型

通话稀少型 长话短说型

有朋远方型 呼转类型 座机型手机

非有朋远方型

非座机型手机

非工作活跃型

非彩信新贵

商旅人士型 经常呼转 休闲活跃型 增值贵宾

非商旅人士型

非经常呼转 非休闲活跃型

非增值贵宾

增值贵宾休闲活跃型经常呼转商旅人士型

竞争对手关照者

东奔西走型 通话突增型

非竞争对手关照者

非东奔西走型

通话突降型

外联密切者 稳坐帐中型 非通话突变型

活动范围 东奔西走型

稳坐帐中型

竞争 竞争对手关照者

外联密切者

异动 通话突变型

型非外联密切者

非稳坐帐中型

主动他投型

非主动他投型

主动他投型

10

在基础分群基础上,根据战略需求或营销需求 可进行灵活的组合交叉营销需求,可进行灵活的组合交叉

高价值老用户整合分群结果

#1:有朋远方、单位时间贡献收益高#4

#1

#3#2:有朋远方、有效话务量占比高、全面发展、拇指一族、夜猫子

#3:有朋远方、通话密集型、本地通

#3#2

3:有朋远方、通话密集型、本地通话为主、外联密切

#4:有朋远方、通话密集型、商旅人士、东奔西走、话霸一族、外联密切士、东奔西走、话霸 族、外联密切

对高价值老客户设计有针对性的群体策略,提高客户的忠诚度,控制客户的流失率对高价值老客户设计有针对性的群体策略,提高客户的忠诚度,控制客户的流失率

由于整体上具有“有朋远方”的特征,考虑增加针对长途的优惠政策,特别是限额包月资费政策。#1子群体:具有“单位时间贡献收益高”的特征,考虑提高积分或者话费奖励的比例;#2#2子群体:具有“有效话务量占比高、 全面发展、拇指一族、夜猫子”的特征,可以考虑设计针对夜间通话、增值业务的优惠;#3子群体:具有“通话密集型、本地通话为主、外联密切”的特性,考虑增加针本地通话的优惠政策,同时做为流失控制的重点进行挽留。#4子群体 具有“通话密集型 商旅人士 东奔西走 话霸 族 外联密切”的特性 考虑增加针对漫游的优惠政策 同时做为流失控制的重点进行挽

11

#4子群体:具有“通话密集型、商旅人士、东奔西走、话霸一族、外联密切”的特性,考虑增加针对漫游的优惠政策,同时做为流失控制的重点进行挽留。

改进的框架式客户细分方法的结果解释的标准相对更加客观统一释的标准相对更加客观统

12

具体实战中一般用三维交叉比较多,如埃森哲的N-V-B框架如埃森哲的N V B框架

13

其基于内部数据的V-B交叉提出关键群其基于内部数据的V B交叉提出关键群

14

通过提取V-B特征,结合外部N调研获取的人口/心理等显性指标进行描述的人口/心理等显性指标进行描述

15

又如Teradata针对通信中高端用户也采用类似的三维细分方法采用类似的三维细分方法

从ARPU 语音业务 数据业务三个维度进行单独细分 然后再将三个从ARPU、语音业务、数据业务三个维度进行单独细分,然后再将三个维度的细分群叠加组合,生成最终细分群

语音业 第一步语音业务行为

(Vi)•从ARPU、语音行为、数据业务行为这三个维度进行单独细分

第 步

•三个维度细分群的叠加组合分析第二步

数据业务行为

•对细分群的分布与消费特征进行分析•基于业务含义,形成最终细分群

务行为(Di)

ARPU分•基于消费特征,建立重点细分群的保有策略建议

第三步

16

ARPU分档(Ai)

策略建议

基于三维分群的用户分布,生成最终细分群

V1 V2 V3 V4 V5 V6 V7D1 1 1% 0 0% 0 1% 0 0% 0 1% 0 1% 0 0%

细分群

A1

D1 1.1% 0.0% 0.1% 0.0% 0.1% 0.1% 0.0%D2 0.1% 0.0% 0.2% 0.0% 0.2% 0.1% 0.0%D3 0.2% 0.0% 0.2% 0.0% 0.2% 0.1% 0.0%D4 0.7% 0.0% 0.3% 0.0% 0.2% 0.1% 0.0%D5 0.2% 0.0% 0.1% 0.0% 0.0% 0.0% 0.0%G 1

A2

D1 1.6% 0.1% 0.3% 0.2% 0.2% 0.2% 0.1%D2 0.3% 0.3% 1.4% 1.3% 0.7% 0.8% 0.4%D3 0.8% 1.0% 3.0% 3.2% 1.6% 1.4% 0.9%D4 1.0% 0.5% 2.2% 1.9% 1.1% 1.1% 0.6%D5 0 4% 0 1% 0 6% 0 7% 0 3% 0 3% 0 2%

G-4

G-1

G 2D5 0.4% 0.1% 0.6% 0.7% 0.3% 0.3% 0.2%

A3

D1 0.1% 0.0% 0.1% 0.4% 0.1% 0.1% 0.1%D2 0.0% 0.2% 0.6% 2.7% 1.1% 1.6% 1.0%D3 0.4% 1.3% 2.7% 9.7% 3.8% 4.8% 3.3%D4 0.1% 0.4% 1.1% 4.4% 1.8% 2.7% 1.8%G-5

G-3G-2

D5 0.0% 0.2% 0.5% 2.0% 0.8% 1.2% 0.9%

A4

D1 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%D2 0.0% 0.0% 0.0% 0.3% 0.1% 0.3% 0.3%D3 0.0% 0.1% 0.2% 1.3% 0.8% 1.5% 1.2%D4

G-7

D4 0.0% 0.0% 0.1% 0.6% 0.3% 0.7% 0.6%D5 0.0% 0.0% 0.1% 0.3% 0.2% 0.5% 0.3%

A5

D1 0.0% 0.0% 0.0% 0.0% 0.0% 0.0% 0.0%D2 0.0% 0.0% 0.0% 0.0% 0.0% 0.1% 0.1%D3 0.0% 0.0% 0.0% 0.2% 0.1% 0.5% 0.4%

G-6

17

A5 0.0% 0.0% 0.0% 0.2% 0.1% 0.5% 0.4%D4 0.0% 0.0% 0.0% 0.1% 0.0% 0.2% 0.2%D5 0.0% 0.0% 0.0% 0.0% 0.1% 0.1% 0.2%

细分群描述主要使用三维度呈现的个性和共性特征进行描述性和共性特征进行描述

细分用户群 用户占比 核心特征

G1-流失高风险用户 6.5%

平均ARPU为59,只有本地通话,没有长途或漫游,通话量小,被叫占比较高,交往圈小于50,很少使用数据业务或仅使用点对点短信,部分用户已经持续无通话行为

平均ARPU为132 只有本地通话 无长途漫游 通话交往圈较大 通话量G2-本地电话煲用户 4.0%

▪平均ARPU为132,只有本地通话,无长途漫游,通话交往圈较大,通话量较大,通话集中于少数对象,对数据业务有一定的体验,对短彩类业务使用有一定使用习惯

▪平均ARPU为120元,只有本地与长途通话,长途通话占比较高,通话交往G3-外来人口用户 12.6%

平均 为 元,只有本地与长途通话,长途通话占比较高,通话交往圈较小,主叫占比较高,有手机上网的使用需求,群中外来务工人员与学生占比较高

G4-低端商务用户 13 1%▪平均ARPU为94元,主要是商务用户,通话交往圈较大,有一定的长途与漫

G4-低端商务用户 13.1% 游,主叫占比较高,有一定数据业务使用体验,对手机上网需求较为强烈

G5-中端商务用户 36.8%▪平均ARPU为187元,主要是商务用户,有一定的长途通话,省内漫游较多,通话交往圈较大,对数据业务的使用以基础型的成熟业务为主

G6-高端商务用户 8.3%▪平均ARPU为367元,主要是商务用户,本地通话占比较低,漫游通话占比极高,通话交往圈较大,对数据业务的使用以基础型的成熟业务为主

▪平均ARPU为216元 通话交往圈较大 业务量较高 有国际长途或国际漫

18

G7-国际通信用户 12.5%▪平均ARPU为216元,通话交往圈较大,业务量较高,有国际长途或国际漫游的需求,对数据业务的使用以基础型的成熟业务为主

注:G1-G7覆盖了94%的拍照用户,剩余6%用户无显著特征

也可以结合流失率分布,发现流失率较高的关键细分群较高的关键细分群

V1 V2 V3 V4 V5 V6 V7

流失率分布图V1 V2 V3 V4 V5 V6 V7

A1

D1 85% 67% 25% 85% 74% 100%D2 68% 50% 67% 60% 69% 65% 50%D3 63% 33% 61% 50% 61% 68% 53%D4 71% 0% 64% 33% 67% 67% 60%D5 57% 0% 77% 75% 57%

A1

V6

流失率较高的细分群组

•A1群:ARPU<50D5 57% 0% 77% 75% 57%

A2

D1 40% 38% 40% 16% 30% 42% 36%D2 36% 19% 33% 11% 33% 35% 26%D3 48% 23% 38% 14% 32% 33% 21%D4 51% 20% 32% 10% 29% 34% 20%

V6

&

A2

A1群:ARPU<50•V1群:本地低端群•V3群:外来用户群•V6&A2:省际漫游低端群

D5 54% 29% 37% 12% 28% 33% 27%

A3

D1 43% 12% 26% 10% 40% 40% 20%D2 41% 16% 33% 10% 21% 23% 16%D3 47% 19% 35% 12% 20% 20% 13%D4 48% 14% 33% 11% 22% 20% 11%

V1 V3

A2

流失率较低的细分群组D4 48% 14% 33% 11% 22% 20% 11%D5 51% 16% 36% 10% 15% 15% 11%

A4

D1 0% 25% 0% 44% 7% 44%D2 100% 11% 25% 15% 19% 13% 18%D3 59% 19% 34% 13% 15% 13% 9%

•V2群:本地电话煲群•V4群:本地商务群•V7群:国际通信群A4

D4 44% 33% 32% 13% 15% 17% 11%D5 71% 50% 40% 13% 11% 11% 10%D1 0% 100%D2 36% 15% 19% 15% 22%D3 100% 33% 33% 14% 10% 10% 6%

•V7群:国际通信群

注:流失率 =细分群流失人数

19

A5 D3 100% 33% 33% 14% 10% 10% 6%D4 100% 0% 43% 24% 29% 12% 11%D5 33% 19% 8% 8% 8%

注:流失率 =细分群年初初始人数

Thanks!Thanks!