全国服务热线:
18106547650

数据分析师眼中的天猫产品推荐思路

分享到:
点击次数:147 更新时间:2020年09月26日18:01:53 打印此页 关闭

今天主要讲一些关于推荐系统的一个发展的历史。推荐系统的思路跟我们一般的想法是很像,我要推荐顾客一个什么商品,一定是跟他过去购买的行为有关系的。

推荐系统分为四个阶段:单品推荐、协同过滤、千人千面、人工智能

单品推荐

   什么叫单品推荐?单品推荐的发展是根据咱们经营营销理论的发展有关的。这个理论是什么?早期是营销的理论是以卖货为主,我怎么把货卖出去。那么在卖货为主的这样的一个营销的阶段,我们商家肯定是说我有一个茶杯或者是咖啡杯,我希望找一些什么样的人,把这个咖啡杯推荐给他。这个跟你们认识我,向我推荐东西,这个方式是不一样的。

单品推荐的时候是我因为有了一个商品要把它卖出去,要把它卖火,我要找适合买我这个商品的人来进行推荐。那么基于这个条件下,它首先是要有一个标地性的一个行为,比如说你要购买这个咖啡杯,这是一个行为。那么谁更适合来购买这个咖啡杯?那么根据我们推荐的思路,一定是说我能不能根据历史上喜欢买这款咖啡杯的人,他的共同的一个特征是什么?然后我过个桥,我找到这些具备这个特征的人,然后我想要推荐,这就是我们在单品推荐里面的一个思路。 

单品推荐已经发展了有不下20年,在这个过程当中最出名的就是逻辑回归。逻辑回归主要是通过特征变量的设定一个权重来计算,计算他购买这个商品,这个概率就是0到1,1就是你绝对会购买,0就是你绝对不会购买。

微信截图_20200926180629.png

优点是他的目的性非常强,而且目的可以多变,非常多变,我可以推荐产品,我可以推荐服务,我也可以来针对顾客的某种行为,把它标记上之后来看。有没有可能,某些特征会预测到或者是能够揭示顾客有某种特殊行为的,这个特殊行为不一定跟货品有关系了,他都是可以来进行逻辑回归的一个计算,就是你有多大可能性要干嘛了。所以它的目的性非常强,也非常多变。 

  第二个优点它比较精准,为什么是精准?因为你在做单品的时候,你的目的性很强之后,你的特征变量选取,包括在最后的计算,它是相对来说是比较精准的,比较精准。

  缺点是他从单一产品出发,或者从一个促销目的出发的,实际上他是无法针对顾客真实的需求进行推荐的。因此它作为现在讲顾客个性化推荐,它是属于一种比较假的个性化推荐,因为他的出发点是为了卖东西,而不是说我来看看顾客到底需要什么,我想推荐什么,所以它的出发点不一样。同时它建模的成本比较高,单品推荐的建模成本比较高,那么无法大规模的应用到多个商品的推荐。


我们直接应用的时候,会把这些顾客根据购买商品的概率进行从极大值到极小值的这么一个排序。那么我们选定其中一部分,我们认为可以接触的顾客,然后向他们推荐这个商品。


协同过滤

发展到21世纪的时候,物质已经很丰富,从传统的推销这个概念已经更多的关注到去增加顾客价值,就是如何服务顾客,通过服务顾客跟顾客建立一个良好关系,我才能够占取利润。因此他对顾客的需求可能更关注一些,所以你物品很丰富了,你不像以前你这个自行车品牌就那么两三个,能买到就不错了,现在到处都是各种各样需求,你顾客的个性化需求又比较高,因为现在年轻人他对商品的话有自己的要求,也不是你一个大规模生产同类型的商品我就会买的。

因此在这个商家来讲,他就更希望说我来了解了解顾客到底喜欢什么,我想推荐什么。我如果推荐错了,我可能就会永远失去顾客。所以他的思路跟单品推荐的时代已经不太一样了。那么你要一个顾客上到天猫上亿的产品当中,找到一款合适他的进行推荐,你没有一个大规模的算法是不行的,传统的单品推荐的算法肯定是不行的,他们这个情况下,亚马逊就最早提出来搞了一个叫协同过滤的算法。

协同过滤它本身发展到现在也是有很多分支,那么协同过滤由于它的一个特点是大规模的特点,只适合比较大的商家,一般的小的商家他不太会用这个东西,他的理论的概念就是说用户一如果买了老板电器,又买了四季沐歌的热水器,同时还去游轮,然后他又看用户二,买了老板电器,又会买四季沐歌。那么通过这样一群的顾客,我们发现老板电器跟四季沐歌是有关联性的,或者是相似或者是关联的,很有可能被同一个供顾客同时购买。

协调.png

我们开个玩笑的话,就是说亚洲人会比较倾向跟亚洲人结婚,虽然你也会跟白人结婚跟黑人结婚,但是你的总的倾向还是喜欢黄种人,你在向他推荐另一半的时候,你绝对会推荐亚洲人,因为大部分人都是亚洲人和亚洲人,所以向你推荐亚洲人。

  因为这个整个品牌的配比度不是对消费层次决定,这就是因此它协同过滤的主要的概念就是这个概念,就哪两种品牌或者单品,他会常常会在被同一个人购买的,被联合购买的,那就有可能说当用户买到其中某一个商品的时候,它很有可能买另外一个有关联的产品。 

协同过滤的算法,其实具体来讲其实也不复杂,首先你要把两个商品共同购买的比例,或者是概率先计算出来,通过你的大规模的数据库里面计算出来,计算出来之后,你每一个人买过什么的?他做一个矩阵的相乘,也就是行×竖,就Jeff用这一行的数据乘以这个蜘蛛侠,那么Jeff对蜘蛛侠的积分就可以计算出来了。Jeff因为看过几蜘蛛侠,已经买过这个东西了,所以它就是1,但是如果是他去看怪物史莱克,Jeff没有看过怪物史莱克当1X1X0.67+0.41,那么结果就等于零1.08,在这边做了一个很好的解释,也就是通过这样一个方式,把Jeff跟所有的商品之间的分值就计算出来,分值越高,越有可能Jeff越有可能买这个商品,它是这个概念

wew.png

  只有一次推荐机会的话,会理论上就会向你推荐排名最高的商品,分值更高的商品,分值更高的商品。但是比如说Jeff是新顾客,他什么都没有,都变成零了,这叫冷启动。

协同过滤是属于大规模企业使用的一种算法。那么国内很多企业其实还没有到这个程度,除了天猫、京东这种比较大规模的,一般还能用得起hadoop,因为你可以看到如果是一亿个顾客跟一亿个商品的话,它的矩阵是很大的,一般计算机是无法进行这样的矩阵乘的成绩的一个算法的,一般都是一些大厂。

  华为不会,他不做C端,它不做C端它就没有那么多顾客。腾讯他们会,如果他要卖货的话,如果他货品很多,他就会去做,所以只有几个特点的公司才会去做协同过滤。一个是市值特别大,第二是toC的,然后它的产品特别多。拼多多肯定也会做,因为他们是同一类型的企业,肯定也会做这种推荐。

  那么一般的企业就不会做了,比如说我们现在做的一些企业,比如生产女装,他可能产品很多,但是他的相对来说变化很快,所以它在推荐的时候也不是特别有热情去推荐。因为它最主要的还是以单品推的方式,它这个行业有关系,比如说我是时尚行业,我一下做了1万件衣服,我想的不是说你过来,我看你喜欢什么买什么,而是我拼命要把货推给你。因为这个跟行业有关系,它的行业的特性决定,同时时尚行业因为它变化很快,用这种历史的数据来预测未来还是不太准确的。

千人千面

天猫是怎么干的?天猫其实是在做千人千面,千人千面其实跟前通过率是有一个巨大的关联性。那么首先他是要做协同过滤的,以天猫现在的技术的话,包括它的云计算,他们用的这种分布式计算,分布式计算的技术是完全可以做到协同过滤的算法的部署,这个没有任何问题。

  但是天猫它也受到了一个它商业模型的一个局限。因为天猫的赚钱模式是以别人做广告,向商家收费这样的一个方式。他虽然也是希望根据顾客的喜好,但他真正赚钱是什么?谁出的钱的商家谁是大爷,所以他也得为商家服务。 

天猫的推荐系统就出现一个,你不能说他几不像,但是它必须要当中给他做一个平衡。这个平衡就是说,我知道一个顾客你确实喜欢什么,用协同过滤的时候,东西我可以进行总结,但是我是不是一定会向你推荐顾客最喜欢的那个东西?不见得,也许我喜欢的东西只有两块钱三块钱。你向我推荐吗?这是我最想要的东西,你向我推荐不?不是。天猫是要考虑它的盈利的。那么他因为天猫最重要的经济来源是来源于商家的,因此商家做促销的时候,它的权重就会比较高。


商家对某些商品,比如说我对一个奢侈品牌,我本来两块钱就可以买,这是我要的。但是现在有更奢侈的东西要200多块钱,你可能就会拼命的向我推荐200多块钱,而不是向我推两块钱,因为两块钱的商家没有做广告,或者他甚至还卖得不好,不太好。那天猫肯定是推什么?卖的好的商家,这是它的算法决定。它的整个策略决定平台策略决定的。因此天猫的推荐所谓的千人千面,你一旦具备了分析思维,你其实对这些商家讲的什么千人千面什么,你就会去判断,为什么?你结合它的业务就知道他的算法的模型跟京东的算法模型如果都叫千人千面一定是不一样。

我觉得他们可能会除了协同过滤的系统之外,还会去根据顾客浏览过什么商品,收藏加购什么商品,购买过什么商品,参加过什么活动,包括其他很多他考虑的因素都会放进去,最后对每个因素进行重新赋予一个不同的权重,这个跟他的赚钱的策略是相关的。那么这个权重会最终导致说我到底向顾客推荐一个什么样的产品,这个是非常商业化的。

qqq.png

那么我为什么要讲这个东西?事实上说我们做数据分析师的人,难道就是学一个算法就算数据分析师吗?很显然不是。这个也是特别疑惑的,大概是学算法学编程,还是到底要学什么怎么做分析,我不是经常说分析师是有灵魂的,设计思维就是你的灵魂,你没有设计思维,分析思维,你就没有办法给天猫做推荐系统。因为你根本就不了解它的商业模式,是不允许直接用协同过滤的。你如果直接给他上协同过滤的话,肯定是不行的。因为这可能会在某些方面会违反他赚钱的一些原则,那么是不是京东就会说我纯粹用协同过滤系统,可能也不会,因为它也有一些它的策略,它也有商家。

我对顾客的增加,顾客的价值是我的最重要的一个战略,而不是卖货,我的协同过滤系统在设计的时候一定是为了增加顾客价值,进行权重调整的,而不是光为说你买一个东西或者怎么样,那么它的设计的思路又不太一样,因为它增加进去的东西不一样,我向你推荐的东西第一不能让你反感。第二让人觉得有价值,那么什么叫有价值?如果天猫我要买两块钱东西,天猫向我推荐200,我就觉得没有价值,没有性价比,这不是我要的,你只想卖货给我多挣我的钱而已。

 第三点,如果我是纯粹做客户价值的,我对卖什么东西我并不关心。我会说我怎么样服务好这个客户?好,首先来看说,小九你是我的高价值顾客,我是尽量向你推荐你喜欢的,因为你是高价值顾客。然后来了小陶你是低价值的顾客,甚至是不赚钱的顾客,我向你推荐的东西其实都无所谓了。因为你对我来说没有意义,我甚至都不愿意去服务你,所以他的思路就不一样。那么他在推荐产品的过程当中,更多的关注说我推荐给小九的产品是不要让她不开心,因为我只要他开心,他每年都会在我这儿花很多钱在买,我根本就不用担心,我要尽量要了解的不是说向你推荐产品,而是拼命地了解你要什么,我如果我的平台上还没有你要的东西,我要尽量组织过来,所以他的算法又不一样,他做的预测,因为你做推荐就是做预测,但他的预测的方向又不一样。

人工智能

  每一种推荐系统它本身是具备一定优缺点,它针对的产品和数据的场景是个有自己的优缺点,什么是最好的?实际上就是我们讲未来的人工智能。人工智能目前的算法,包括深度学习也好,包括神经网络也好,你们能想到的高大上的,还是在归纳。

 实际上我们在设计人工智能去做一些猜测,或者是去了解顾客的过程当中是可以做成一个预测的。那么它的设计思路就不一样了,我们又讲了分析思维,设计思路是不一样,你设计人工智能跟现在你能看到的学到的技术去做预测,用人工智能方式去做预测是不一样。那么我们希望是说未来的人工智能可能是比如说小九我给你设计一个人工智能只是针对你这个人设计的,我开始的原型可能是大家都一样,我放出去的人工智能都是一样,但是这个人工智能会跟着你,他只用你的数据和你周边相关的数据来了解你这个个人。

微信截图_20200926181502.png


比如说有1亿个顾客,我可能有一我训练的模型可能会有一亿亿多种,可能我起步的原型是一样,但是随着你的行为的变化,包括人工智能作为一个相当于是个机器人导购一样的跟你的沟通,服务。在这个过程当中不断的进行学习,跟你交流,记录你的行为,他甚至还会猜测你在想什么,他会验证和判断,我们都知道所有的预测都是错的,那么他要知道我怎么样,我是对的还是错的,他可能会从去试验一下。

那么这种预测就不是归纳性,它是永远往前看,是来猜测我可能会需要什么,因为他用你个人的数据没有办法归纳,它只是一个事件营销。

我们未来可能会更多的去用一些人工智能的方式去做,这是未来的一个发展。

20200926182013_29700.png

上一条:电商服装类商业数据分析案例 下一条:数据分析师如何帮助电商找到蓝海类目?
  • 发表评论
  • 查看评论
文明上网理性发言,请遵守评论服务协议。
首页 上一页 下一页 尾页