
大数据 如何用大数据实现用户价值的最大化
大数据中的用户分析
首先,我们为什么要去做用户分析?面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以后需要解决的本质问题就是在拿到用户数据之后,如何去经营分析。
对于海量的用户数据来说,最根本的问题应该是从实际中出来,根据解决不同的问题来提取不同的数据,用不同的数据去搭建模型,来进行一系列的运算。对于产品的生产,无论是互联网产品还是实际上的产品,都会面临一个严重的问题,就是如何进行用户体验的优化。用户如何用产品,我们需要的数据就是用户使用数据。
而对于一些利用用户数据做营销的时候,我们想去用的就是行为数据。让我们能够更多的了解用户。他在什么地方出现,喜欢什么样的东西,要做什么事情。这时候我们就需要再用户的生活行为数据找那个抓取我所需要的东西。对于这些数据的使用,我们首先要制作一个数据集。然后拿数据集去进行模型的搭建和预审的运算。最终得出一个可以支持我自己进行决策的结论。
在大数据时代之前,有很多的网站他们就是互联网厂商,已经对用户数据的使用非常娴熟。而现在移动互联来了,用户多了,就会产生更多的用户数据,留在移动互联的平台上。那么从整体数据使用来看,我们还是可以区分的。无论数据使多么庞大,是什么样的维度,对于用户数据的使用目的不会发生太大的变化。
当我拿到用户数据以后,测算体系已经完善了。就能够做一系列的对内、对外的数据使用。对内是进行产品的完善,提升用户体验。产品完善分为两个部分,首先是对业务运营的监管。第二是对用户体验的优化。
对于业务运营监控预计用户的体验优化,使用的数据使完全不一样的。对于业务运营的监控来说,我需要的是用户在我的产品上使用的时长、频次等。这些数据才有意义。
用用户数据说话也不仅仅是做对内的服务,对外的服务也需要用户的数据去做支撑。对外的服务主要包括的方向就是去进行一些信息化的营销和数据服务。
对于精细化营销来说,移动互联时代,所有的App都在移动互联上。也就是说,所有的App都是属于一个媒体。现在也有很多人都在说媒体已经死了,开始转做一些外延的社区了、但是,媒体的定义应该是信息沟通的平台,这样的平台才叫做媒体。
为什么提到媒体?因为对于营销而言,媒体形式非常突出。当我们在给一个App做定义的时候,它就有了媒体属性。那么我们才能够真正的去做营销。做营销的时候,我们需要了解到这个平台上的用户到底是什么样的人。我们现在提到的精准化营销无非就是给用户打上一些列的标签,进行分类,然后进行精准的推送。
2基于体系外部数据的用户画像
对于用户画像来说,它包括两部分。第一部分是用户行为画像。第二部分是用户心理画像。对于用户的行为画像,需要去给用户进行一系列的标签化处理。还想来说的话哦那么呃它是需要去。给用户去进行一系列的这种表象化的处理啊!彪说用户在。比如用打车类应用的人群,我就直接把它定义成打车类的人群。对于用户的心理画像,就是一些标签的运算了。我如何去进行标签化的运算,然后用这个标签去影射用户的心理,这目前还在发展之中。
那么问题来了,用户标签是不是固定的?用户的标签不是固定的,有的人喜欢去旅游,有的人喜欢去远足,有的人喜欢骑行。这个是通过一些数据是可以判定得到的。甚至包括他平时喜欢去看新闻还是八卦,都是可以得到的。
但是也存在一个问题。举个例子。如果这个人看新闻咨询,今天看的是武器装备类的新闻,明天看的是古代历史分析的文章。如果是机器打标签,可能会给他打上一个军队爱好者和历史爱好者的标签。但是其实他就是一个喜欢军事的人。我们在进行标签处理的时候,标签划分的比较细,没有对用户的心理进行分析。
所以这种情况下,对于这个人自己的心理标签是没有打上去的。这种情况下,你自己打的标签或者是你运算出来的数据,是有很大的缺失的。我做用户画像,其实就是去给他打标签。希望能更加精准的、更加有个性的去推荐。但是这种推荐,是一门技术。这种技术并不能够让用户感知到。用户所感知到的是你在这个技术的基础上的创意。
这种创意才是你和用户去进行沟通的最直接的工具,最能够贴近用户。我们现在做精细化推送,最重要的是如何吸引用户。如何去和用户去沟通起来,互动起来,这才是创意最根本的。
刚才说的是用户的数据能做什么,现在我们来看一下用户数据的构成。用户数据是怎么产生的呢?只要触网就会产生数据大家都知道。那么另一块就是从我们的PPT来看,我们经常会忽略一些数据。那我们现在把整个用户数据分为体系外和体系内的数据。体系内的数据,指的是一个用户在一个网站或者在一个App上的使用行为。比如一个用户在微信上的行为。体系外的用户行为主要是用户在离开App以后,他的行为是什么样的。
那么我们就以微信为例,每一个人都在用微信。但是并不是说你只要上移动互联,你就会在微信里呆着,虽然微信很想去做成一个大大的生态系统,但是用户还是不会把所有的时间都放在微信上。这个时候就有问题了,当这个用户离开微信以后去了什么地方?这个才是我们所需要去更加关心的。比如说这个人他在微信里面喜欢去看一些理财的信息,但是当他离开微信以后他并没有使用理财的App。那么这个时候,我们其实可以把他定义成能够成为一个理财爱好者。但是他并不是一个真正的理财者。
所以我们只是从体系内的数据去判断用户,是远远不够的。比如在新闻客户端去进行广告投放,依据一般都是用户在新闻客户端上都会看什么咨询。比如今日头条。今日头条现在的用户渗透率非常的高。对于今日头条来说,他是通过一些算法把用户喜欢的信息推送给用户的。这是没有问题的,那么问题在哪?
问题在于今日头条给你赠送的这个东西是你喜欢的。那么当他在去给你推送一些广告的时候是不是你需要的?这个就是一个问题了。一些女孩子喜欢看明星的东西。这时候今日头条可能会把这个明星代言的商品去推送给她。但是其实她只是喜欢看一些八卦类的消息。她更多的行为是在外出旅游。这个时候你把化妆品、家居用品推送给她显然是不合适的。
但是如果你把掌握住了她出去旅游的数据,又拿到了她喜欢的明星的数据。二者结合,你就完全可以去给他推荐一些比如防晒霜、户外化妆品的广告。这时候肯定是女孩子想要的。从一个渠道获取数据,通常会形成孤岛。就只能把各种信息孤岛去进行打通以后,才能够真正的、全面的去把这个用户进行画像。
我们现在提到的这个话题,非常强调体系外的数据的力量。因为体系外的数据是真正的反应了一个用户自己的一个生活形态。这才是真正的用数据说话。这就是我们现在提到“5W+1H”,这完全可以够了出一个完整的用户画像。
3如何使用用户数据?(以互联网产品为主)
4问答部分:
(1)在建立用户画像模型的过程中,区分用户特征的关键点是什么? 应该从哪些方面去寻找用户特征?
其实区分用户特征的关键点并不在于我们用什么样的数据,要去做什么样的模型儿关键点在于我们到底用用户画像分析出来的东西,是为什么去服务?我们去做用户画像的目的是什么,才是最重要的。如果你要去做运营,你才能从做好的用户画像里找到你需要的核心数据。用户的使用时长、跳转的评测等等一系列这样的数据。
(2)用户画像如何验证准确性?正向用户画像(即把数据归纳成分类标签)相信很多文章与技术提过了,但我们在实践中发现很难反向验证(确认归纳的标签直的是这样)。所以我想问有没些可操作性强的验证方法?
文章与技术提过了,但我们在实践中发现很难反向验证(确认归纳的标签直的是这样)。所以我想问有没些可操作性强的验证方法?
还是同样如此,验证用户画像的准确性就是验证用户标签的准确性。目前来说有两种方法。第一种方法是你继续进行广告投放,去看这个用户的查看率是否有变化。如果投放非常准确,说明用户画像或者标签打的就非常准确。如果是你的这种投放出现了一些问题,那可能就还需要进行标签的改进。第一种方法其实就是便签的运算方式和方法。
那么对于标签来说,如果方法计算的模型是非常合理的,能够通过便签去把用户的需求和价值观挖掘出来,就说明你的标签非常准确。反之,牛给用户打的标签就是有问题的。反向去进行验证是非常困难的。就是去反问你打标签的理由是什么?比如我去使用滴滴打车,那么我就一个打车用户,这是一个既定事实,完全不需要反向验证了。除非你对于标签的一些感性的认知去进行分析出来以后,才能进行反向验证。
(3)如何衡量一个社区型网站的用户数及其商业价值之间的关系?有没有一些相对普适的计算模型可供参考?
对于社区来说,目前没有一个普适的计算模型的。更多的是看用户在这个社区里面自己的一个关系链以及他自己的活性。这种商业价值其实是一个社区或者说一个社区型网站自己的一个战略。当一个用户在这个社区里面行为非常多,非常丰富,路径也非常长,那、这个时候基本上在每一个节点都有一些商业化的机会。当你把它的每个节点都去进行商业化,那它的商业价值就会挖掘出来。
但如果你对用户的路径非常短。而且这个用户的关系网搭的并不是很广很大,尤其是这种社区网站来说是有问题的。所以说更多的需要去看这个网站里用户的行为和他对于营销的一些行为,对于营销活动的一些行为和他自己在网站里面的一些行为之间的关联强度。通过这种关联性的计算,能够去得到对于某网站的营销价值的测评。但是就整个领域而言是没有一个普适的计算模型的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04