首页
友情链接
Search
1
代码实践|通过简单代码来回顾卷积块的历史
483 阅读
2
点亮新基建数字版图——大湾区数据中心巡展即日开启
432 阅读
3
D3.js新手到专家:使用D3.js进行交互式可视化的完整学习路径
408 阅读
4
如何为学习,实验和教学生成有意义的人造数据集?
380 阅读
5
t检验用不了?别慌,还有神奇的非参数检验
364 阅读
分类阅读
数据可视化
商业智能
大数据技术
数据挖掘
数据分析
统计学
大数据
人工智能
软件工具
外文翻译
人物观点
行业资讯
登录
Search
标签搜索
大数据
数据可视化
统计学
数据分析
机器学习
统计基础
R语言
统计知识
数据图表
商业智能
Python
机器算法学习
算法学习
数据可视化工具
数据百科
ggplot
人工智能
深度学习
数据挖掘
BI
商业数据分析网
累计撰写
492
篇文章
累计收到
0
条评论
首页
栏目
分类阅读
数据可视化
商业智能
大数据技术
数据挖掘
数据分析
统计学
大数据
人工智能
软件工具
外文翻译
人物观点
行业资讯
页面
友情链接
搜索到
329
篇与
分类阅读
的结果
2021-04-12
如何通过用户分层,提升用户增长?
用户分层,是一种对用户进行群组划分的方法,通常用于描述某一用户的当前状态;在用户分层模型中,某一个用户在某一特定时间应只属于一个用户层级。今天,我们主要讲以生命周期阶段为依据的用户分层方法。1.何为用户?在讨论用户生命周期价值(CLV)之前,我们先看看,这里的“用户”究竟指的是哪些人。举个例子:如果把地球看成一个APP,用户就好比地球上的人。每年出生1.4亿人,目前70亿人活在世界上,已经累计死去1080亿人。其中出生人数就像是新增用户,现存70亿人口等同于活跃,累计死去的人意味着流失,“人活七十古来稀”的概念与留存周期类似,人们生育繁衍又与产品的口碑传播很像。这样,我们可以一一对应这些用户生命周期中的概念:新增(Acquisition)、活跃(Activation)、留存(Retention)、传播(Refer)等,对于互联网产品而言,还有一个商业变现(Revenue)的环节。这五个环节,就构成了我们常说的AARRR用户生命周期模型。仔细观察上图过程,不难发现,我们经常很自豪地说我积累了几百万、几千万用户,其实没有太大的意义。因为,这个数字当中的大多数用户,可能已经流失了,他们不会再为你的产品创造任何价值了。因此,当我们讨论“用户”的时候,我们需要清醒地认识到,只有那些能够被激活、与产品有互动、长期留存、消费/点击广告,甚至主动为你做传播的用户,才是真正优质的、核心的、正在创造价值的用户。那么,如何找到这群真正的优质核心用户呢?我们要做的第一件事就是分层。2.何为用户分层?用户分层,是一种对用户进行群组划分的方法,通常用于描述某一用户的当前状态;在用户分层模型中,某一个用户在某一特定时间应只属于一个用户层级。今天,我们主要讲以生命周期阶段为依据的用户分层方法。在按CLV做用户分层的过程中,我们需要以不同的“行为”的触发情况,标识用户的当前状态。以此判断用户正处于新增、活跃、留存、传播、付费的哪一个阶段。3.如何给用户分层?举几个例子:1)社交应用(SNS)典型分层: 第一层是新增访客,只要启动应用就算一个访客,访客中流失的记为流失访客; 第二层可以标记为活跃用户,至少触发一次浏览事件的才算一个有效活跃,流失的记为流失参与者者; 第三层标记为互动用户,有点赞评论的用户就是互动用户,流失用户记为流失使用者; 第四层记为回访用户,以多次启动应用并且多次互动为标准,如果他们流失了,则记为流失高价值用户。 2)SaaS用户的典型分层: 第一层是访客用户,以打开网站为基准,访客中流失的记为流失访客; 第二层记为评估用户,以深度浏览或查看官网demo为准,流失的记为流失评估者; 第三层标记为试用用户,以完成注册为标准,流失用户记为流失试用者; 第四层记为付费用户,以完成合同流程为准,流失用户记为流失客户。3)互联网理财的典型分层: 第一层依然是访客,也是以启动应用做标准;若一定时间周期内没有回访记录,则记入流失访客; 第二层为评估者,分层依据是:触发[查看理财产品]等内容浏览相关的事件;如果一个用户仅仅启动了应用,却没有浏览任何产品,就可以记为一个流失了; 第三层可以定义为实名用户,分层标准是绑定银行卡、完成实名认证等;此时,2、3层之间的流失用户我们记为“浏览后流失”; 第四层标记为投资用户,这个分层标准很简单,比如:至少购买一次理财产品;对于绑定了银行卡却没有选购产品的用户,记为“理财前流失”; 第五层可记为复购用户或者忠实用户,这些用户在投资行为上能够满足[周期性]的特征,投资金额能够逐步[增长];而时间周期内,有过投资记录却不满足该层级标准的用户,可以被记为“理财后流失”。 4.用户分层的价值对于上文提到的的用户分层案例,我们可以归纳出一个图形化的展示形式,如下图:上图所示金字塔模型,完整地展现了该产品的用户分层层级。企业可以通过跟踪研究用户行为,快速地明确用户生命周期中的不同阶段,并以此划分用户层级。这种基于行为的用户研究方法,会极大地提升企业的用研效率,了解不同层级的用户量及其转化途径,为用户增长的突破提供数据支撑。结合漏斗分析、同期群分析、留存率分析等多种分析模型,究竟哪些用户在为企业创造价值、用户为何购买为何流失……这些困扰着企业运营的难题都将迎刃而解。用户分层的展现与应用,可以通过堆积面积图、同期群百分比堆积图等形式进行。关于这两类数据展示形式的设计与解读,我们将在后期撰写独立内容做讲述。总 结用户分层,除了能够为企业提供科学的用户研究方法,其更重要的作用,在于拆分和构建业务流程中的指标衡量体系。在任何一个企业或团队里,不同角色、不同部门、不同岗位的人,需要关注的指标是不尽相同的。表1是个简单的例子:关注用户的生命周期,对用户进行分层分析与管理,探索各个层级阶段的核心指标,以此衡量业务部门的工作成效,这是每一个企业实现增长的必由之路。当然,这个过程并不是一蹴而就一成不变的。用户生命周期价值的分析与提升,同样遵循着精益分析的循环(loop of lean analysis),即:产生想法->构建指标体系->设计产品/方案->衡量实施结果à对过程数据进行分析->从分析中学习经验->产生新的想法。一个好的idea对于优秀产品而言固然重要,但更重要的,是对用户需求的深刻理解和对用户价值的深入挖掘。想要实现这两个“小目标”,CLV(用户生命周期价值)分析必不可少,用户分层模型及其指标体系必不可少。
2021年04月12日
212 阅读
0 评论
0 点赞
2021-04-12
增长黑客进阶之路:关于A/A测试,看这篇文章就够了
增长黑客成长之路上,想比大家对A/B测试已经很熟悉了,但听过、实践过A/A测试的同学举个手我看看,喏,还没多少人。这篇文章我们就来讲讲A/A测试。什么是A/A测试?A/A测试可以理解成对两个相同版本进行的A/B测试。通常,这样做的目的是为了验证正在使用的工具运行试验在统计上是公平的。在A/A测试中,如果测试正确进行,控制组和实验组应该没有任何区别。在没做A/A测试之前,你可能什么都不知道,这里的逻辑是这样的:如果样本的A/A测试结果达到统计显著,那么A/B测试工具或测试方案就是不可信的。如果说A/B测试用来测试比较几个方案的优劣,那么A/A测试就是验证A/B测试及工具置信度的有效方式。为什么进行A/A测试?既然A/A测试的两个版本变量没有任何变化,为什么还要花时间精力来做?商业活动中,通常我们使用一切数据工具的目的,无外乎:用测量推动决策优化,同时用正确的决策获取比竞争对手更大的市场。可能通过数据能获取的决策信息点有很多,那么通过A/A测试来确保你得到的数据能用来自信地作出决定,减小决策失误。通常情况下我们做A/A测试的目的有下面几个: 保证精确的流量分配,换句话说,验证随机性实际上是通过确保每次试验产生的计数与统计范围相似 识别假阳性结果的频率(假阳性结果也可以理解为测试结果中的虚假繁荣,有相当的误导性) 确定方差“泡沫”帮我们更好的理解其他测试结果 关于假阳性A/A测试能被用来理解假阳性结果的频率。简单讲,如果你在测试中采用95%置信水平,那么20次结果可能会出现1次假阳性结果。这时候通过A/A测试,就能验证转化率的显著差异,比如,你运行20次A/A测试,其中有2次结果明显不同,这意味着假阳性的比例可能高于5%。方差“泡沫”A/A测试能帮助确定转化率中的方差“泡沫”,最小化对未来测试的影响。除了技术上的有效性,A/A测试能让“泡沫”在可接受范围内。比如,如果A/A测试中的泡沫是0.1%,测试转化率是3%,那么你可以接受的范围就是2.9%-3.1%。如果你看到0.1%的提升,那么你就知道这样的结果是没有意义的。A/A测试的时候,你不知道什么时候新变量和默认变量的转化率差别结果能达到统计显著。因此,A/A测试中的任何错误或置信度不应被用来作为未来测试的基准,因为A/A测试中本不应有转化率的明显差异。需要注意的是,有可能只是因为随机性,导致A/A测试的两个试验结果有所不同,而不是工具或测试方案本身的问题。当然,随着样本量的增大,这种差别会逐渐降低。这是因为,小样本下的结果是不可信的,小样本从总体上意味着可能存在分配不均的数据段。要消除这点,就需要A/A测试运行足够长的时间,以及有足够的样本规模。计算测试持续时间测试持续时间是两个因素的函数: 达到一个可接受的样本大小所需的时间 变量之间的不同表现差异大小 如果一个变量引起了50%的变化,测试就不必运行很长时间。这种情况,即使是在小样本下,也可以忽略统计误差。如何设置A/A测试?A/A测试好在不必做任何创造性的或研发上的工作。当设置A/B测试时,你需要在A/B测试软件上编程来改变、隐藏或删除页面的某些部分,对A/A测试来说这些都是不需要的。A/A测试面临的挑战是正确的选择运行测试的页面,通常做A/A测试的页面都应该有两个特点: 相对较高的流量。网页流量越多,越早看到变量的对比。 访客可以从页面购买或注册。我们希望根据最终目标来校验我们的A/B测试工具。 出于这些原因,通常我们会在网站主页上运行A/A测试。运行A/A测试的成本运行A/A测试的唯一成本:机会成本。有的人宁愿把A/A测试上投入的时间和流量用来多做几次A/B测试也不是没有道理的。应该考虑运行A/A测试的唯一种情况:1.你刚安装了一个新的测试工具或更改了测试工具设置。2.你发现了A/B测试与数据分析工具结果之间存在差异。参考文章: blog.analytics-toolkit.com/2014/aa-aab-aabb-tests-cro/ blogs.oracle.com/marketingcloud/optimization-shorts:-aa-testing www.optimizely.com/optimization-glossary/aa-testing/ 本文由 Zoran @吆喝科技(微信:appadhoc)授权发布,未经作者许可,禁止转载。
2021年04月12日
309 阅读
0 评论
0 点赞
2020-07-11
如何正确理解商业智能 BI 的价值 ?
商业智能 BI 要解决的问题商业智能 BI ( Business Intelligence) 简单来说就是一套由数据仓库、查询报表、数据分析等组成的数据类技术解决方案,将企业中不同业务系统( ERP、CRM、OA、BPM 等,包括自己开发的业务系统软件)中的数据进行有效的整合,并利用合适的查询和分析工具快速并且准确的为企业提供报表展现与分析,为企业提供决策支持。商业智能概述商业智能 BI 的核心主线是什么? 主线就是通过构建数据仓库平台,有效的整合数据并组织起来为分析决策提供支持并实现其价值。还有一种解释就是:将数据转变为信息,信息支撑决策,决策产生价值。对于商业智能 BI 大家在质疑什么?接触过很多的客户,对于商业智能 BI 他们有这样的一种普遍看法:商业智能 BI 是如何产生价值的,价值在哪里,我并没有看到? 为什么在我的企业中我们 IT 部门或者业务部门完全沦为了做做报表,能体现的价值只是节省了我们做报表的工作量,仅此而已。派可数据可视化分析报表这种质疑带有很大的普遍性,就如同之前有参加各种企业沙龙活动,有现场听众直接问到:你不用讲那么多,你直接告诉我这个东西有什么用,能解决我们什么问题,能不能帮我们企业赚钱….。有来自业务线的、技术线的、管理层的不同的听众,每一层他们关注的点实际上都各不相同。包括每个人、每家企业对数据的认知程度也决定了他们对商业智能 BI 的理解和认可程度。但这样的问题也不是不能解决,比如我们就不聊技术,我们就聊聊一些业务场景,最后发现效果就会好很多。在这里我们尝试用一种可能大家都能够理解的、非技术与专业的方式让大家理解一下商业智能 BI 的价值到底如何体现的。我们在此探讨一下在我们眼中商业智能 BI 的三个分析层次,或许我们对商业智能 BI 的认知可能有所改观。 为了便于理解,文章中不提及任何专业的名词与解释。商业智能 BI 的三个分析层次第一个层次是报表的常规呈现。所谓常规呈现指的是使用柱状图、饼状图、折线图、二维表格等图形可视化的方式将企业日常的业务数据(财务、供应链、人力、运营等)全面呈现出来,再通过各种维度(看数据的角度)筛选、关联、跳转、钻透等方式查看各类分析指标,业务分析图表按照主题划分,图表之间存在一定的逻辑关系。派可数据 BI 可视化图表之间的钻取、联动等效果这些分析展现内容基本上是围绕各个业务部门日常工作展开,这里面有很多的业务分析内容可能需要复杂的计算规则,需要从不同的系统取数据,从业务系统软件中这些都是很难直观看到的。这个层次的报表分析就是一种呈现,让报表用户对日常的业务有一个清晰、直接、准确的认知,其次解放了他们自己手工通过 EXCEL 通过各种函数做汇总分析、制图的工作。比如,财务部门会关心今年的营业收入、目标完成率、营业毛利润率、净资产收益率等;销售部门会关心销售金额、订单数量、销售毛利、回款率等;采购部门会关心采购入库金额、退货情况、应付账款等等。派可数据汽车4S集团财务分析部分案例因此,达到第一个层次的目标就是:通过可视化分析报表直观、全面的呈现企业日常经营、业务的情况。可以从集团层次出发,也可以从业务线或者部门出发。实际上,很多企业在落地商业智能 BI 的过程中也就停留在这个阶段,或者还没有完全达到这个程度,比如上面所提到的 “全面的呈现企业日常经营、业务的情况”,有的企业可能只是做到了“部分呈现”。因此,商业智能 BI 的价值在这个阶段就显得非常有限,数据的作用仅仅是从另外的一个”可视化”的角度对业务做出了另一种形式的解读,用户仅仅是被动的接收来自可视化报表上传递的信息。第二个层次是数据的”异常”分析。我们通常所认为的 “异常” 就是指不好的东西,那么在这里我们对 “异常”的解释是:通过可视化报表呈现,我们发现了一些数据指标反映出来的情况超出了我们的日常经验判断。例如,正常情况下每个月的平均用户注册量是10万左右。但是通过报表我们发现在今年的 8 月份,会员注册量达到了 23 万,这就是一种 “异常”,远远超过我们的经验判断和预期。再比如在今年的 1-9 月份,产品销售毛利率稳定在 30%-40% 之间,突然到了10月份,整体的毛利率下降到了 20% 不到,这也是一种 “异常”。这两种异常数据,一种是我们所追求的的正向”异常”,一种是我们极力避免的负向“异常”。商业智能 BI 是先通过第一层的报表呈现,将很多业务运营情况直观的反映出来,让用户可以直观的看到在我们经验之外的数据表现情况。商业智能 BI 在这里体现的价值就是要对这些 “异常” 数据进行有目的的分析,通过相关联的维度、指标使用钻透、关联等分析方式探索出可能存在的原因。派可数据可视化分析案例比如会员注册的问题,有哪些因素可能导致会员注册的大幅度增加的可能?是不是最近采取了一系列的线上降价促销、开放式的注册、相关营销活动等,这些支撑分析的数据是否都存在,如果都存在,它们的报表呈现情况如何,促销投入的力度和用户增长的关系等等。在这个层次中,可视化报表的分析是带着问题找问题的,通过一次或者多次的维度和指标图表构建,逐步形成了一种比较可靠的、固化的分析模型。这个阶段的用户不再是被动接受来自图表中反映的信息,而是通过”异常”数据来定位到背后的一个业务问题,数据和业务在这个层次开始有了联系,数据图表之间的逻辑性更强。例如,通过分析发现在三种线上促销方式中,促销方式一的投入产出最高,因此回归到业务场景中,这种促销方式以后应该要坚持,它可以有效的提升用户注册增长率。第三个层次是业务建模分析。业务建模分析通常是由精通业务的用户提出,通过合理的建模找出业务中可能存在的问题,将其反映出来并最后要回归到业务,形成决策并不断优化的一个过程。业务建模可简单,可由一个或多个图表组成,也可复杂,通过一组或多组数据图表支撑。业务建模简单来说也可以理解为一种业务分析的逻辑思维模型,只是用数据、图表化的方式将它们有效组织起来去验证我们对业务分析的逻辑判断。业务建模分析区别于第一层的全面数据呈现和第二层的异常分析和被动分析,它是一种更深层次的业务数据的主动设计和探索分析。这层分析的提出更加深入业务,围绕一个一个业务分析场景展开,对业务的认知要足够深。例如下面是一个有关 4S 店首保回店率的分析,通过一个很简单的建模(维度:年份,分析指标:新车销售数量、首保回店数、首保回店率)分析每年首保用户的留存情况。首保回店率的分析通过分析发现,2015、2017、2018 年首保回店率在 90% 左右,2016 年的首保回店率只有 55%。从汽车 4S 店的实际业务出发,汽车销售实际上是不赚钱的,真正赚钱的在售后服务上,例如:保险、保养、维修等等。而首保回店率在很大程度上决定了购买新车的用户在提完车之后会不会经常回店的可能。因为新车用户在提车之后在第一次的保养都不选择原店,就意味着这个客户在后续的保养可能也不再回来,一年、两年、三年,这位用户可能就会永远的流失掉,也就意味着以后的保养、延保、事故车维修可能也不会回来。首保回店率的分析比如一个用户做精品车保养,一年 1.5 次,一次平均贡献 3000 元,1.5 次就是 4500元的收入。再加上每年的保险例如 6000 元,可能潜在的维修在1500 元左右,一年可能产生 1.2 万的收入贡献。如果像2016 年的回店率只有 55%,流失的客户数是 174。如果能够提升到 90%的水平,就意味着可能的销售收入贡献能够达到 351 * 1.2 万 = 421 万,比现在要多出 160 万的收入。如果把新车基数扩大 10 倍呢,一年要多出 1600 万的各类收入,所以提升首保回店率就变得非常的重要。同时,也要对首保回店率低的原因做出分析:是因为车卖给了外地,还是因为新车用户对4S 店的维修保养环境、服务质量不信任,我们应该从哪些方面进行改善。所以实际上,业务分析模型的提出围绕的是一个一个非常具体的业务场景,回答的是一个又一个业务的问题,而这些问题的发现与企业的业务经营水平、管理水平可能有很大的关系。譬如其中的一个改善环节就是在新车用户提完车之后,带领新车用户参观维修保养区域,了解其规范性,透明的展示保养的整个过程和专业性,不会出现维修师傅在保养过程中偷油、少换零件、以次充好以建立信任;或者通过一些促销小手段极大可能的留下新车用户;或者通过系统在不同的时间点关怀用户,提前提醒新车用户回店保养等等。当然,实际上各家 4S 店的首保回店率正常情况下都能保证在 95% 以上或者更高的水平,这里只是通过一个例子来说明数据和业务是如何产生关联性的。所以,为了达到这样的目标实际上需要去从业务上解决问题,找出业务环节中的不足来提升业务指标。类似于这样的业务分析模型还有很多,但这样的分析场景很难由专业的 BI 开发人员提出来。业务分析建模需要由专业的业务人员且具备数据分析思维意识的人员来推进和主导,再辅助合适的数据分析、挖掘或统计工具,这样商业智能 BI 的价值才能得到充分的发挥,数据的价值也才会得到充分的体现。派可数据分析报表样图对商业智能 BI 的总结所以我最终想表达的一个观点是:我们不应该质疑商业智能 BI 本身,我们质疑的应该是在这个过程中,我们的个人、企业对于商业智能 BI 的认知和推进到了哪一个层次,推进到哪个层次,商业智能 BI 的价值就会体现在哪个层次。如何有效和成功的推进商业智能 BI 的建设与落地,这才是我们 BI 服务提供商和客户一起共同要面对的问题。最后看看我们对商业智能 BI 的认知是不是这样理解才更加合理:商业智能 BI 的表象是可视化分析报表的呈现,但它的本质还是业务问题、管理问题。商业智能 BI 数据分析来源于业务,通过数据呈现发现业务问题(好的或不好的,经验之内或之外的 )再次回到业务优化业务提升业务运营的一个过程,这就是在商业智能 BI 中数据到信息、信息产生决策、决策产生价值的真正内涵。作者简介派可数据联合创始人 吕品,前天善智能联合创始人&运营总监,十余年商业智能 BI 行业经验,2015-2019 微软 MVP本文由 派可数据 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者 。
2020年07月11日
116 阅读
0 评论
0 点赞
2019-12-02
BI(商业智能)的未来?
商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。商业智能作为一个工具,是用来处理企业中现有数据,并将其转换成知识、分析和结论,辅助业务或者决策者做出正确且明智的决定。是帮助企业更好地利用数据提高决策质量的技术,包含了从数据仓库到分析型系统等。百度百科认为BI包括三个层级:数据报表、数据分析和数据挖掘。数据报表:传统的报表系统技术上已经相当成熟,大家熟悉的Excel、水晶报表、FineReport、Reporting Service等都已经被广泛使用,其实很多公司不需要要什么专业化的报表工具,自己定制也足够OK。数据分析:报表系统更多的是呈现数据,但如果你想更多了解数据之间的关系,发现一些异常,一般只能靠定制化方案解决,比如取个数,然后有“好事者”觉得分析的模式还是有规律可循,因此提出了OLAP的概念,希望用多维钻取、关联的方式来帮助业务人员更方便的探索数据的内含规律,同时通过可视化配套技术来展现分析的结果,诸如仪表盘、大屏啥的,这就是所谓的数据分析工具,也是当前BI工具的主流。数据挖掘:数据挖掘则希望能超越人的限制,针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。但笔者认识的大多数BI,其实仅包含数据报表和数据分析,数据挖掘的一些东西可以集成到数据分析工具中,但大多数情况是没有的。现在BI工具发展的不错,诸如Power BI 和 Tableau等都是不错的产品,每年有几十个点的增长率,但从笔者的使用经历看,或者站在一个大厂的角度看,BI这个20年前提出的概念,近些年来其实并没有获得突破性的进展,起码在数据转化为知识的过程中,当前的BI工具能起到的作用是极其有限的。这也是为什么会经常会听到这样的对BI的质疑:你不用讲那么多,你直接告诉我这个东西有什么用,能解决我们什么问题,能不能帮我们企业赚钱….。BI也许会这么解释:业务分析需要由专业的业务人员且具备数据分析思维意识的人员来推进和主导,再辅助合适的数据分析、挖掘或统计工具,这样商业智能BI的价值才能得到充分的发挥,数据的价值也才会得到充分的体现。但跟机器学习和人工智能中的‘’智‘’相比,BI商业智能中的‘’智‘’,实在是弱了点。所以BI工具能卖的动,一方面得益于数字化产业的加速,另一方面也跟企业数据意识的崛起有关,大量中小企业都希望用更为自动化的报表形式来提升看数的效率,但大厂、运营商等也许早就过了这个阶段,现在的BI工具对它们来说,缺乏进一步的吸引力。从可视的角度看,BI工具的边际效益并不高,10年多前我看到的可视化和当前我看到的可视化,并没有有多大的进步,或者对于分析有更大的价值,当然大屏除外。从灵活的角度看,SQL、Python等解释性语言的普及度越来越高,大量的业务人员开始掌握这些简单的语言来进行定制化的分析,固定模板和样式的BI工具就显得相对弱了。从分析的角度看,既然BI更多是验证业务人员的假设,其实EXCEL性价比已经很高了,至于EXCEL依赖的数据源,靠定制化的取数也是可以的,这在当前很多企业中是主流的支撑模式。从报表的角度看,拥有开发能力的大厂自己定制报表系统已经不是事了,大数据起来后,大厂更多关注的是报表的性能和适配自己的技术生态,而不是简单的便捷和好看。那么,未来的BI到底长啥样?如果我们超越当前主流BI工具定义的范畴,也许可以从大厂的实践获得一些启示,至少有三点是值得思考的。1、前后端一体化大数据在带来海量数据的同时,也带来了数据处理技术的革命,其对BI的影响是深远的,主要有三点:第一、大数据高价值、维度多、价值密度低的特点,使得多维分析的价值突然提升了,在小数据时代,多维分析其实有点聊胜于无,但现在的驱动力强多了。第二、大数据带来了数据处理技术的革命,比如hadoop用多样化的技术引擎来满足各类数据分析场景的诉求,但同时也大幅提升了数据分析的门槛,业务人员会突然发现很难直接操作hadoop。第三、现有的BI工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据等等问题,这些不适配降低了大数据引擎进步带来的价值。因此,BI工具如何去适配这些大数据处理和分析引擎就成了一个机遇,现在Apache Kylin多维数据库很火,就是因为它成为了新时期BI工具和大数据后台引擎的连接器,其针对海量数据的OLAP分析的性能很高,为BI提供了面对大数据时缺失的能力,阿里的AnalyticDB也是类似的。业务人员对可视化也许会审美疲劳,但其对于数据分析速度的要求是始终的,在相当长的时间内,因为业务人员自己做不动,开发人员做的成本又比较高(当然大厂可以自己做),只要BI能衔接到这些大数据引擎,就会产生1+1>2的效果。可以肯定的是,BI通过全新的大数据技术手段来提升产品的竞争力会是一个趋势。2、移动端的场景化BI产品的移动化很久以前就有产品了,但奇怪的是,它们并没有像移动互联网一样快速普及,起码速度不够快,为什么?当笔者第一次接触到这些移动化的BI产品时,就发现把报表系统原封不动的搬到手机上体验是不行的,光是选择指标和维度就显得有些繁琐了,小屏看报表问题很多。而且应用的场景似乎也出现了点问题,在碎片化的时间,人们似乎没有心思去研究报表,更不用说钻取分析了,有那时间,还不如坐在电脑前直接看大屏的报表,这是很尴尬的地方。因此,移动端的BI也许只能承载轻量的随时随地看数的需求,未来的一个趋势也许就是场景化,实时化。场景化就是针对特定的事件提供针对性的看数方案,比如KPI是一种场景,双11也是一种场景,但双11你给老板看的报表和指标跟平时的KPI是完全不同的,你要定制化这些指标,显性化展示指标,需要补充一些跟这个场景相关的特定要素。以下是校园营销的移动端BI示意。既然是场景化的,必然在特定时机会有看数的诉求,这个时候就有数据实时性的要求,比如双11就是实时的数据展现,我们在做校园营销的时候,就需要针对每个校园进行进行实时受理数据的比对,以便及时发现问题。由于场景化的要素不确定,决定了不大可能用标准的BI工具来实现,无论是实时的接入能力还是组装场景的能力。因此,现在一般用定制化的方式来解决,但考虑到场景是有时效性的,也许生命周期只有几天,定制化的成本相对就会比较高,“搭积木方式”的BI工厂也许就是一种解决方案。其实,无论是小屏、中屏、大屏,我们都有这种诉求,也许,这代表了一种趋势。3、自助式的分析10多年前来我们做了很多定制化分析的系统,现在留下来还在发挥作用的,就是自助取数。由此延伸出来的自助概念很好,因为它改变了数据分析支撑的模式。以前基本上都是IT业务部门提需求,IT部门负责制作相应的报表,这样的流程会很长,响应的及时性也不够,那能不能提供给业务部门一些自助的工具让它自己来DIY数据呢?比如基于指标灵活的组装形成报表,这就是当前BI提倡的自助分析。但我们以前的自助报表系统却没有存活下来,为什么?因为要达到自助的目标,不仅仅是提供一套灵活的报表发布工具那么简单,而是要提供从数据采集、处理、发布、调度、数据管理等的一整套数据解决方案,否则,你的自助分析的应用范围就会受到极大的限制。举个例子,假如企业没有好用的数据字典,业务人员连数据是啥意思都不清楚,自助分析也就无从谈起了。现在的很多BI自助工具所以能玩的转,往往是因为面对的数据不多,维度很少,指标有限,反正就是固定的维度和指标的组装,那是没问题的,但这种理想的场景在大企业其实很少。现在数据中台所以能这么火,就是因为它对前端的赋能其实是一个系统工程,要考虑数据的方方面面,比如数据标准化,只有在这个基础上的自助分析才是有生命力的。因此,假如一个企业的自助分析够做的很好,那数据管理水平也是相当高的。BI工具的成功,从来就不是简单的工具成功,而是跟这个企业的发展阶段、机制流程、人员素质、数据基础、平台能力分不开的。无论如何,自助分析会是个趋势,但需要数据中台为其背书。这篇文章写到一半其实就有点写不下去,因为发现自己对于最新的BI产品的进展理解不够,更多的还是从自己的实际工作来理解印象中的BI,个人色彩浓重了点,权当抛砖引玉,各大BI厂商就不要来“锤”我了。本文为专栏文章,来自:傅一平,内容观点不代表本站立场,如若转载请联系专栏作者 。
2019年12月02日
120 阅读
0 评论
0 点赞
2019-11-19
42款好用的数据可视化工具盘点
最近有很多人问我有没有一些好用的数据可视化工具,领导催着要可视化结果,可是很多工具都不怎么好用。作为一名数据分析人,没有一个好的可视化工具怎么能行?其实国内外有不少可视化工具还是相当好用的,比如FineBI、Echart、Tableau等等。借这个话题我盘点了一下国内外的60个可视化工具,涉及数据分析、软件分析、图像处理等等几乎所有可视化相关领域,大家可以Mark起来当做参考。1、FineBI简洁明了的数据分析工具,优点是零代码可视化、可视化图表丰富,只需要拖拖拽拽就可以完成十分炫酷的可视化效果,拥有数据整合、可视化数据处理、探索性分析、数据挖掘、可视化分析报告等功能,更重要的是个人版免费。2、Infogr.am十分强大的图表制作工具,本身带有十分丰富多样的模板,如果个人不满意还可以手动设计,优点也是不需要代码编程,缺点就是只能用来制作图表,更加炫酷的可视化效果实现起来比较困难。3、Easel.ly几年前开始流行的信息图制作软件,界面简洁、操作简便、图片精美,而且用户只需要登录Easel.ly官方网站即可开始进行信息图制作,在网站上你可以尽情分享和查找素材,当然有些是不免费的。4、Color Brewer强大的配色工具,你在这里面几乎可以找到任何你想要的颜色,它本身也是一个绘图系统,拥有很多配色模板,可以当做一个小工具收藏,配合其他可视化工具使用。5、ChartBlocks英国的一家公司开发的制作统计图表的线上工具,省去在Excel软件里制作图表的繁复,让图表更加多样化,无需专业的软件技能就可以轻松制作漂亮的图表,但是功能不多。6、Visual.ly在线图表神器,这家网站以丰富的信息图资源而著称,很多用户乐意把自己制作的信息图上传到网站中与他人分享,最近好像爆出消息还能帮助人们制作信息图,不知道免不免费。7、Nuvi一款非常简单好用的信息图形生成器,拥有好几百个模版,当然,如果你喜欢,也可以不用模版8、Dygraphs用的比较少,网站上资源也几乎没有,在国内属于小圈冷门的可视化工具,但功能其实是很强大的,不想费力找资源的建议选择其他的工具。9、EChartsECharts就不用说了,搞数据可视化的99%都知道,是一款商业级数据图表,纯JavaScript的图标库,缺点是要代码操作,小白上手难度很高,适合码农这样的数据人。10、Cytoscape适合做一些文章里的网格图、散点图、结构图、思维图,写论文、报告等场景下非常好用,适合大学生或者搞科研的人。11、图表秀适合做PPT时做一些好看的图表,图表制作功能比较强大,但是我记得导出高清图片的时候要收费,只能导标清图比较坑吧。12、BDPBDP个人版是国内海致公司旗下的数据可视化分析产品(BDP也有商业版,针对企业用户,但我非商业版用户,所以就不多说了),有多数据整合、数据合表处理、可视化分析等数据功能,总体来看数据功能还是非常全面的,虽然不免费但是成本低一些13、xdatainsight国产的一站式敏捷可视化工具,以前还比较好用,现在基本没人用了14、Tagul国外一款词云制作神器,免费的小工具,非常好用15、Tagxedo跟上面的tagul一样,也是词云制作工具,而且是在线制作网站,但是需要翻墙16、Wordle很老的信息可视化工具了,主要也是制造词云的,当年也是大名鼎鼎,但是也有很多缺点,字体颜色没有意义、可视化还很初级等17、WordItOut词语云一键生成网站,非常方便,但是没办法根据频率调整大小,功能比较粗糙18、ToCloudToCloud是一个在线免费标签云生成器,你可以设置词的长度和频率,还能提取短语,是一个比较好的标签云工具之一利用词频生成词云,你可以快速了解页面优化了某些单词19、图悦这款国内的在线词频分析工具,在长文本自动分词并制作词云方面还是很出众的,而且也容易上手,还可以自定义定制图形模板:标准、微信、地图等,切换自如,用起来体验很不错20、语义分析系统主要是用于分析文章中的各种参数,包括频率等内容,百度的语义分析系统功能还是挺不错的21、腾讯文智腾讯的中文语义网站,分析语句、篇章等,教学类平台22、polymapsPolyMaps是一个地图库,主要面向数据可视化用户,在地图风格化方面有独到之处,类似CSS样式表的选择器,用来做动态地图的23、nodebox可视化进阶神器,NodeBox是OS X上创建二维图形和可视化的应用程序,你需要了解Python程序,NodeBox与Processing类似,但是没有Processing的互动功能24、processing堪比python的编程语言,能够实现几乎所有的可视化效果,语句规范上不如python ,但是比较容易上手25、processingjs跟上面的一样,是一门可视化编程语言,ProcessingJS是它的JavaScript实现,使用HTML5的canvas,配合现代浏览器来实现web客户端的可视化技术26、TangleTangle是个用来探索、Play和查看文档更新的交互式库,既是图表,又是互动图形用户界面的小程序27、FF chartwell一款自动生成分析图的黑科技字体,字体很多28、SAS Visual AnalyticsSAS可视化分析是一款擅长做交互式可视化分析的产品,同时它同样也可以创建出一些很好的可视化图表,不过比较笨拙,不灵活29、数字冰雹国内专门做可视化的,主要是大屏,面向企业而不是个人30、Data-Driven Documents简称D3,是一个很神奇的基于Javascript的在网页上实现数据可视化的工具,不过现在已经不更新了,缺点是要学的东西太多,HTML、编程都得掌握才行31、leafletjs做全屏地图比较方便,同样是需要掌握编程基础,优点是有手机端32、CrossfilterCrossfilter是一个数据计算模型,能够很好地结合DC.JS进行数据解析绘图,属于数理类工具33、openlayersOpenLayers作为业内使用最为广泛的地图引擎之一,已被各大GIS厂商和广大WebGIS二次开发者采用,入门难度极高34、wolframalpha数学开发软件,同时也可以做数理计算可视化,属于专业性质的工具35、visme5Visme为用户提供30万张高清图片、6500种图标、750多种图表模板以及120多种字体36、databoard制作仪表板的,关注数据可视化本身,更多地关注利用可视化技术,高效,批判性地监控数据37、googlecharts文档和帮助信息丰富的 Google Charts 对于刚刚入门 Java 绘图的人来说是极佳的选择。它的文档里到处都是带注释的代码和逐步的讲解,可以直接用来把 HTML5 / SVG 图标嵌入到你的网页中。38、timeline以时间轴的形式进行可视化,别有一番风味39、FusionChartsFusionCharts 支持 vanilla Java、jQuery、Angular 等一系列高人气的库和框架。它内置90多种图表和超过1000种地图,相比 Google Charts 和 MetricsGraphics 要完整得多40、envision.jsJavaScript一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型41、SigmaSigma 有着自己独特的定位,那就是图模型的绘制。它基于 Canvas 和 WebGL 开发并提供了公开的 API,所以你可以在GitHub 上找到社区贡献的许多插件42.dc.jsdc.js 是一个开源的 Java 绘图库。它非常适合用来创建交互式的仪表盘(Dashboard),图表之间是有联系的,所以当你与其中一个部分进行交互时,其他部分都会做出实时的反馈本文为专栏文章,来自:帆软软件,内容观点不代表本站立场,如若转载请联系专栏作者 。
2019年11月19日
120 阅读
0 评论
0 点赞
1
2
...
66