首页
友情链接
Search
1
代码实践|通过简单代码来回顾卷积块的历史
483 阅读
2
点亮新基建数字版图——大湾区数据中心巡展即日开启
432 阅读
3
D3.js新手到专家:使用D3.js进行交互式可视化的完整学习路径
408 阅读
4
如何为学习,实验和教学生成有意义的人造数据集?
380 阅读
5
t检验用不了?别慌,还有神奇的非参数检验
364 阅读
分类阅读
数据可视化
商业智能
大数据技术
数据挖掘
数据分析
统计学
大数据
人工智能
软件工具
外文翻译
人物观点
行业资讯
登录
Search
标签搜索
大数据
数据可视化
统计学
数据分析
机器学习
统计基础
R语言
统计知识
数据图表
商业智能
Python
机器算法学习
算法学习
数据可视化工具
数据百科
ggplot
人工智能
深度学习
数据挖掘
BI
商业数据分析网
累计撰写
492
篇文章
累计收到
0
条评论
首页
栏目
分类阅读
数据可视化
商业智能
大数据技术
数据挖掘
数据分析
统计学
大数据
人工智能
软件工具
外文翻译
人物观点
行业资讯
页面
友情链接
搜索到
29
篇与
统计基础
的结果
2016-10-27
小白学统计(80)范例分析:时间数列分析应用
下面以一个例题将前面内容联系起来。说明对于实际问题,如何把各因素的影响程度结合起来,预测现象的发展程度。范例分析某企业近5年的销售数据如下表:上面的资料是以月为单位的,为简化计算,先把资料转换成以季为单位的时间数列,然后进行分析,变换后的资料如下表:1、确定季节指数从调整后的数据可以看出,销售额的变化既有明显的季节变化因素,又有明显的长期趋势,随着时间的变化,销售量不断增加。所以首先确定季节因素。采用前面介绍过的长期趋势剔除法(回顾:季节变动分析):第一步对原数列进行四项平均,分离出季节变动和不规则变动数值S*I;第二步对计算结果进行整理,确定出季节指数。计算过程以计算表的形式展现;调整系数=400%/399.61%=1.00097调整后季节指数=调整系数*调整前季节指数2、确定趋势方程通过四项或十二项移动平均以后,消除了季节变动和不规则变动的影响,这样调整后的数值只包含长期趋势和循环变动。可以列出下表:使用Excel作出散点图,并添加趋势线,得到最小二乘法计算出的趋势方程:循环变动的确定只能反映过去围绕趋势线变化的特征,不能预测未来的状况,而不规则变化在一段时间内又可以相互抵消。所以,在一般分析中只研究长期趋势和季节变化就可以了。3、预测根据前面的分析,可以对未来进行预测,例如,预测2016年1季度的销售额。首先,确定时间X的值,X=16+3*1=19;其次,确定长期趋势值,Y=19*0.9278+19.434=37.06最后,假如季节因素,得到所需的预测值;2016年1季度预计销售额=T*第三季度的季节指数=37.06*70.51%=26.13;本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者 。
2016年10月27日
218 阅读
0 评论
0 点赞
2016-10-26
小白学统计(78)季节变动分析
基础准备 时间数列分析基础; 长期趋势分析; 时间数列构成因素:长期趋势、季节变动、循环变动和不规则变动;季节变动是非常重要的影响因素,分析季节变动可使生产企业根据季节的变化,合理储备各种生产原料,以保障生产正常进行,也可以使商业企业合理进货,从而合理控制现金流。另外,通过对季节变化的分析测定,消除季节因素对时间数列的影响,以反映其他因素变化。季节变动分析是以月或季为单位的时间数列,测定以年为周期随季节转变而发生的有规律的周期变动。为了消除偶然因素影响,一般应使用多年(至少三年)的历史资料。分析季节变动的方法很多,这里介绍两种:同期平均法和长期趋势剔除法。同期平均法同期平均法计算简单,容易理解,用一张表即可:从表中可以清楚知道每个季度的季度指数。但是这种方法计算的结果误差较大,因为这种方法没有考虑到长期趋势变化的影响,从上表的合计可以看出,每年数据都在上升,有明显的长期趋势影响。如果只分析季节变化时,应该对长期趋势的影响予以扣除。长期趋势剔除法这种方法是先确定出各期的趋势值,然后再从观测值中扣除趋势值,从而测定季节指数。下面举例说明:将上面的数据做散点图:从图上看,虽然每年的数据起伏波动较大,但是这种波动具有明显的规律性,即每年第一季度和第三季度的销售量相对较低,而第二季度和第四季度的销售量相对较高,这说明销售量的变化受季节变动的影响。同时随着时间的推移,销售量又逐年增加,这说明销售量的变化也受长期趋势的影响。因而,为了准确的确定季节指数,就需要剔除长期趋势对销售量的影响,即应该采用长期趋势剔除法。分析步骤如下:1、对给定的数列先进行四项(以季为单位的资料)或十二项(以月为单位)的移动平均,从而消除不规则变动(I)和季节变动(S)影响,得到趋势分量(T)和循环分量(C)。2、从原数列中扣除长期趋势和循环分量影响,分离出季节分量和不规则分量(S*I):S*I=Y/T*C例如:2011年1月数据,S*I=Y/T*C=1/7.125=14.04%;3、从季节分量和不规则分量(S*I)中应用平均法消除由于偶然因素引起的不规则变动的影响,分离出季节指数(S)。调整前季节指数:每年同一个月的均值,例如2011年1月,(67.02%+44.77%+68.93%+83.93%)/4=66.16%,即将季节分量和不规则分量经过简单平均消除不规则变动的影响后,分离出调整前季节分量。调整后季节指数:从理论上说,如果没有季节因素影响,各期季节指数都应该是100%,12个月的季节指数之和应为1200%,实际为1198.13%,所以调整系数为:调整系数=1200%/1198.13%=1.00016;然后用调整系数乘调整前季节指数得到调整后指数,计算结果如下:本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者 。
2016年10月26日
127 阅读
0 评论
0 点赞
2016-10-26
小白学统计(79)循环变动和不规则变动
基础准备时间数列构成四个影响因素:上期趋势、季节变动、循环变动和不规则变动,已经介绍两种(长期趋势和季节变动),回顾历史文章: 时间数列分析基础; 长期趋势分析; 季节变动分析; 循环变动分析循环变动是指一年以上的周期内,时间数列沿着长期趋势直线上下波动变化。循环变动分析过程如下:1、首先将原始数据(按月、季、天等)构成的时间数列,调整为以年为单位的时间数列。因为在影响时间数列的四种因素中,季节变动是一年内的有规律变化,不影响其它年份,所以使用以年为周期的时间数列消除了季节变动影响,只反映长期趋势、循环变动和不规则变动的影响。2、利用趋势方程确定长期趋势T。3、不规则变动假定为随机变量,在一段时间上的变化总量趋于0.4、确定循环变动C。循环变动可以用趋势百分数表示,公式如下:趋势百分数(C)=实际观测值(Y)/长期趋势值(T)*100%范例分析某公司近9年的销售情况如下表:用最小二乘法,计算过程可回顾:长期趋势分析,趋势方程为:T=12.67+1.5XT为长期趋势值。可列出循环变动计算表:可以看出,实际值围绕长期趋势直线波动幅度在74.96%至118.39%之间。用循环变动百分数可以描述过去循环变动的变化情况。但是由于影响循环变动的因素难以预料,所以不能进行未来推断。不规则变动从时间数列中剔除长期趋势、循环变动和季节变动后,还有不可预测的不规则变化因素保留下来。不规则变动的原因有时很明显,有时又难以捕捉,所以不规则变动具有不可预见性,不能用确切的公式加以确定。由于不规则变动的随机性,在一段时间内这些随机因素可以互相抵消,这样,在对时间数列的变化因素进行分析时,可以不予考虑。例如上面例子中,以年为单位的时间数列,不规则变动因素可以忽略不计。本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者 。
2016年10月26日
119 阅读
0 评论
0 点赞
2016-10-25
小白学统计(76)时间数列分析基础
什么是时间数列分析?时间数列也叫动态数列,是指把某种现象在不同时间上的各个变量值按照时间的先后顺序排列而形成的一种数列。时间数列由以下两个因素组成:1、时间要素,某一现象发生的时间,包括时间单位和时间长短;2、数据要素,即现象在不同时间上的变量值。时间数列不论其数值大小,每一个数值所在的位置都是由它所处的时间决定的,即数字顺序是按时间的先后顺序排列。时间数列的作用:1、深入揭示现象变化的数量特征;2、反映现象发展变化的趋势和规律;3、揭示现象变化的内在原因,为预测和决策提供可靠的数量信息。某零售店制作的时间数列表时间数列分类1、按研究对象的数量分类。可以分为一元时间数列和多元时间数列。上表就是一元时间数列。但是,如果按年、月的顺序排列气温和降水量等,每一时间上都对应两个变量,则为多元时间数列。多元时间数列,不仅可以描述变量的变化规律,还可以揭示各变量间相互依存关系的动态规律性。2、按时间的连续性分类。可以分为离散型时间数列和连续性时间数列两种。比如上面表格就是离散型时间数列;食品厂油炸机上的温度监控图就是连续性时间数列。3、时间数列按照变量值的表现形式不同,可以分为绝对数时间数列、相对数时间数列和平均数时间数列三种,绝对数时间数列是基本的。绝对数时间数列绝对数时间数列又可以分为时期数列和时点数列。时期数列中的每一个数值都表明现象在一段时间内所达到的总量,例如上表销售额就是时期数列;时点数列的每一个数值都放映某种现象在一定时点上所达到的水平或所处的状态,例如库存表就是实时的库存情况。相对数时间数列相对数时间数列是把同一性质的相对指标按照时间顺序排列,用以说明现象之间数量关系的变化过程。相对数是将有联系的变量处理后得到的数值,例如,实际值与计划值相比,用来表示计划完成的情况。平均数时间数列平均数时间数列是把一系列同一性质的平均指标数值按时间顺序排列而形成的时间数列,用以放映现象的一般水平在时间上的变化。例如做长期趋势分析用到的移动平均法。时间数列制作原则时间数列的目的,是为了通过对时间数列的对比分析,放映现象的发展变化过程及其发展变化的规律性。为此,必须保证时间数列中的各项指标数值具有可比性,主要包括以下几个方面:时间上的可比性时期数列中各项指标数值与时期的长短直接相关,因而,在同一个数列中,各个指标数值所属的时间长短应尽量一致,但这个原则不是绝对的,有时为了特殊需要,也可以编制时期不同的时期数列。对于时间数列,则不一样,因为时点数列的各个指标与时期长短无关,可以根据需要而定。总体范围的可比性这里的范围是指所研究现象的空间范围。例如,现象所包括的地区范围、隶属关系范围、分组范围等,这些范围在不同的历史时期会有变化,对指标产生影响,从而失去可比性。因而对总体范围有变化的资料,必须加以调整,以保障所编制的时间数列具有可比性。指标内容的可比性只有同质的现象才能进行动态对比,时间数列中的每一个数值都具有一定的社会内容,而不是一个抽象数字。各项指标数值的计算方法、计算单位以及计算价格等的可比性如反映劳动生产率变化时,指标值是工人生产率还是全员生产率;是以产值计算的,还是以实物量计算的前后应保持一致。排列价值指标时,是以现行价格,还是以不变价格计算,因为一般现行价格在不同时间不具有可比性,因而一般价值指标应按不变价格的形式进行排列。构成时间数列的因素时间数列能够构成,是因为现象的发展变化是多种因素影响的综合结果,由于各种因素的作用方向和影响程度不同,使具体的时间数列呈现出不同的变动形态。时间数列分析的任务就是要正确地确定时间数列的性质,对影响时间数列的各种因素加以分解和测定,以便对未来的状况作出判断和预测。这些因素按照性质可以划分为:长期趋势、季节变动、循环变动和不规则变动。长期趋势(Secular Trends)由于某种根本原因的影响,客观现象在一个相当长的时间内所呈现出来的持续增加或持续减少的一种趋势和状态。例如:随着经济条件、医疗条件的发展,人口出生率有高于死亡率的趋势;随着劳动条件和手段的改善,劳动生产率有上升趋势等。季节趋势(Seasonal fluctuation)由于季节的转变而使时间数列发生周期性变化。这种周期性变化是以年为周期的可以预见的变化,因而放映季节变化的时间数列的数值资料所属的时间一般以月、季、周等为单位,而不以年为单位。引起季节变化的因素有自然因素,也有人为因素。例如,由于自然气候条件变化,使一些经济现象呈现季节变动:蔬菜产量、食品价格、羽绒服销量等;由于人为的社会条件变化而引起的季节变动,由于节假日或风俗习惯等引起的某些产品的销售量变化。循环变动(Cyclical movement)是指时间数列以若干年为周期的波浪式变动。这种变动的特征:现象的增加或减少交替出现,但持续的周期不因它的波动按任何既定的趋势变化,而是按照某种不可预测方式进行涨落起伏波动,最典型的周期波动是商业周期。不规则变动(Irregular fluctuations)由于一些随机因素的影响,而是时间数列产生的不可预测的不规则变动。上述四种影响因素有时可能同时出现,共同影响某一现象的变化,有时也可能只有几种因素其作用。一般情况下,长期趋势是影响时间数列变动的基本因素。上述四种因素和现象总量之间的关系可以是:1、加法模型现象总量=长期趋势+季节变动+循环变动+不规则变动适用于四种因素相互独立的情况。2、乘法模型现象总量=长期趋势*季节变动*循环变动*不规则变动本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者 。
2016年10月25日
123 阅读
0 评论
0 点赞
2016-10-25
小白学统计(77)长期趋势分析
基础准备 基础概念回顾:时间数列分析基础; 构成时间数列的因素可以分成四类:长期趋势、季节变动、循环变动和不规则变动。其中长期趋势是由根本性原因引起的,客观现象在一个相当长的时间内所呈现出来的持续性增加或减少的一种趋向和状态。研究长期趋势的目的主要是为了认识和掌握现象发展的规律性,为统计预测提供必要条件;同时,也是为了将其从时间数列中剔除,以便分析其它因素对时间数列的影响。测定长期趋势的方法有很多,下面介绍两种常用的方法: 移动平均法; 最小二乘法(趋势方程法); 移动平均法 移动平均法的实质是通过对变量值进行平均的方法,对原来的时间数列进行修匀,以消除季节变动、不规则变动等其他因素对数列产生的影响。移动平均法又可以分为简单移动平均、加权移动平均和指数平滑三种形式。简单移动平均简单移动平均的基本过程如下:首先,确定移动的项数k,即每次平均时所包含的变量值的个数;其次,从时间数列的第一个变量值开始,每次向后移动一项,分别计算出k各数值的序时平均数;最后,将计算出来的每个移动平均数的数值与它所对应的时间对应排列,编制成一个新的时间数列。举例说明:某玩具公司近10年的销售数据及其移动平均表格从上表可以看出,对原时间数列来说,总的趋势是逐年增加,但对于个别年份来说,有下降的情况,这是由于一些不可知的偶然因素影响造成的,为消除这种偶然因素的影响,可以进行移动平均。进行移动平均后得到新的时间数列没有上下起伏波动,可以明显放映销售量变化的总趋势。应用移动平均法进行趋势分析有几个注意点:1、应合理选择移动项数。移动项数越多,修匀效果越好,但新时间数列项数越少,不利于进行长期趋势分析;反之,移动项数越少新数列项数多,修匀效果不好。所以应根据所研究对象的具体特点,来确定移动的项数。如果原数列指标数值有周期性变化,应以周期的长度作为移动的项数。例如,季度资料作四项移动平均,月资料作十二项移动平均,这样可以消除周期性的季节影响。2、利用平均法进行长期趋势分析时要有足够的资料,否则不能如实放映现象固有的变化趋势,这也是进行长期趋势分析的前提条件。3、移动平均后的数值要与原数列时间对应。如果是奇数项,平均数落在中间项上,例如,进行3项移动平均,移动平均数落在第2项((k+1)/2);如果是偶数项,平均数落在两项中间,还应进行项数为2的移动平均,如下表:4、移动平均法一般只适用于具有直线趋势的时间数列。加权移动平均法简单移动平均法每个观测值都用相同的权数,即假定过去各期的资料对预测期的影响程度相同。但在加权移动平均中,每个观测值被赋予相应的权重。例如,在大多数情况下,越近的资料应该有最大的权重,而较远的资料的权重较低。还是以上面例题作解,采用三项加权移动平均,最近时期观测值的权数为最远时期观测值的3倍,中间时期观测值的权数为最远时期的2倍,结果如下:以第一项为例说明:1/6*5+2/6*7+3/6*10=8.17。如果相信较近时期的历史资料比较远的资料对预测未来更合适,则应该给予较近的资料更大的权重。对于波动很大的时间数列,用相等的权重较合适。指数平滑法指数平滑法是加权移动平均法的一种特殊情形。只选择一个权数,即最近时期观测值得权数,其它时期数据值的权数可以自动推算出来,观测值离预测时期越远,它的权数就越小。模型如下:现在根据包含三个时期资料的时间数列Y1,Y2和Y3,来说明任何时期指数平滑法的预测值,同样也是时间数列以前所有时期实际值的一个加权平均数。可以得到一个结论,即任何预测值都是以前所有时间数列数值的加权平均数。平滑常数α可以选在0到1之间的任何数,但是有些α值会比其他α值能产生更合适的预测。为观察如何得到一个合适的α值,将基本指数平滑模型改写为:以上面例题讲解:如果数据波动较大,α值应取大一些,可以增加近期数据对预测结果的影响。如果数据波动平稳,α值应取小一些。理论界一般认为有以下方法可供选择:经验判断法:1、当时间序列呈现较稳定的水平趋势时,应选较小的α值,一般可在0.05~0.20之间取值;2、当时间序列有波动,但长期趋势变化不大时,可选稍大的α值,常在0.1~0.4之间取值;3、当时间序列波动很大,长期趋势变化幅度较大,呈现明显且迅速的上升或下降趋势时,宜选择较大的α值,如可在0.6~0.8间选值,以使预测模型灵敏度高些,能迅速跟上数据的变化;4、当是上升(或下降)的发展趋势类型,α应取较大的值,在0.6~1之间。 试算法:根据具体时间序列情况,参照经验判断法,来大致确定额定的取值范围,然后取几个α值进行试算,比较不同α值下的预测标准误差,选取预测标准误差最小的α。可以将平滑系数为0.3代入上面例题,比较两者的误差。最小二乘法最小二乘法就是根据数据点确定出趋势方程,这里又可以分为线性趋势分析和非线性趋势分析。线性趋势分析线性趋势分析的内容在前面已经很详细的介绍过,这里不再赘述。回顾内容请见: 相关与回归分析基础; 一元(简单线性)相关分析与回归分析; 回归参数的区间估计; 一元(简单线性)回归方程的假设检验; 范例分析:一元(简单线性)相关与回归分析; 多元线性回归分析; 范例分析:多元线性回归分析; 非线性趋势分析经济现象的特点不同,发展变化趋势也不同。可能是线性的,也可能是非线性的。在现实生活中,大量经济现象的发展变化趋势曲线形式很多,这里先介绍两种:二次方程曲线和指数曲线。二次方程曲线指数曲线如何选择分析模型由于数据特点不同,变动趋势也有差异,分析时应区分情况,选择不同的分析模型,才能更好地放映现象的趋势特征。方法一:通过散点图确定使用哪一种分析模型,这种方法很不精确,有时难以区别趋势类型。方法二:结合时间数列的特征分析,当所研究现象的一次差(数列逐期增加量或减少量)大致相同,适用直线进行趋势分析;当所研究现象的二次差(一次差基础上再逐期相减)大致相同,使用二次方程曲线进行分析;当所研究对象的环比速度大致相同时,则指数曲线较为合适。本文为专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者 。
2016年10月25日
69 阅读
0 评论
0 点赞
1
2
...
6