索 引 号:005295418/2018-00076 | 主题分类:综合政务/统计信息 | |
发布机构:中牟县统计局 | 关 键 词:综合,政务,统计,信息 | |
文 号 | 成文日期:2018-03-26 | 发布日期:2018-03-26 |
体 裁 | 生效日期 | 废止日期 |
摘要:随着我国科学技术水平的不断发展,计算机网络技术的广泛应用,我国已经步入了大数据时代。在大数据背景下,各种繁杂的数据层出不穷,一时难以掌握其基本特征及一般规律,这也给统计人员的数据分析工作增添了不小的难度。由此,对于统计软件的需要也就愈发迫切。本文以统计软件为研究对象,深入分析它的基本功能,探讨其在大数据背景下数据分析中的运用情况,以促进我国统计事业的稳步发展。
关键词:大数据;统计软件;数据分析
随着互联网、物联网、云计算等科技项目的飞速发展,大数据引领了新一轮的科学技术发展热潮,同时,也给数据分析工作增添了难度,也给统计软件的开发与更新工作带来了新的挑战。在大数据的背景下,统计软件凭借其优异的功能特性,受到了越来越多的统计人员的欢迎与使用,在具体的数据分析工作中,也起到了越来越重要且不可替代的作用。重视统计软件的运用情况及发展状况,及时更新与调整,为我国的统计事业增添力量与光彩。
一、统计软件种类的基本概述
目前,世界上的统计软件种类繁多,且一直在不断的更新换代,以便更好地满足统计人员的工作需求。下面,就简单介绍一下几款常用的统计软件。
1.SAS
SAS系统,其英文全称为STATISTICAL ANALYSIS SYSTEM,简称为SAS。1966年,由美国的NORTH CAROLINA州立大学研制开发出来的一款统计分析软件。通过多年来的更新完善与发展,虽然历经了诸多版本,且价格昂贵,但SAS系统已经享誉国际,被认为是统计分析工作中的标准软件,并广泛运用于各个领域,还起到了越来越重要的作用。尽管其现在已经尽量做到“傻瓜化”了,但还是要通过一定的训练才能熟练操作使用。所以,该款统计软件主要适用于统计工作人员和科研工作人员。
2.SPSS
SPSS,其英文全称为Statistical Product and Service Solutions,即“统计产品与服务解决方案”软件。SPSS凭借其操作简单、输出漂亮、功能齐全,价格亲民的优势,完美地完成了这一答卷,并一举成为世界上应用范围最广的专业性统计软件。值得一提的是,在国际学术界内流传着一条不成文的规定——在国际化的学术交流活动中,若某一项目的计算和统计分析工作是通过SPSS来实现的,其最终获得结果就可以免去说明具体算法的程序。可见,SPSS软件的影响之广和信誉之高。因而,该统计软件对于非统计专业的工作人员来说,是一个极好的选择。
3.Excel
严格来说,Excel是一款数据表格软件,并不算是一款专门的统计软件,但它还是具备一定的统计计算功能。而且,凡是安装了Microsoft Office的计算机,基本上都配备有Excel。同时,值得注意的是,有时安装的Office并不具备数据分析的功能,还需要再次安装。对于简单的数据分析,Excel还能胜任。一旦问题的深入,Excel就难以胜任了,需要利用到函数等,有的甚至根本就无从找寻具体的方法。所以,大部分专业性的数据统计分析工作还是需要运用到其他专业的统计软件。
4.S-plus
这是一款深受统计学家青睐并广泛使用的统计软件。不仅功能齐全,还具备强大的编程功能,使工作人员可以自行编制程序来完成相应的工作。同样,它也在进行“傻瓜化”处理,以便能够吸引到更多的顾客。
二、大数据背景下统计软件在数据分析中的运用
统计软件的运用是社会统计学领域内的重要构成,是社会科学工作的主要研究工具,也是社会研究项目转向科学化的客观标志。它能够简化比较复杂的社会现象,用客观的科学方式来进行逐一描述,以便于我们能够清楚地认识这些事物。从量的方面着手,利用统计软件来考察和分析某些社会现象,通过分析并把握它们的数量特征,以促进社会研究的客观化、科学化,准确性发展。此外,统计软件还可以利用正确精准的客观数字来综合表现大量的社会事实,准确无误地展示出国民经济状况和社会发展水平、规模,结构等各个方面的情况以及可能存在的弊端。
1.应用于单变量频数的分析
一般来说,在进行社会性的调查试验后,研究人员要根据数据变量本身所具备的数学性质,按照从低到高的顺序排列,再依据定类、定序、定距和定比四种类型来统一划分所有的数据变量,由此,便可以得到有关定类、定序、定距和定比的这四大类数据。这些数据中隐含着研究人员期待探索出来的社会现象的基本特点及发展规律。为了使之能够清晰明了的呈现在我们面前,研究人员还需对这些数据进行再一次地整理和组织。此时,拥有强大的统计绘图功能和数据分析功能的统计软件就能够派上用场了,它可以将大量的数据信息进行有序地归纳、整理,并能够通过表格、折线图,条形图等科学形式来一一构建频数分布、频率分布等项目,形象且直观地展示出这些数据的具体分布情况,从而使研究人员更好地总结出数据变量的基本特点以及一般性的发展规律,为后续的数据处理、分析工作奠定良好的基础,使其得以顺利完成。
2.应用于单变量描述的分析
社会研究的调查结果通常数量庞大,且杂乱无章,很难做到第一时间就直观的把握其基本特征,必须要进行相应的数据统计和数据分析工作。而对这些数据结果进行统一的集中趋势和离散趋势的处理工作,看似比较繁琐且复杂,其实,研究人员只要利用统计软件便可极易实现。运用统计软件可以很快地计算出集中趋势与离散趋势中包含的众数、中位数、平均值、标准差,方差等常用的测量数值,再进行一一比对、分析,可以使研究人员更加清楚地把握住一系列样本数据的一般性规律,从而有利于研究人员通过样本数据的整体分析,较为精确地对研究对象做出整体性预估。
3.运用于检验正态分布
正态分布,在统计学中具有极其重要的地位。一方面,诸多社会现象以及自然现象都可以通过正态分布来进行描述,例如:人的身高、体重,智力值等数据信息都比较接近正态分布。而另一方面,正态分布是推论统计工作的基础,其本身就具备着格外重要的统计意义。在社会统计学中,众多的数据分析工作都是在假定研究数据服从于某种特定分布的基础上来进行的,比如:正态分布、X2分布、t分布,F分布等,其中,假定研究数据服从于正态分布是一种最为常见的做法。统计软件能够绘制出相应的数据统计图,并通过比对要整理研究的变量数据的实际累积概率与正态分布的累积概率之间的符合度,来统一判定这些研究数据是否真的服从正态分布的规律。当然,实际累积概率与理论累积概率一般都是基本一致的。除此之外,也可以采用在直方图上添加拟合的正态曲线的方式,通过直方图以及这条拟合的正态曲线的展示,便可以直观地判断出这些研究数据是否真的符合正态分布,为数据分析工作的圆满完成贡献了力量。
4.运用于单均值和单比例假设的检验
一般来说,对于单个总体数据的平均值和比例假设的检验方法主要有两种——Z检验和t检验。调查数据的样本容量其大小不同,所要采用的统计数量也不尽相同。大样本一般采取用Z检验法,而小样本则一般采取t检验法。当样本较大时,t值的分布比较接近于正态分布,不论是使用t检验法,还是Z检验法,得到的数据结果差别不大,二者任选其一即可。此外,Z检验法还可以看作是t检验法的特例。因而,无论调查数据的样本容量的大小究竟如何,都可以采用t检验法进行统一检验。运用统计软件,则可以更好地使用这些检验方法,以得出更加准确的研究结果,从而完善整个数据分析工作的最终成果。
统计软件除了运用于上述几个方面外,还具备了其他方面的功能。比如说:统计软件不仅能够提供基础性的单变量统计分析,还能够运用至双变量统计工作。其运用的环节包括:平均值的差异比较与检验工作;数据的交互分类和X2检验工作;数据的相关测量和检验工作;以及数据的方差分析工作等。又比如:统计软件还能够提供多变量统计的工作服务,具体表现为:运用至数据的偏相关分析;以及运用至对数的回归分析工作等。
总结:大量的社会现象看似纷纭繁杂,毫无头绪可言,而通过数据分析工作则可以改变这一局面,它可以使这些不确定的无序现象转变为正确的有序模式,挖掘众多随机的偶然现象背后隐含的统计规律,促使我们更正确且深刻地认识这些社会现象。为此统计软件的运用完美地实现了这一目的,在具体的数据分析工作中起到了重要的作用,因此,在大数据背景下,注重统计软件在数据分析中的运用,非常有必要,有利于促进我国统计学及统计事业的发展。
参考文献:
[1]徐艳清,周焕启.大数据背景下高职院校统计学运用SPSS软件研究[J].山东工业技术,2015,(7):171-171.
[2]文颖.大数据时代数据分析中统计软件的运用研究[J].信息与电脑:理论版,2017,(6):97-98.
[3]黄赟茹.大数据时代学习平台的数据统计分析功能研究--以Canvas和Sakai系统为例[J].情报工程,2016,2,(3):43-52.