欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

大学数学统计学大全11篇

时间:2023-08-04 17:00:16

大学数学统计学

大学数学统计学篇(1)

大连市社科联(社科院)与大连市高校工委2013—2014年度联合立项课题“大连市大学生科技创新活动现状及对策研究”(2013dlskybgx45)

【摘要】众所周知,大学数学是大学四年学习期间的重要课程,是一门除文史类专业以外,各个专业都要学习的必修课程,该门课程的学习为学生们获取高等数学,基础统计学,基础线性代数知识提供最根本的基础,近几年,各个大专院校已经将统计学的学习深入渗透在大学数学的课堂中,这不仅仅是为了要给予学生们更广阔的知识面,更是为了要提高大学数学与统计学结合的应用性,提高学生们利用统计学解决数学问题的基本能力,让学生们学会运用计算机软件进行统计学操作,将数与型巧妙的结合起来,培养学生们的理论素质和实践技能.本文将就此展开论述,具体说明大学数学与统计学相结合的必要性及应用技巧.

【关键词】大学数学;统计学;技巧

一、大学数学与统计学的异同分析

1.大学数学与统计学的共同点

(1)理论基础相同

大学数学作为大学课堂中的公共必修课,它包含着无穷的力量与解决大量问题的根源,而统计学作为大学数学中不可分割的一部分,也拥有着迷人的魅力,它们有着共同的理论基础,它们都是以变量为研究对象,用观察到的或者已知的数据经过计算得到我们想要的结论,无论是大学数学还是统计学,解决问题而得到的结论都是以数据为基础的,并且是以数据为核心解释结论的.从而,我们可以得到一些客观现象的发展规律,并为其进行合理的解释.

(2)解决问题的方向相同

大学数学和统计学的学习都是要在数字的基础上,寻找变量之间的依赖关系,这种依赖关系可以体现为函数,等式,不等式,方差,标准差等等.二者在学习的过程中虽然是分开进行的,但是它们对于人类社会却体现着相同的作用,大学数学和统计学都是用数字的形式来解决问题,在自然科学,社会科学,工程技术,管理学,金融学等各个方面发挥着重要的作用.

2.大学数学与统计学的差异点

(1)计算方法不同

大学数学和统计学的不同之处主要是计算方法不同,大学数学的计算方法比较多元化,它包括数形结合方法,极限求值方法,分布讨论方法,辅助线法,假设法,公式法等,而统计学的计算方法比较单一,主要是依靠数据的大量收集,汇总,利用固定的统计学公式进行基本的求解,近几年,由于社会经济的不断进步,出现了很多繁杂的经济统计及工程统计问题,这些问题的解绝不是只凭简单的动笔计算就能解决的,因而,现在的大学课堂中的统计学学习引进了计算机统计学软件操作的办法,运用计算机嵌入统计学公式,并进行计算的方法已经深入人心.

(2)学习内容不同

大学数学与统计学的另一个不同点是学习的内容不同,虽然二者的理论基础相同,解决问题的方向相同,但二者所学习的主要内容还是有差异的,大学数学所学习的内容主要倾向于函数,积分,线性,向量等的抽象计算.而统计学分数理统计和经济统计两个方向,其中数理统计是属于数学里面的一个分支,经济统计是偏向统计学知识在经济中的应用的.它所学习的内容只要倾向于事件的统计,概率的计算与分析等形象的计算.

二、大学数学与统计学结合的技巧分析

1.利用大学数学的估算进行统计分析

在很多利用统计学解决的实际问题中,都会发现数据很难收集的情况 ,由于现实环境的影响,我们往往不能准确的数据收集起来,也无法准确的将数据与统计公式中的未知量一一对应,然而解决这一屏蔽的技巧是利用大学数学中的估算方法,将数据合情合理的进行分区域收集,将收集到的数据进行估计.估算出适合我们代入公式计算的形式.这一方法不仅可以减少计算中的麻烦,还可以节省时间,提高效率.

2.利用大学数学的数形结合进行统计分析

数形结合思想是古往今来流传最为长远,应用最为广泛的思想,数型结合思想是将数据与图形恰当的结合在一起,用图像直观的诠释数据的含义,有数据对图形进行科学的证明.这是统计学中最为常用的技巧之一,在利用统计学解决经济问题时,我们常常会遇到繁琐的大量的数据,例如,比较两种股票在同期交易日中的股价及受益值等,这样的问题看似简单,但需要我们将收集到的大量数据进行汇总,一一列出,并计算各自的收益值,这是一个简单易懂的问题,但是在操作过程中会由于数据的庞大而容易出错,我们可以借助在计算机上画出表格图形的方法,嵌入公式,进行计算,这种计算方法既简单又快速.

3.利用大学数学的公式法进行统计分析

公式法是大学数学中的灵魂,是贯穿整个大学数学学习的基础,由于大学数学与统计学的理论基础相同,所以,我们可以借助公式法来为统计学的计算提供理论条件.例如,在计算偏斜度与矩偏度系数等一些复杂问题时,我们会发现统计学公式很繁琐:

此时,我们需要借助大学数学中的公式法计算法则及技巧,对这些繁琐的统计学公式进行拆分或者整合,最终得出答案.

大学数学统计学篇(2)

【基金项目】贵州省科技厅、贵州民族大学联合基金(黔科合J字LKM[2011]09号)

【中图分类号】G642 【文献标识码】A 【文章编号】2095-3089(2014)08-0235-01

1.引言

“大数据”时代的来临和“大数据”处理技术的发展深深的影响着统计学的发展。能否利用传统的统计理论和统计方法对海量的数据做出快速、准确的处理并获取相关信息?如何对传统的统计理论与方法进行改进或探索新的统计理论和方法来对大数据进行挖掘与处理以获取信息?如何在“大数据”时代背景下培养符合市场需求的统计分析师或数据分析师?如何将“大数据”处理技术融入相关统计学课程教学以促进数据处理与分析技术的发展?这些都是我们在统计学相关课程教学过程中必须思考的一个问题。

2.大数据与统计学

“大数据”随着社交网络、物联网、云计算等的兴起而产生。一般认为大数据具有规模性、多样性、实时性及价值性四个基本特征,包含分析、带宽和内容三个要素。“大数据”在数据来源、数据结构和处理方法方面对传统的统计分析方法产生了冲击。第一,在大数据背景下,数据来源不再是原来的简单抽样,而是“样本即总体”,直接将总体作为研究对象。第二,在大数据时代,研究对象也不是原来单一的结构化数据,由于数据的多样化与规模化,我们更多的是研究非结构数据,采用人工智能来进行数据挖掘和信息获取。第三,数据处理方法也不是简单的采用传统的假设检验方法进行研究,特别是对于统计学中的异常点,不再采取以往的丢弃或者平滑处理方式。

“大数据”处理技术对统计学的发展提出了巨大挑战,但我们必须认识到学科之间的发展是相互交融的,“大数据处理技术”其本质上是数据处理与分析技术,其发展对统计学学科的发展也有积极的一面,同时统计学作为一门独立的学科,有其自身独特的学科优势。首先,海量的数据有利于提高各类统计分析的精度,如减小抽样误差等。其次,较之于传统的统计学方法,现有的“大数据”分析方法难度较大、成本较高、耗时较长。而在实际的应用中,我们关心的不是数据量的多少,而是数据量所蕴含的信息。传统的统计学分析方法是以较少的数据进行精确度相对较高的统计分析,这是“大数据”分析所无法替代的。另一方面,统计学在数据收集方法、模型选择、模型假设以及模型诊断方面有很大优势。而且并不是所有的问题都具有海量的数据,并不是每一个“大数据”问题都适合用现有的“大数据处理技术”来处理。

3.对策与建议

3.1 夯实基础教学

针对以上的分析我们可以看出,大数据对统计学的发展既是机遇,又是挑战。因此我们在教学过程中要夯实统计学基础知识的教学,讲清楚统计学的基本原理与基本方法,特别是数据分析与数据处理的基本原理与方法。对于许多传统领域,如生物、医药以及质量与可靠性工程等,我们面对的多是“小数据”而不是大数据,因此基于样本的统计分析方法仍然是进行此类问题研究的最有效的科学手段。

另一方面,我们要结合大数据技术的特点,对统计学的基本知识进行拓展教育,引导学生思考怎样将已有的统计学基本原理与方法运用到大数据处理的技术研究中。如在大数据环境下怎样进行数据的收集、筛选与甄别、存储与分析等,如何分析并厘清可能的数据来源与范围,如何建立相关指标体系并对数据进行分类,如何制定或调整相应的统计参考标准,以及如何对依靠非传统数据源加工生产的统计数据进行规范的统计推断等。

随着大数据时代的来临,各行各业对具有统计背景知识人才的需求必定越来越多。因此,在统计学教学过程中,一定要结合各专业的特点,特别是“大数据”的特点,切实加强统计学的基础知识教学与拓展教学。

3.2 加强统计学专业软件教学

“大数据”环境下,对统计人才需求也发生了变化。面对海量的数据与多样化的数据,一名合格的统计人才或数据分析人才不单需要良好的统计素养与扎实的统计基础知识,更需要具有数据的存储与整理能力、计算能力以及数据分析与处理能力等。这就要求在教学过程中,加强统计软件或数学软件的教学。

针对传统的“数学证明+手工计算”或“重理论轻专业统计软件”的统计学课程教学模式,可将统计软件或数学软件融入课堂教学并安排一定的课时上机学习统计软件,以此提高学生数据处理能力,加深对统计学基本原理的理解与掌握。

在加强统计软件或数学软件,如SPSS、R、SAS以及Matlab的教学过程中,要摈弃“会软件的操作即会统计技术”的思维,要让学生真正掌握相关操作与相关算法,深入思考算法的实现与相关理论的应用。同时引导学生思考对“大数据处理”的技术要求,包括数据搜集、发掘、存储以及计算分析过程中的算法与设备要求等,引导学生针对大数据进行软件升级与开发。

3.3 突出案例教学与实践教学

大数据的产生和发展源于规模经济问题或超规模经济问题的研究。每一个大数据问题的研究都是与实际经济或社会问题紧密相联的,因此,在实际教学过程中,要突出案例教学与实践教学,由易到难,通过案例教学逐步引入大数据的概念以及大数据处理的基本技术,提高学生的分析全局观以及进行实际数据分析与处理的能力。

教学改革的目的是培养在“大数据”时代背景下,符合市场需求的专业统计人才,而合格的专业统计人才必须具备良好的统计实践能力。案例教学与统计实践活动是培养学生统计实践能力的有效途径。因此,在教学过程中,一方面,教师可融合各种与实际问题相关的案例进行分析和讲解,加深学生对相关统计理论知识的理解,激发学生的学习兴趣,培养学生解决实际问题的能力。另一方面,教师可以组织多种形式的课堂或课堂外的统计实践活动以培养学生统计实践。如,指导学生针对他们感兴趣的与经济、社会发展相关的统计实际问题展开统计研究,设计调查问卷,收集数据、整理和分析数据,撰写研究报告,实现对实际问题的分析和解决等。

4.结束语

总之,在“大数据”环境下我们既要积极面对挑战,又要紧紧抓住机遇,切实结合“大数据”的特点和“大数据处理技术”发展的需求,既加强对传统的统计学方法、统计理论的教学,又积极开展 “大数据“环境下的拓展教学,推动统计学的发展,在数据收集、数据分析以及统计制度等方面进行改革和创新。

参考文献:

[1]李国杰. 大数据研究的科学价值[J]. 中国计算机学会通讯,2012,8(9) .

[2]姜奇平. 2013 全球大数据-大数据的时代变革力量[J]. 互联网周刊,2013,1.

大学数学统计学篇(3)

中图分类号:G642.0 文献标识码:A 文章编号:1672-1578(2017)05-0027-01

当今社会是信息爆炸的时代,随着数据可获得性的提高,数以海量级的数据有待于我们处理。作为一门处理分析数据的学科――统计学,其教学面临着诸多挑战,为了适应当今时代的需求,统计学课程的教学迫切需要进行多方面的改革。那么如何改进传统的教学模式,培养出能够适应“大数据时代”需求的专业人才?是值得我们深思的问题,对该问题进行探讨具有深远的意义。本文从当今社会人才需求方面,探讨如何进行改革,来寻求最优的教学模式和方法,来为社会输送优质的统计专业的毕业生。

1 传统的统计教学中主要存在的问题

1.1 就教学内容而言,偏重于理论

在大多数高校中,目前对于统计学课程的教学仍然是偏重于统计理论的讲解,学生大多数是采用死记硬背或者习题训练的方式来掌握统计理论。虽然他们能够记住统计理论或一些统计模型,但是却无法将所学的知识应用到实际中,来解决实际问题。学生不知道为什么要学习统计学,学习该课程有何用途?因而很难提起学生们的学习兴趣。学生往往在了解所学的内容可以解决什么问题后,才会积极主动的去学习,这便要求老师在课堂教学中,摒弃偏重于理论教学的枯燥教学模式,更多的抛出生动的实际问题,来调动学生的积极性。

1.2 统计教学过程中上C实验课较少

在目前的统计教学过程中,鉴于课程内容较多,而教学课时量有限,这便使得上机实验课在课程中所占的比例较少,大多只有几个学时的上机实验课。致使很多需要上机实践的课程内容无法实现。这非常的不利于学生现学现用, 而只能是让学生简单了解一下统计软件的基本操作流程,这即利于学生掌握课堂知识,也不利于调动学生的学习积极性。

1.3相对于中国统计实践的需求,统计教学的发展较为滞后

统计学是一门搜集、整理、分析数据的学科,学习统计学的目的是通过探索数据的内在规律性,来客观、科学的认识客观事物。统计数据源自于实践,及时、准确、完整的统计数据是我们进行统计分析的前提,否则,统计方法将无用武之地。随着计算机技术的快速发展,数据的可获得性大大提高,我们已经步入了大数据时代,此时,传统的统计学理论或方法已不再使用,迫切需要在我们的教学过程中引入新的内容来适应时代的发展。但是,在统计学的教学过程中,教学内容并没有随着社会的发展而有所变化,不仅如此,在统计学的教学案例中,大多数还是采用比较陈旧的数据,并没有及时更新数据,数据质量不高。

2 大数据时代对统计学教学改革的需求

在当今大数据时代,数据已经成为了一项非常重要的资源,它同矿产资源、石油资源等一样的重要,并且数据资源有其特别之处是越用越多。大数据方面的人才在各国较为紧缺,在能够做数据分析的人才里面,统计学专业有其独特的优势,统计人才是数据分析的核心人才。这是我们统计的发展机遇,也是挑战。因为传统的统计教学已经不能够适应当今社会对统计人才的需求。改革开放三十年来,我们的统计学教材并没有随着社会的变化而变化,教材已经不能够反映社会的需求,在我们的教材中有些部分花费了很大的篇幅来介绍一些简单的计算方法,但是,随着计算机的普遍,这些方法,计算机一点就能够解决。

有人说21世纪是统计的世纪,这是一个很好的机遇,需要从事统计专业的老师和学生共同努力,主动的接受大数据的知识,加强计算机能力的培养,拓宽视野,既能够熟练的掌握计算机,又能够很好的运用统计软件进行数据分析,来适应当今社会的发展。

3 关于统计教学改革的思考

3.1 构建集课堂、实验室和社会于一体的教学体系

学好统计学并不是一件易事,不仅需要掌握课堂上的理论知识,还需要步入社会去实地调查,获得一手数据,得到数据后,进一步需要我们到实验室去学习如何运用统计软件,进行处理、分析数据,从数据得到结论。因而,要达到较好的教学效果,便需要一个集课堂、社会和实验室于一体的完善教学体系。使得学生不仅掌握了基本的统计学理论知识,还能够熟练运用统计软件和计算机系统来处理现实数据,挖掘数据内在的规律性,成为当今社会需求的统计专业人才。

3.2 在教学过程中,加大教学案例所占的比例

在统计教学过程中,如果只偏重于理论教学,无疑是枯燥、乏味的。如果我们可以适当的添加一些生动的教学案例,便会调动学生的学习积极性,使其能够更好的理解课本上的内容,也会提高学生的应用能力,更清楚的明白所学内容可以如何应用。所以说案例在教学过程中非常的重要,好的案例不仅要能够体现书本上的知识点,还要考虑到所授学生的专业特点,不断的更新,有针对性的挑选一些好的案例,这有助于学生掌握如何运用统计学知识来处理所学专业的问题,提高他们的学习积极性。

3.3 教学内容上跟上大数据时代的需求

传统的教学理念和方法所培养出来的统计人才,已经不能够很好的适应大数据时代对人才的需求,当今社会需要的是具有很好的动手能力、数据处理能力和学习能力的人才。

这便迫切需要我们不断的调整教学理念和教学模式。一方面在统计教学过程中,在讲授基础知识的基础之上,突出统计方法以及统计理论的应用性,在授课过程中,帮助同学们树立起大数据的统计思维。另一方面,在教学过程中,调整传统的教学模式,尽可能的引入慕课、微课等新的教学方法,穿插一些有趣的案例,来不断的激发学生的学习兴趣。最后,统计学教师作为知识的传授者,需要不断的学习,提高自身的大数据知识水平,才能够更好的引导学生,带领他们跟上时代的步伐。

参考文献:

[1] 耿直.大数据时代统计学面临的机遇与挑战[J].统计研究,2014,34(1):5-9.

[2] 朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014,31(2):10-17.

[3] 许涤龙,周四军,李正辉.构建统计学专业课程实验教学体系[J].统计教育,2005,12(4):4-7.

大学数学统计学篇(4)

所谓大数据(Big Data),是指具有4V特征且用目前的管理、处理技术手段难以进行有效管理和分析的数据。4V的含义是数据量大(Volume Big),数据量级扩大至PB以及ZB级别;数据产生、输入和处理快速化(Velocity Fast);数据结构和类型多样化(Variable Type)及数据价值密度低(Value LowDensity)。大数据的目的是将数据转化为知识,探索数据的产生机制和过程,进行预测和政策制定。随着医学健康档案“电子化、信息化、数字化、智能化”的管理,随着物联网在医学健康领域的应用,医疗、护理、康复、保健工作流程中产生的数据存储量呈指数增长。如何有效地利用这些海量信息为健康管理、临床治疗、医院决策及卫生政策制定提供支持,是大数据时代医学信息化带来的挑战。美国国家卫生研究院(NIH)为此特设立生物医学大数据研究中心及专项基金。在我国,科技部、国家自然科学基金委、国家社会科学基金委陆续酝酿和启动了“大数据的处理与应用”系列重大研究项目。

 

统计是一门数据科学,医学统计学是关于医学健康数据的收集、整理、分析和解释的方法论学科。“大数据”处理对统计学的发展提出了新的命题,如何将“医学信息大数据”处理技术融入相关统计学课程教学以促进现代医学信息分析技术的发展?本文做了相关的分析,并提出应该思考的一些问题。

 

一、大数据对统计学原理和方法提出的挑战

 

1.统计数据产生由“问题导向”到“数据驱动”

 

目前,统计数据的产生主要是基于所要研究的问题而主动进行的“数据收集”,落脚点在于如何获取数据。在大数据时代,海量数据随处可得,由数据驱动而进行问题研究将非常普遍。那么,获得数据的关键点不在于如何获得,而在于如何识别与选择。由“问题导向”产生的结构数据是经过严格抽样设计获取的,具有系统误差小、总体代表性好的优势,但是信息量有限,且数据获取周期长。大数据流环境下,海量数据中有价值的数据可能并不多,即数据的价值密度低,且难以避免和判断数据获取的误差和偏倚。在很多情况下,统计数据不需进行抽取,而是“数据样本即总体”;同时,也要研究如何从源源不断的数据中抽取足以满足统计目的和精度的样本,这需要研究新的序贯性和动态性的抽样方法。

 

2.数据格式和结构复杂多样化

 

目前统计数据都是结构化数据,如疾病空间分布和时间序列数据等,可使用二维表格表示,可以方便地被常规统计软件读取和进行分析。在大数据背景下,除少量数据具有结构化特征外,更多的是半结构和非结构化数据,如各种格式的文档、图片、网页、图像、音频和视频等。目前,这些半结构和非结构化的大数据仅能做到初步的实时业务应用。如在研究气候变化与人类健康相关的命题时,需要处理庞大的气象数据,而80%以上的气象数据均为非结构化的大数据,如何将这些非结构化的大数据做到降维、分解和长时间序列储存无疑是统计学面临的新命题。

 

3.大数据的整合及跨库分析方法亟待建立

 

传统上,数据集的合并和拆分都是利用关系数据库技术,如共同的编码或关键字进行操作。在大数据环境,很多数据集不再有标识个体的关键字,关系数据库链接方法不再适用,需要探讨利用数据库之间的重叠项目来结合不用的数据库。此外,还可以改变分析思路,如直接利用局部数据进行推断,然后整合这些数据集的统计结论。

 

4.大数据对于统计学核心理论的冲击

 

一个新生事物的出现将必定导致传统理论和技术的变革。大数据对传统统计学原理和方法的冲击是划时代的。传统的统计学方法和理论立足于应用抽样技术在总体中抽取小样本进行分析,通过样本统计量推断总体的参数和性质。在大数据背景下,我们更关心的不是数据量的大小,而是数据所蕴含的信息量及信息的识别和选择。因此,大数据的预处理如数据清洗、纠偏完全跳出了传统小样本研究的范畴。同时,大数据充满了各种随机的、非随机的误差和偏倚,很难满足小样本数据精度和分布的要求。在大数据时代,需要进一步拓展统计思维,丰富现有统计学的理论和方法,赋予统计学新的生命力。

 

二、在大数据时代对统计学教学的几点思考

 

《“十二五”时期统计发展和改革规划纲要》中明确提出,“建立现代统计体系就是建立以现代信息技术为支撑的统计系统”。根据这个纲要,计算机技术、互联网系统、多媒体等现代信息技术在统计技术中将发挥更重要的作用。在医学信息大数据时代背景下,医学统计学教育是否能够与时俱进,迎接大数据带来的机遇与挑战?为此,笔者谈几点思考:

 

1.补充和加强数学基础和计算机应用课程

 

在大数据背景的冲击下,统计学教育首先要面临两大冲击。一是大数据背景下的统计模型将会跳出原有的传统统计模型框架,需要更广泛的学习一些数学概念,如拓扑、几何和随机场,这些数学知识将会在庞大数据分析的背景下扮演重要的角色。二是算法和计算机上的实现是传统教育面对的更大挑战,大数据环境下的数据是海量的,同时又是结构化、半结构化、非结构化的混合数据,处理这些技术需要先进的计算机技术平台。在大数据和信息化的时代背景下,在目前医学生的通识教育中,是否应该加强数学基础及计算机应用等相关课程的教育?值得思考。

 

2.渗透大数据基本知识和统计思维

 

统计思维的培养,是提高学生处理数据和运用数据分析实际问题能力的重要一环。在大数据时代,并非所有的医学健康问题都通过大数据方式去处理,基于小样本的分析仍然是最基本和最有效的实现方式。因此,传统统计学基础和原理仍然为医学统计学教育的核心和重点。与此同时,结合大数据技术的特点,对统计学的基本知识进行拓展教育,有计划地将大数据的统计分析思维渗透在教学工作中。将大数据的基础知识,如数据来源、数据结构和格式、收集和筛选,在教学中进行适当补充。引导学生将已有的统计学基本原理和方法运用到大数据处理中。

 

3.扩充实验教学内容,夯实基本软件操作

 

大学数学统计学篇(5)

[中图分类号] O21 [文献标识码] A [文章编号] 2095-3437(2015)11-0183-02

一、引言

2009年8月5日的《纽约时报》刊登题为“当今大学毕业生唯一关键词:统计学”文章。[1]文中介绍,哈佛大学人类学家格赖姆斯改行就职Google,从事海量数据的分析工作,整天就是和数学、计算机打交道,用数据分析方法改善Google搜索引擎。文中援引Google首席经济师范里安的话说:“我坚持认为今后10年最性感的工作是当统计师,我可没开玩笑!”麻省理工学院经济学家布林约夫森说:“我们进入了一个一切都可以被监测器和科学仪器数字化和记录的时代(大量数据在不断产生),但最大的问题是我们有没有能力利用、分析这些数据,让其为我们服务。”数据中有大量的珍宝。IBM组织了200名数学家、统计学家和其他数据分析大师为商业分析和优化服务,在数据中探宝,他们计划将探宝队伍扩充到4000人。网络数据的样本量打开了一个新世界,康奈尔大学克莱因伯格说,社会统计中,相比传统采访和问卷调查等形式的抽样,数百万计的网民的网络互动产生的样本量是令人惊奇的。专家警告,统计学面临着严重的危机,单就网络数据的体量就足以使得传统统计模型丧失能力,而且,数据的强相关性未必就有因-果关系。

数据在爆炸,我们在惊梦中进入了大数据(Big Data)时代,大数据正在引起一场革命,它将改变我们的生活、工作和思维[2],统计学是关于数据的科学,它迎来了一场变革,是机遇也是挑战。[3] [4]

二、大数据的产生及其特征

数据化是大数据时代到来的标志。社会网络、电子商务、移动通信、深空探测、卫星遥感、基因测序以及其他科学测量仪器时时刻刻都在自动测量和记录着数据,而且这一趋势在不断增强。2007年所有数据中只有7%是存储在报纸、书籍、图片等介质上,其余全部都是数字数据。Google每天要处理超过24PB2的数据,它是美国国家图书馆所有纸质出版物所含数据量的上千倍。科尔尼公司科学家统计结果显示,仅2012年就产生了2.5ZB的数据,并且数据产生量以每年40%的速度递增,2011、2012两年产生了全球90%的数据,到2020年将达到45ZB,这是天文数字。

我们用中国移动公司为例大致描述一下大数据的产生。2015年中国移动已经达到12.93亿个用户,用户数近似12G,给用户提供通话、短信、上网等服务。若网络流量包月30MB,每天1MB,平均每天网络数据流量达到12PB,若每天还记录用户信息(姓名、身份、职业、位置等),通话(时刻、时长、内容),短信(内容)等,保守估计所产生的数据可以达到300PB,一年将超过100EB=0.1ZB。再看这些数据的形式,它们有文字、表格、符号、图片、语音、数字、影像、上网轨迹等等,如果还考虑这些数据时时刻刻都在改变,每个用户有自己的偏好,可以想象这些数据的体量、变化性、复杂性,如果移动公司利用这些数据进行市场分析和行业规划,这些数据还具有巨大价值。图1描述了大数据的产生及其演化过程。[5]

人们从不同的方面对大数据进行了描述和定义。从特征来看,大数据具有“4V”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。[6]Volume:由于当今数据的体量大,其处理和管理只能依靠专门的技术,驾驭这些先进技术是开启大数据宝藏的钥匙;Velocity:快速处理大数据并获取有用信息;Variety:要开发利用的大数据的数据类型庞杂、数据源众多;Value:大数据中隐含着商机,隐含着企业、行业乃至国家战略决策的依据,它是煤、石油、金属矿产、水等之外的一种新型资源。

图1 大数据的演化图(据科尼尔分析修改[5])

从统计的角度,李金昌认为大数据不是基于人工设计、借助传统方法而获得的有限、固定、不连续、不可扩充的结构型数据,而是基于现代信息技术与工具可以自动记录、储存和连续扩充的、大大超出传统统计记录与储存能力的一切类型的数据。[6]

从技术的角度,维基百科的定义是,大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起被称为“大数据”。

三、大数据时代的大学统计教学

大数据时代是以数据为中心的时代,是数据驱动的时代。作为关于数据的科学,统计学面临着重大的机遇和挑战,大学统计学教学面临着重大变革。20世纪中叶计算机技术的进步为统计应用的腾飞插上了有力的翅膀,使其应用范围遍及自然科学、社会科学的各个领域,无所不在,使得统计学趋向成熟。如今计算机、互联网、云计算电子商务和社会网络等的发展又将统计学推到了风口浪尖,国际、国内很多统计学家纷纷撰文对统计学为适应新时代的发展所需的变革进行了论述。

孟生旺和袁卫[7]根据2014年11月美国统计学会的统计学本科专业指导性教学纲要,强调了4个方面:(1)数据科学日益重要,统计专业人才不仅需要扎实的数学和统计基础,还要有强大的统计计算和编程能力,可以熟练使用专业统计软件和数据库;(2)真实数据是统计专业教育的重要组成部分;(3)需要更加多样化的统计模型和方法;(4)通过语言、图表和动画等用户易于理解的方式表达数据分析结论的能力。他们还从统计方法与统计理论、数据操作与统计计算、数学基础、实践训练等几个方面对课程设置提出了具体要求。

结合他人的思想,我们认为在教学过程中必须思考几个方面的问题并进行思想方法和教学方法的转变。

(1)对数据的认识,传统统计数据类型包括时间序列数据、截面数据、面板数据以及空间面板数据等,结构性强,针对每类数据都有有效的统计分析方法和模型。然而,如上文提到的通信数据,还有社交网络记录的数据、电子商务记录的客户数据等等,它们往往是传统数据类型的混杂体,既有静态的也有动态的,既有结构性的也有非结构性的。另外,数据库与数据库之间存在大量数据交换与关联,这些数据都不适合传统统计模型,要想在这些数据中挖掘到有用信息,要进行市场分析与决策。面对这些因素,我们在教学中该如何处理,如何思考?另外,这些数据中的变量可能是一个Word文档,可能是一段语音,可能是一幅图片,是不是需要将它们都转化成数字再处理呢?

(2)关于抽样,首先由于网络和科学仪器的进步,数据获取技术得到了前所未有的提高,加上强大的计算机处理能力,通过抽取样本推断总体的属性是不是造成信息浪费呢?维克托主张,当数据处理技术已经发生了翻天覆地的变化时,抽样技术就像汽车时代骑马一样,一切都变了,我们需要的是全部数据而不是样本,统计需要“全数据模式”:样本=总体。

(3)精确与简单,维克托估计大数据中只有5%的数据是结构化的,是可以用传统统计学模型进行分析的,然而其余95%的数据是混杂的,其中隐含的信息不仅多而且可能是更有用的,如果因为追求精确性而拒绝混杂数据将是资源的巨大浪费。他认为,大数据的简单算法比小数据的复杂算法更有效,我们不应该拒绝混杂性,而要以混杂性为标准设计新型数据库进而快速有效地获取有用信息。

(4)因果与相关,相关性回答的是“是什么”,因果关系回答的是“为什么”。维克托主张,大数据时代,我们不必一定要知道现象背后的原因,而是要让数据自己“说话”,知道是什么就够了,知道了是什么就可以创造巨大的社会价值,大数据时代探索世界的方法需要改变。然而,维克托的《大数据时代》中译本作者周涛对“相关关系比因果关系更重要”观点不认同,认为放弃对因果关系的追求就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。我们同意周涛的观点,在巨大的利益面前尽快、尽量多的知道是什么是很重要的,尤其是对商业界来说。探索事物之间的因果关系是统计学的重要使命之一,然而与小数据相比,大数据中的因果关系可能被大量的混杂性掩埋,望远镜和显微镜如何有效地配合使用也是我们不能回避的问题。

统计这门学科的发展一方面必须适应社会的发展,满足社会的需求,另一方面要不断完善其理论、方法体系。这样一来,大学的统计教学既要让学生掌握传统统计学知识,又要激发和培养学生们大胆探索适应大数据时代的新思想、新方法和新应用。

[ 注 释 ]

[1] STEVE LOHR, For Today’s Graduate, Just One Word:Statistics[N].New York Times,2009-08-05.

[2] 维克托著.周涛译.大数据时代――生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.

[3] 耿直,大数据时代统计学面临的机遇与挑战[J].统计研究,2014(1):5-9.

[4] 邱东,大数据时代对统计学的挑战[J].统计研究,2014(1):16-17.

大学数学统计学篇(6)

一、引言

最早提出大数据时代到来的机构是全球知名的麦肯锡咨询公司,该公司在一份研究报告中指出:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来”。

大数据是随着互联网技术的广泛应用带来的数据量和数据类型激增而衍生出来的一种现象,但大数据一词不仅指规模大、种类多的数据集,还包括对这种数据集进行采集、处理与分析以提取有价值信息和直接创造价值的技术构架和技术过程。大数据的第一个特征是数据量巨大。截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。第二个特征是数据类型繁多、异构性突出,包括网络日志、音频、视频、图片、地理位置信息等等。第三个特征是数据价值密度较低,数据中存在大量重复性和无价值性信息或噪声。如何通过强大的计算技术和统计分析等方法迅速完成数据的价值提纯,是大数据时代亟待解决的难题。第四个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。

目前,不同的学科领域对大数据概念有着不尽相同的解释,但各种解释中大致可以从两个方面去理解。首先,大数据概念体现在数据量的巨大、种类的众多及产生速度的飞快,同时产生的数据集极有可能包含着各种半结构化和非结构化数据;其次,大数据概念还体现在对数据进行处理的手段和流程方面,由于数据量的庞大和类型复杂,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及处理。因此,所谓的大数据并不是单纯指数据流量的巨大,还指其结构的复杂和种类的多样,在数据处理和分析上需要采用高端计算平台或高级统计软件,以及海量数据中存在着可挖掘的潜在的大量价值信息与知识。

近年来,随着高速计算机的应用、信息技术的快速发展,特别是云计算技术的发展,使大数据的存储和分析技术得到迅速发展,目前的核心技术有MapReduce、GFS、BigTable、Hadoop,以及数据可视化等。在数据搜集上,可方便地通过在线互联网数据库获取二手数据或一手实时数据。在数据分析上,传统统计学方法采取的是基于统计模型的样本数据分析,而大数据分析技术则是通过高端计算平台,对大数据中的信息进行挖掘。

统计学作为对数据进行处理和分析的科学,必然受到大数据的影响。在大数据时代,统计学教育必须与时俱进,跟上时展步伐。近年来,有不少文献讨论了大数据环境下我国统计学教育的改革问题(例如[1]-[5]),本文在分析大数据时代特征的前提下,进一步讨论我国统计学教育的现状与挑战、统计学教育改革的内容、方法、借鉴和适应时代要求的变革问题。

二、统计学教育的现状与挑战

2013年,教育部对我国统计学专业设置进行一次新的调整,将原来的既可授予理学学位,也可授予经济学学位的统计学专业划分为统计学、应用统计学和经济统计学三个本科专业[6]。根据教育部高等学校统计类专业教学指导委员会2013年11月公布的数据,当时全国有194所高校开设了统计学专业,156所高校开设了应用统计学专业,164所高校开设了经济统计学专业[6]。目前,全国开设这三个统计学专业的高校个数和在校学生人数与2013年相比都有不少的增加。

面对大数据时代,我们目前的统计学教育无论在培养目标和教学内容上,还是在教育方式和人才培养模式上,都存在着亟待解决的挑战性问题。例如,在专业培养目标和人才培养过程中,我们比较重视课程层面上的评价,比较轻视专业层面上的整体评价,缺乏对学生综合能力的反馈机制。

关于教学内容,目前三个统计学专业在统计理论和应用统计两个方面有不同的侧重。统计理论主要包括:抽样理论、实验设计、估汁理论、假设险验、决策理论、贝叶斯统计、半参数和非参数统计、序贯分析、多元统计分析、时间序列分析、小样本理论和大样本理论等。在数据分析中,现今的统计方法基本以结构化数据为主要处理对象,而对非结构化和半结构化数据的分析和工具涉及较少。因此,现今统计学课程及内容已不能满足从事非结构型和半结构型的大数据研究和商业应用对人才培养的需要,必须进行必要的改革。

对于教育方式,鉴于大数据时代要求,统计分析人员需要具备较高的数学和现代统计学基础,具有较高的软件操作能力,掌握一定的大数据收集、整理、分析、处理和挖掘数据的技能。日本学者城田真琴认为:“数据科学家要有计算机科学专业背景,数学、统计方面的素养和使用数据挖掘软件的技能,善于利用数据可视化的手法展现晦涩难懂的信息,而且具备相应的专业知识、眼界和视野,具有适应社会发展和创造价值的能力”。现今的统计学教育方式还不能很好适应大数据时代数据科学人才培养需要,必须进行必要及时的调整和变革。

对人才培养模式,大数据时代不仅要求培养具有数据处理和分析所需的基本素质与技能,更重视培养从海量数据中发现和挖掘价值信息、把握市场机遇、创造利润的潜在能力。面对大数据时代的诸多挑战,现代统计技术、数据挖掘方法、计算机信息技术、软件工具和理念的日新月异,培养统计人才的教育模式也需要相应变化,统计学教育只有与时俱进,主动做出全面的调整和变革才能适应新时代知识进步和激烈人才市场竞争的需要,积极迎接大数据时代的挑战。

大数据时代对统计学教师有更高的要求,统计学教师需要与时俱进,跟上时代步伐。随着互联网、物联网、云计算等信息技术的发展,对数据的分析和处理的技术也随之要求更高,统计学教师固有的知识体系已不能满足培养现代统计人才的需要,必须进一步深化和更新原有的统计学理论知识,而且还需要学习掌握计算机技术、互联网、数据库和信息科学等有关知识和技术,同时还要熟悉处理非结构型和半结构型数据的知识和技能,以适应现代统计学教育对教师的知识结构和基本素质的要求。

大数据时代对统计专业的学生也提出了更高的要求,他们不仅需要掌握现代统计理论、统计方法和专业统计软件,还要学会如何分析、处理来自互联网或各种实际问题中的海量数据,如何利用统计软件和互联网技术进行数据操作,如何借助软件技术和统计准则判断数据质量,如何进行模型选择和评价模型方法的有效性,如何准确清晰地呈现统计分析结果和结论,等等。

2014年11月,美国统计学会了统计学本科专业指导性教学纲要 [7],该教学纲要对统计学专业提出四个方面的要求:(1)具有扎实的数学和统计学基础、强大的统计计算和编程能力,熟练使用统计软件和数据库;(2)分析来自现实问题的真实数据,真实数据是统计专业教育的重要组成部分;(3)掌握多样化的统计模型方法;(4)具有通过语言、图表和动画等方式解释数据分析结果的能力。美国是统计学教育和人才培养最先进的国家之一,该指导性教学纲要代表着美国统计学专业培养人才的基本要求和发展方向,对我国统计教育的改革具有重要的参考价值。以该指导性教学纲要为参考依据,对照我国目前的统计学本科专业教育,无论是在培养目标和课程设置方面,还是在教学内容和教学方法方面,都存在着亟待解决的挑战性问题。

三、统计学教育的改革

大数据时代的统计学教育不仅是各种统计方法、数据挖掘方法和信息技术手段的延续或发展,更主要的是这些方法的集成应用和在实际数据分析中的真实体验。过去,企业数据库价格昂贵,在统计学教育的教学案例或实验课教学中,很少采用真实和海量的数据库资源,基本都是采用过时或虚拟的数据。今天,像百度大数据引擎这样的数据库的逐步对外开放,将有助于开展“线上大数据统计实验”教学。为了适应大数据时代要求,有必要利用网络资源以及各种数据处理软件,搭建线上大数据分析实验教学平台,全面开展大数据统计实验教学的改革。实际上,借助大数据分析平台,本科阶段的统计学教育就可以融人联机分析和数据的可视化教学。其次,要时刻关注大数据分析理论的进展,及时将新理论新方法融入课堂教学内容。

需要指出的是,在大数据时代,经典统计理论和方法并没有过时,但需要进行改进和进一步发展。这是因为,网上采集的巨型数据集往往存在大量的重复性和无价值数据信息,使得大数据价值密度降低。在对这些数据进行分析处理之前往往需要通过去噪、分层、截断、聚类等方法的预处理,将其变成便于进行分析处理的小数据,继而借助于经典统计方法进行分析和处理。因而在大数据时代仍然需要采用传统统计学的小样本理论和方法。所以,即便是在大数据时代,经典统计方法仍然是进行统计分析的基石,其核心地位不可动摇。所以,在大数据时代仍然要强化统计学的基本理论和方法,尤其是在长期发展和实践应用中经过验证的、成熟有效的经典和现代统计方法,在大数据时代仍然没有过时,但需要结合大数据分析的需要对经典统计方法进行必要的发展和改进。

大数据科学需要统计学与数学、计算机等学科的结合。亚马逊大数据科学家John Rauser 认为:“数据科学家是统计学家和计算机工程师的结合体”。为了满足大数据时代的要求,统计学专业的课程设置需要进行必要的调整。应根据新时代人才培养的要求,增设与大数据前沿领域发展相关的课程,如计算机网络和大数据相关的软件应用,同时要加大实验课和社会实践课的比重,引导学生理解和掌握大数据概念、理论、技术和方法,培养其运用大数据的相关分析工具解决实际问题的能力。对于理论课程,除基本统计理论外,还应开设一些较为现代和深入的课程,如现代贝叶斯方法、神经网络、数据挖掘、应用随机过程论等。另外,还应开设与大数据分析相关的关联规则、决策树、机器学习、支持向量机等课程。

为了培养与时代适应的统计学人才,统计学专业教师应不断更新自身的知识结构和价值观念,改变认识数据、收集数据和分析数据的思维,主动学习和补充互联网、现代数据分析技术、数据库和数据挖掘技术,使自己的知识体系不断更新和提升,跟上时展的步伐。

在大数据时代,要注意培养学生适应社会的能力。统计专业人才培养模式应以提高本专业学生数据分析方面的能力,开阔他们的视野,培养其适应社会的能力。应积极引导学生进入实训场所动手操作和锻炼,尝试以企事业单位的财政、金融、保险、统计、咨询和信息公司等部门为主构建专业性教育实践基地。鼓励学生到大数据相关的机构部门、产业园区和企业中去调查研究和实践。此外,统计专业应积极同其他专业进行合作,联合培养适应新时代要求的数据分析人才。鉴于大数据对数据分析人员在计算机技术、行业认知、业务知识、数据分析工具和方法的要求提高,统计学科应主动与计算机、经济学、管理学等相关学科合作,培养学生的计算机能力、专业素质和业务修养。

“它山之石可以攻玉”,关于统计学专业的课程设置,可以参考和借鉴美国统计学会公布的统计学本科专业指导性教学纲要。根据该教学纲要,统计专业的课程设置应该涵盖五个模块[7]:(1)统计方法与统计理论。建立统计模型并对模型的输出结果进行评价,熟悉统计推断,能够从数据分析中得出恰当的结论。(2)数据操作和统计计算。熟练使用一款专业统计软件进行探索性数据分析,发现和清洗数据中的错误记录,具有编程能力和算法思维,可以进行各种数据操作,还应掌握统计计算技术,能够进行模拟研究。(3)数学基础。熟练掌握微积分、线性代数、矩阵论、概率论和数理统计的基础知识。(4)实践训练和表达能力。具有良好的表达和交流能力,善于通过图示和动画等听众易于理解的方式展示分析结论,并且具有团队合作精神和项目领导能力。(5)特定领域的知识。掌握特定应用领域的知识,并用统计学特有的思维方法来分析和解决特定领域的实际问题。

大数据时代是以数据为中心的时代,统计学专业的教育改革必须适应这个时代的要求。统计数据分析中软件应用能力至关重要。在众多统计软件中推荐使用R和SAS软件,因为R是免费开源软件,其统计建模、统计计算和可视化功能强大,更新迅速,是最新统计方法的主要平台,非常有利于培养学生的编程能力和知识更新能力,而SAS软件被很多公司用于数据管理和数据分析,在实际应用领域具有长期而深远的影响,是数据分析不可或缺的专业统计软件。当然,教学中也可以尝试使用其他专业统计软件,例如经济统计专业学生也可使用SPSS软件,但最好会使用SAS或R软件。在加强软件使用和编程能力的基础上,应加强学生统计计算和统计模拟能力的培养。在大数据时代,强调统计计算的重要性是大势所趋。统计模拟技术是伴随着高速计算机和信息技术的快速发展而广泛应用的现代技术,可用来解决传统学科领域中无法解决的问题。例如,在计算技术飞速发展的今天,贝叶斯统计方法过去曾经面临的计算瓶颈正在逐渐消失,基于马尔科夫链蒙特卡洛(MCMC)技术的统计模拟方法在数据分析中的强大威力正在日益显现[8]。

参考文献:

[1] 刘春杰,大数据时代对当代统计学教育的挑战,统计与决策,2015年,第8期。

[2] 孟生旺,袁卫,大数据时代的统计教育,统计研究,2015年,第32卷4期。

[3] 葛虹,韩伟,大数据时代统计教育变革的SWOT分析与发展策略,统计与决策,2015年,第4期。

[4] 张海波,黄世祥,统计学专业学生大数据分析能力的培养方式选择,统计与决策,2014年,第24期。

[5] 李卫东,大数据对统计学科发展的影响,统计与决策,2014年,第13.期。

大学数学统计学篇(7)

【关键词】大数据 高中统计 数据分析 内容数据链

大数据的价值性,快速性,大量性,多样性,和预测功为教育提供了一种可能目前教育的形式多种多样,慕课、微课、网络公开课等等。大数据时代下的教育是怎样的呢?是基于个性化学习,是量化的,自我组织学习内容的教育,不仅要了解学生“心声”,认知水平和学习兴趣,而且要师生互动、合作探讨学习内容,将传统课程、教学、教材的内容数据化,利用可视化技术,提高学习兴趣。提升内容吸引力。高中统计内容必须系统化、过程方法直观化,这对高中的统计内容提出了挑战。使专题块和课程案例集以数据知识链为核心,使教育在大数据时代下的“量化”。

一、高中统计内容的新契机是大数据

使教育由数字支撑变化到数据支撑。高中统计教学场景布置,统计内容设计,学习场景的变革等等过去靠“敲脑袋”或者“理念灵感加经验”的东西,在背景为物联网、云计算、大数据下,变成一种由数据支撑的“行为科学”.用数据分析的方法对高中统计内容进行分析、挖掘,利用大数据更改高中统计内容,建立主线为“统计知识链”、目标为培养“数据分析能力”首尾呼应内容数据链,使高中统计内容的系统更加优化。

由于各种原因使高中统计内容,没有得到较好的发展.直到国家教育部颁布了各种政策,统计才得以发展.然而各种问题的存在仍然困扰着我国统计教学发展。大数据关注每一位学生的个性化需求与发展,关注学生的自我意识,分析群体心理,让教师关注学生的兴趣爱好,选择适合学生的方法,让学生自主的、创新的学习。

正如教育家张韫所说:“大数据时代的到来,让社会科学领域的发展和研究从宏观群体逐渐走向微观个体,让追踪每一个人的数据成为可能,从而让研究每一个个体成为可能.对于教育研究者来说,我们将比任何时候都更接近发现真正的学生。”大数据在充分了解学生各种需求,目前处于的状态的情况下合理运用各种统计内容,各种现代化的教学方式,不拘泥于传统化教学方式,利用各种资源形成螺旋式上升的统计内容数据链。使每一位学生都乐于学习,其个性化学习需求成为可能。

二、高中统计内容数据链在大数据视域下的内涵

数据高中统计内容的核心研究对象,数据分析是重点,统计学习是在初中的基础上,进一步学习数据统计方面的各种方法;用各种操作培养学生的归纳推断能力、统计思维、数据分析素养,提升学生在数据分析方面的能力,统计内容数据链为学生统计能力的提升提供了研究平台。把课程目标,学生需求、与大数据算法,数据链式结构有机结合起来是大数据视域下的统计内容数据链核心思想,利用大数据,将统计内容数据化,增强内容的可读性,衔接性、合理性、连贯性,织成统计知识,形成统计内容数据链。例如:具体环节为:链宿是“样本估计总体、”等数据分析方法,链源是“系统抽样,等距抽样、分层抽样”,链节是的数据描述、统计图形.通过统计知识的实际应用使“统计知识链”为统计内容数据链的内化,“统计能力链”为其外化,“统计能力链”,“统计素养链”为其发展,成为对学生产生重大影响的“统计思想链”所以,利用大数据的科学方法可使统计内容体系最终形成的统计思想体系;数据结构的链式模型,将促进学生创新思维,增强学生的参与积极性,使高中统计集“知识链、能力链、素养链、思想链”于一体。

三、高中统计内容大数据视域下下的数据链设计

(一)高中数学统计内容知识结构

各种版本的高中数学统计内容都介绍了基本的获取样本数据的获取,提取方法,就是我们常说的用样本推断总体,部分推断整体.统计知识注重培B学生数据分析的能力,利用实例讲解数据的各种思想,方法结合在一起,提高学生的综合能力。例如:结合具体问题情境,学习如何进行数据收集,分析,如何思维理解其含义。

(二)高中数学统计内容的教学要求

课标充分重视高中数学统计内容,并采取了有效的改进和创新措施。教学过程中,注重学生自我特长的发展,创新教学方式,不拘泥于传统的书本知识,强调以人为本,面向未来,让学生有数据意识,学会用数据说话,将统计知识运用于实践。

(三)高中统计内容在大数据视域下数据链设计

量化教育是大数据时代的可行教育,通过数据了解学生的个性化需求,促进学生的个性发展,注重创新式培养。结合教材利用现代化信息技术设计出学生乐于接受的教学方式。从“数据读心”,到“抓心入心”,再到“知心交心”,最终形成“数据育心”的培养链是统计内容数据链的设计原则。例如:分层抽样内容数据链的设计.首先,将分层抽样知识系统化。其次,将分层抽样的过程方法直观化。最后,依据统计内容数据链的设计原则和学生个性化学习需求,动态生成分层抽样内容数据链。把具体问题数据化。使分层抽样内容数据链成为满足自我发展需要的“知识链、方法链、素材链”。

四、结语

综上所述,对统计内容数据我们应该就地取材,因地制宜,开创多种方式的教学方式,注重学生的个性化需求,不要拘泥于传统的教材,注重培养学生的创新思维和自主参与能力,要让学生发挥主观能动性,积极主动的自己去思索,发展自己的特长,学会将具体的事情数据化不用数据的思想去思考问题,去看世界,老师也要探索更好的教学方法。将现代化的科学技术与传统枯燥的教材相结合创造出一种能够发挥学生潜能,特长的教学方式,要循循善诱,引导学生。总之,统计内容数据链能更好地使学生不断提升自己的数据分析“能力链”使学生学会用统计思想、统计方法、统计思维、统计观念、统计意识来认识世界,改造世界。

参考文献:

大学数学统计学篇(8)

顾名思义,统计学几乎是对所有领域的数据进行统计与研究、分析筛选,因而统计学在如今的大数据时代几乎涉及到各行各业,其表现方式为,统计出来的数据进行科学的研究与分析,可以有效的帮着企业获取有效信息,探索其中数量规律行,进而企业可以更高效、更精准的进行工作。而如今随着现代信息技术以及数字科学技术的不断发展,统计学也得到了更多的应用,也被人们更加重视,应用最多的为企业管理系统中,统计学中的理论及其分析方式帮助企业进行对数据数量规律性的探以及定性分析,为企业寻找自身的管理经营的基础进行有效地夯实,奠定企业向更加稳定方向进行发展。而如今计算机软件的不断发展与更新,大数据时代的到来,统计学的应用也会得到更为广泛的发展,其中有政府和企业利用计算机对相关数据的采集、整理、统计进行综合的分析。统计学相关的软件开发商也将软件设计的更为简易化、便捷化,使得非统计学专业的人员也可以使用。当今社会经济高速发展,统计学的应用及其发展趋势将会迎合时代的到来进行改革改变,促进社会经济的快速提高。

一、大数据时代的内涵及其意义

(一)大数据时代的内涵

大数据是指在一定时间内对信息的捕捉、管理、处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力、流程优化能力的海量、高增长率和多样化的信息资产。针对这些信息资产,利用统计学原理对其进行数据分析、提炼、分解。也可以从另一个方面理解大数据,它涉及各行各业,是多个领域数据的集中区域,涉及到的有自然科学、人文科学、社会经济学等等相关的混合数据,它们之间相互参杂,互相融合,形成非常庞大的数据系统。目前传统统计学中的统计方法是分析单个计算机系统的数据储备,无法分析多台计算机的数据,在数据统计中产生了局限性、单一性、不稳定性和客观性等,但是目前大数据时代的到来,改变了如今这一现象,改变了大数据环境下数据流、磁盘存储、分布存储、多线条等环境。大数据环境主要起到的作用为,将庞大而复杂的数据进行转换,转换成为简单易懂、显而易见的内容,进而使工作人员对数据进行源头和机制的追述,从而研究出适合自身并有效的应对策略。因将数据转换成需要的知识需要相对缓慢的时间,所以工作人员将当前庞大复杂的数据分别存放在不同的储备空间里,有些工作人员将目前无法分析的或是不需要的数据进行整体精准的记录储存,记录成一整套的数据发展史,已供日后应用,以备不时之需,为今后科研做出充分准备。

(二)大数据时代给社会带来的改革

大数据在一夜之间成为各大互联网上的讨论话题,成为一个包含性非常强的概念,大数据时代也成为人们关注的话题,它的到来已然成为不争的事实,从本质上来看,它是当今中新型的产业,通过对海量的数据进行统计分析追踪发现庞大的市场,通过对人们行为喜好进行科学分析,获取营销手段。大数据使得广告投放精准化、医疗卫生体系精密化、社会安全管理有序化等多方面优势,同时大数据时代的到来随着带来了新的新业市场,大数据将为全球带来440万个IT岗位和上千万个非IT岗位,提供了更多的就业岗位。大数据时代到来的变革之大,影响着人们传统的工作方式,各行各业的人利用研究问题来驱动收据数据,然后再利用收集来的数据进行分析,从而解决问题,从这一行为来讲,人们会慢慢适应通过大数据进行统计学的研究分析来解决问题,利用通过统计学理论开发的软件搜索、分析一些研究性成果。目前统计学家通过数据的收集、数据的处理以及个人分析能力进行科学探索,如今大数据的到来将会威胁的他们的领域,大数据将我们难以理解的内容翻译成我们一看便知的统计成果,优化了人们工作的便捷性、舒适性等。

二、大数据时代统计学的发展研究

大数据发展如今,渗透社会的各个角落,分析大数据需要多个领域的结合,它并非单一的科学领域,自成一体,现如今的统计学家不仅需要研究探讨计算机对数据的实时决策,更是要将其与统计学理论及其方法相互结合,同时,计算机专家也要不断学习统计学的一些知识,统计学与大数据相互结合才能顺应时代的发展。获取大数据之后,研究探讨大数据时,针对数据分析的高难问题,利用统计学原理对其进行数据分析、提炼、分解时,需创新出新的更便捷更高效的统计处理方法,在压缩提炼过程中,解决数据混杂的问题,在分解数据中,解决精准问题,使得大数据与统计理论更好的沟通合作,构造全局统计结果。统计学主要是对海量的数据进行整理分类,结合计算机进行科学分析,探究出数据的数量规律性,从而得出结论,由于目前统计学中的统计学理论和统计方法与时代稍有差距,如今更是大数据时代,而大数据随机或非随机的误差比较大,所以传统的统计学理论及方法无法满足如今变革,也无法更好的获取大数据背景下所带来的各种机遇。现在的统计学家应该更加努力专研统计学理论以及对数据压缩、分解的方法,舍弃无法适应当前时代的陈旧理论及方法,必须去学习如何迎合新的事物的到来进行改革改变,只有这样才能顺势而行。

作者:宋瑞雪 周晏羽 黄扬艺 单位:沈阳理工大学

参考文献:

大学数学统计学篇(9)

全球知名的麦肯锡咨询公司最早提出了“大数据”的概念,宣告了大数据时代的来临;IBM公司指出了大数据的4个特点:数据体量巨大、数据类型繁多、数据产出速度快、数据价值密度低。[1]大数据对高等学校人才培养的影响表现在以下方面:1.思维方式与认知模式的改变;2.海量的学习对象与辅助教学资源;3.开源课程(慕课,微课、翻转课堂)的教育方式对传统教学模式产生冲击;4.新媒体模式的社会化互助学习打破教学界限;5.网络思维拓展了个体思维。[2]在这个意义上,大数据时代对高校人才培养提出了新的要求。对于统计学专业建设而言,大数据的背景既是一个机遇也是一个挑战。高等学校统计学专业需要通过整合现有人才培养资源、建立创新人才培养平台,承担起大学人才培养的责任,紧随大数据的发展趋势,占领大数据发展人才培养的制高点,体现高等学校满足社会需求、提供智力支撑的载体作用,确保大数据产业科学、健康、持续、高速地发展。本文拟从统计学专业的培养目标出发,研讨在大数据时代统计学专业学生培养各个环节的问题。

一、关于培养目标

统计学专业的培养目标是:培养德、智、体、美全面发展,掌握坚实的数学、统计学基本理论,具备扎实的经济学基础和数据分析技能,能够熟练地运用统计方法和数据分析软件进行数据分析和数据处理,能在企事业单位和经济管理部门从事统计调查、数据分析、风险决策、质量管理等工作,或者在科研单位、高等学校从事统计学研究和教学工作的高级专门人才。本专业学制四年,通过四年的学习,统计学专业的毕业生应具备以下能力:

1.掌握坚实的数学、统计学基本理论。掌握数学、统计学的基本理论、基本知识、基本方法和计算机操作基本技能;具备数据采集、调查问卷设计和数据处理的基本能力;了解与经济统计、生物统计、医学统计或社会统计等有关的自然科学、社会科学某一领域的基本知识,具备利用统计学专业知识,发现、分析、解决某一领域实际问题的基本能力;了解统计学学科的发展前沿及其应用前景。

2.具备扎实的经济学基础和数据分析技能。具备扎实的经济学基础,了解国家经济运行的基本方针、政策、法律、法规;掌握R语言,精通Python、Spark、SAS、SPSS等流行大数据处理软件中的一种,有较强的统计计算能力;掌握资料查询、文献检索及数据获取的基本方法;具有一定的从事科学研究和实际工作的能力;英语达到四级水平,计算机达到二级水平。

二、关于课程设置

1.专业主干课程包括:数学基础部分(数学分析,高等代数与解析几何)、C语言、数据库、概率论与数理统计、统计学、微观经济学、计量经济学、时间序列分析、多元统计分析、市场调查方法与抽样技术、实验设计、统计预测与决策、数据挖掘、随机过程、统计分析软件。

2.充分调研市场需求,在保证基础课程的前提下,灵活设置选修课程,机动调整培养计划及课程设置。

3.对高年级实行模块式分流,包括数据处理、数理金融等防线,并与数据分析师、市场调查师等一些职业资格考试接轨,开设相关选修课。

三、关于师资培养

师资方面,要培养、引进并举,以培养为主。主要立足于现有师资队伍,同时积极引进国内外统计学专业优秀人才,充实、提高教学研究水平。1.努力为教师的成长创造条件,支持和鼓励教师攻读统计学博士学位;积极引进国内外统计学博士。2.加强在职培训提高,深入有效地开展统计学教研活动,教师相互学习,在教学过程中不断学习,促进教师教学科研水平同步提高。3.结合课程教育,以单位进修方式对教师进行短期培训。鼓励教师外出学习,要求每人掌握\精通一门课程或一门外语;通过培训学习最新统计学,数据分析教育理念、方法、技术,提高教师的教学水平,以满足不断变化的教学需要;积极开展科研立项及学术交流活动,积极组织教师申报部级、省级教学改革项目,并积极开展学术交流活动。4.对于实战中比较流行的软件、算法、设备,聘请具备丰富经验的数据分析公司工程师来校为学生授课。

四、关于课堂教学

实践性、动手能力培养贯穿教学始终,除基础课程外,其他课程都在实验室进行教学,学用结合。数据分析语言\软件教学贯穿课程教学,如:1.基于R语言的时间序列分析;2.基于SPSS的多元统计分析;3.高等统计与SAS语言,等等。每门课程完成一个案例报告。

五、关于实践环节

(一)3+1模式

学生前三学年在学校,第四学年在实习单位学习。在实习单位的前四个月,学习数据分析实践技能,以案例教学为主;后8个月在公司、企业接触具体工作。冶金工业过程湖北省系统科学重点实验室、统计学专业实验室、湖北省统计局、武汉市统计局、广发证券等实习实训基地是学生开展实践活动的硬件保障及重要保障。

(二)校内实习

以数据挖掘技术为依托,每年为校内教务处、研究生处、招生就业处、校医院、招投标办公室、后勤等部门出具一份完整、精确的数据分析报告,确实对学校各个部门的决策起到积极作用。以项目形式申报,每年以此类项目作为统计学专业的固定训练题,或专业实践题目。

(三)参加数据分析、数据挖掘

竞赛学科竞赛为创新统计学科人才培养模式,进一步提升大学生调研能力、数据分析能力和处理实际问题能力,促进学校应用型人才的培养,同时为社会实际工作部门和高校人才培养的衔接提供一个良性平台。[5]我们要求统计学专业的学生在读期间都必须参加至少一次数据分析、数据挖掘类竞赛,通过竞赛提高学生分析、解决实际问题的能力,并以此作为创新学分的得分依据。目前学生参加的相关专业竞赛有:

1.全国大学生数据挖掘挑战赛。竞赛由全国大学生数学建模竞赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学数学科学学院协办。从2015年开始,我们组队参加这一比赛,成绩逐步提高。2015年虽然没有获得很好的成绩,但却锻炼了学生,激励了教师。参加了竞赛的学生,数据分析能力有了明显的长进,论文撰写水平也提高不少。这些学生的本科学位毕业论文内容充实,条理清晰,答辩时胸有成竹,语言流畅。一些学生因为参加过这一赛事,在找工作时增分不少,顺利签下了数据分析师的就业合同。我们教师也从这一赛事中了解了目前数据分析领域的前沿知识,感受到了和兄弟院校的差距,这促使教师积极参加国内数据分析的各种培训,钻研数据分析的最新方法与技术,提高数据分析教学能力。2016年,我校再次组队参加该项赛事,获得国家三等奖两项。

2.中国高校SAS数据分析大赛。这是由SAS中国公司发起的专门针对中国高校数据分析相关专业的一次非营利性的公益大赛。2016年,我校首次组织统计专业本科生、研究生混合组队参加了这一比赛,总共3队参加华中区初赛,1队参加复赛,在比赛中表现良好,最终获得“汇丰杯”2016中国高校SAS数据分析大赛决赛百强,并被授予“大赛优秀组织奖”。

六、就业前景

武汉科技大学从2012年就开始培养统计学研究生,2015年本科也开始招生。实际上,我们从2001年就在信息与计算科学本科专业开设了经济统计模块,2002年就开始招收数理统计方向的研究生,已经有了10届毕业生,这些学生的就业单位有政府统计局、金融行业的证券交易所、保险公司、银行、软件公司、企业里的信息中心、高校等。还有部分优秀学生继续攻读了数理统计、经济统计、随机分析等方向的博士研究生,毕业后在政府部门、高校从事研究工作。我们通过对这些毕业生的社会调查与用人单位的信息反馈,对本专业学生的社会适应能力以及社会需求有了深入的了解。这也为我们做好教学改革工作指明了方向。在大数据时代,培养符合社会需求的统计学人才,这是高等学校的责任和义务。

[参考文献]

[1]陶皖,杨磊.大数据时代对高校人才培养模式的影响-以信息系统专业为例[J].电脑知识与技术,2013(28):6340-6342.

[2]黄河燕.大数据时代计算机专业教育探讨[J].计算机学会通讯,2012(12):47-50.

[3]袁卫.机遇与挑战———写在统计学成为一级学科之际[J].统计研究,2011(11):5-7.

大学数学统计学篇(10)

2011年2月,国务院学位委员会进行了学科调整,统计学完全从数学和经济学中独立出来,上升为一级学科,设在理学门类中,编号为0714。统计学上升为一级学科后,下设的二级学科包括数理统计学、社会经济统计学、生物卫生统计学、金融统计、风险管理和精算学、应用统计学。统计学上升为一级学科对统计学专业的教学带来巨大影响。

 

同时,随着大数据时代的到来,使得传统的统计数据收集、处理与分析方法面临新的挑战,从而推动统计学的发展进入了一个全新的阶段。在统计学上升为一级学科以及大数据时代已经到来的大背景下,统计学专业的课程教学也面临着新的挑战,需要进一步改革与调整。

 

一、大数据时代的到来

 

(一)大数据的生成

 

伴随着人类对客观世界各领域数字化程度的不断提高,每天都有大量的数据产生,并且其产生的速度也越来越快。这些数据来源广泛,其中最主要的来源有:科学研究(如天文学、生物学、高能物理等实验数据)、社交网络、电子商务、物联网、移动通信等。

 

(二)大数据的定义

 

为了应对数据大规模增长带来的机遇和挑战,美国《Nature》杂志在2008年9月4日率先提出了“大数据”的概念。国际数据中心IDC 是研究大数据及其影响的先驱,在2011年的报告中定义了大数据:“大数据技术描述了一个技术和体系的新时代, 被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。但是大数据是一个新兴而且内涵不断发展的概念,尚没有统一公认的定义,只能从其特点上加以认识。

 

(三)大数据的特点

 

与传统数据相比,大数据的特征可以用五个“V”来表示,即Volume(容量大)、Variety(种类多)、Velocity(时效性强)、Value(价值高)、Visualization(可视化呈现)。大数据容量大是个相对的概念,受时间、行业和数据类型等因素的影响;种类多是指数据集的结构异质性,科技进步导致了结构化、半结构、非结构化数据的日益增多;时效性强是指大数据被生成、处理、移动的速度相当快,是区别于传统数据最显著的特征,这也增加了对即时分析、加工数据的需求;价值高是指大数据潜在的高价值能为评价和决策提供依据。可视化是大数据分析的关键步骤,是对有价值信息加以提炼并显示的过程。

 

(四)大数据的应用

 

大数据具有5Vs(Volume、Velocity、Variety、Value、Veracity)特点,蕴含着巨大的社会价值、经济价值和科研价值,已引起了产业界、学术界、政府部门和其他组织的高度关注和重视。

 

近年来,世界发达国家相继布局大数据战略,诸如联合国“数据脉动”计划、美国大数据战略、英国“数据权”运动,大力推动大数据发展和应用。大数据已纳入我国国家发展战略,国务院2015年8月31日印发了《促进大数据发展行动纲要》的通知(国发[2015]50号),指出:“大数据成为推动经济转型发展的新动力,大数据成为重塑国家竞争优势的新机遇,大数据成为提升政府治理能力的新途径。以数据流引领技术流、物质流、资金流、人才流,将深刻影响社会分工协作的组织模式,促进生产组织方式的集约和创新。探索发挥大数据对变革教育方式、促进教育公平、提升教育质量的支撑作用”

 

二、大数据给传统统计学带来的冲击

 

(一)数据收集方法上

 

不同于传统的调查抽样方法获取数据,大数据的收集来源渠道通常为现代网络渠道,如互联网、物联网等。不同的数据源的数据采集需要专用数据采集技术, 如包含格式文本、图像和视频的网站数据,通常需要web爬虫技术。

 

(二)数据存储上

 

大数据的存储不同于传统的数据存储方式,有固定的格式和结构,对于大数据的数据库来说,可以直接将所探测到的信号自动容纳到其中;大数据需要有先进的存储设备,传统的存储设备已经不能容纳如此大量的数据。

 

(三)数据分析上

 

传统的统计分析方法,难以胜任对非结构化的大数据的分析。当前大数据分析技术的研究可以分为6个重要方向:结构化数据分析、文本数据分析、多媒体数据分析、web数据分析、网络数据分析和移动数据分析。

 

(四)数据展示上

 

数据可视化的目标是以图形方式清晰有效地展示数据的信息。一般来说,图表和地图可以帮助人们快速理解信息。但是,当数据量增大到大数据的级别,传统的电子表格等技术已无法处理海量数据。大数据的可视化展示需要专业的软件来完成。

 

三、大数据时代统计学专业教学改革

 

大数据时代的到来对统计学也带来了新的机遇和挑战,特别是大数据对于数据分析人才产生了巨大需求,同时也要求统计专业学生掌握更为复杂统计软件的编程和操作。大数据背景下,统计学要适应新的形势,需要对课程教学进行有针对性的改革。

 

(一)大数据时代统计学专业毕业生就业方向定位

 

大数据时代的到来,使各行各业,包括政府、企业、个人都希望能从大数据这座金矿中挖掘出对自己有价值的金子,从而增加了对统计专业毕业生的需求。一直以来,我国统计工作领域主要是政府统计、部门统计、民间统计。传统意义上,政府及各个部门是统计学学生就业的首选。然而,随着大数据时代的来临,越来越多的毕业生选择发展空间更为广阔的民间统计。民间统计相对于政府统计来说,涉及范围十分广泛,包括各类统计咨询公司、统计调查公司、统计研究院等,介于市场和企业、行业之间。民间统计的发展前景十分广阔,可以预见,随着大数据时代的来临,统计学作用的提高,民间统计必会成为统计专业毕业生选择就业的主要渠道之一。

 

(二)大数据时代统计学专业课程设置改革

 

大数据时代,在对统计数据分析人才需求增加的同时,也对统计专业毕业生的大数据处理能力提出了更高的要求,这就需要统计学专业在课程设置上,增加大数据处理与分析方法课程,如《大数据分析方法》、《数据挖掘》等,培养学生能够使用专业统计软件(R/SAS/Python)进行大数据的挖掘、清洗、分析等。

 

(三)大数据时代统计学专业学生实践能力培养改革

 

在课堂教学之外,通过广泛举办大数据技术创新大赛、大数据技术创新与创业大赛、数据挖掘挑战赛,支持学生成立大数据研究协会,举办大数据相关讲座论坛等方式,增强学生分析和处理大数据的能力。另外,还要加强校外大数据实践教学基地建设,通过与通信、互联网、电子商务等企业大数据开发中心以及大数据研究咨询机构合作,为学生提供给更多的实习、实践机会。

 

四、总结

 

总之,面对大数据时代的到来,统计学专业需要积极改革与调整课程的设置,注重学生实践能力的培养,以适应各行各业对大数据分析与挖掘人才的需求。

 

大学数学统计学篇(11)

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)04-0110-02

一、大数据时代统计学专业发展的新特点

(一)数据化的信息收集

传统的统计研究主要是对已收集的数据进行各种技术分析,包括描述性分析、推断性分析、截面分析、时间序列分析等,侧重点在于技术分析手段的使用上。然而大数据时代,关注的是信息本身。现代信息系统的使用使大数据成为可能,文字、地理方位、沟通等,任何事物都可以量化,一切现象都可以用数据或表格来诠释。因此,大数据背景下世界是由各种信息和数据所构成的。

(二)全数据模式的研究对象

在信息处理能力受限制的过去,人们缺少用来分析所收集数据的工具,因此产生了随机抽样。随机抽样法的目的是用最少的数据获得最多的关于总体的信息,从而使用样本对总体进行推断。然而,在大数据时代,数据处理的方式和技术发生了巨大的改变,人们可以通过互联网、数据库以及各种通讯工具获得海量数据,这时随机抽样就失去了它原来的意义。简单廉价的数据收集方法,足够的数据处理和存储能力,使得全数据模式成为可能。因此,大数据背景下样本即为总体。放弃随机抽样分析的捷径,采用所有数据的方法,可以发现一些隐藏在海量数据下的细节。

(三)混杂性的数据处理思维

传统的统计学处理数据的步骤是首先对数据进行整理和清洗,剔除不完整的或者异常值,然后再利用样本信息,在允许的误差范围内对总体进行推断和分析,即通过调整精确度的大小来对总体进行研究和分析。然而,在大数据背景下,来自各个时间和空间的数据来源纷杂,格式广泛,在萃取或处理数据的时候,很难做到把所有的数据都进行仔细地清洗。这种情况下,必须接受数据的混乱和不确定性,因为数据多比少好,因此更多的数据信息比更加智能、更加精确的算法系统还重要。当拥有大量数据的时候,可以忽略一部分精确性,但并不是说不需要精确性,而是数据规模不断扩大时,确切的数量已经不再那么重要了,可以通过大规模的数据来发现事物背后的规律。

(四)相关关系的基础分析方法

传统的统计中,大部分相关关系分析仅限于寻求线性关系,或是在建立假设的基础上揭示数据相互之间的因果关系,例如Granger检验就是依据时间序列数据对变量之间的因果关系进行的判断,但往往会产生一些虚假的因果关系。这是因为统计关系并没有蕴含多少真实的因果关系。在大数据背景下,数据点以数量级方式增长,用数据驱动的相关关系分析不再需要建立在假设的基础上,所以相关关系分析不容易受偏见的影响而发生错误。大数据时代相关关系通过回答“是什么”的问题,为人们认识世界提供了一种新的视角。因此,相关关系统计分析是大数据预测的基础。

二、统计学专业教学体系中存在的问题

大数据背景下传统的统计学专业教学体系存在的问题凸显,具体体现在以下几个方面。

(一)培养目标无法适应大数据时代的社会需求

传统的统计学专业教学体系的培养目标是通过统计专业核心课程内容的介绍,锻炼学生收集、整理和分析数据的能力,培养“应用型”统计专业人才。然而,大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力,从以往局限于少数的学术精英圈子扩大到了普通的社会机构、企业和政府部门,各行各业对统计数据、统计分析的需要使得统计学专业受到了前所未有的关注。大数据背景下,要求统计学作为一种分析工具,能够与其他专业相互衔接,相互服务,培养“复合型”专业人才。因此,传统的统计学专业教学体系培养目标存在两个方面的挑战:第一,如何协调统计与其他专业之间的关系;第二,如何从“应用型”向“复合型”人才进行转变。

(二)忽视数据的收集和创新

传统的统计学专业教学体系重视数据的分析技术,更多的课程设置是围绕着数据分析方法和技术展开的,例如多元统计分析、时间序列分析、统计预测与决策分析等。基础的数据收集部分只在统计学原理中有一章的内容介绍,而且是作为非重点一带而过的。大数据以海量的数据为分析研究的对象,将一切社会经济现象进行量化,重视的是信息的收集和数据的创新,包括数据的再利用,数据的重组,数据的扩展,数据的折旧以及数据的开放等各个方面。这些内容在原有的教学体系中是没有体现的。

(三)与大数据时代脱节的教学内容

传统的统计学专业教学体系仍然固守着原有的教学内容,在近二十年内变化不大。专业的主干课程有统计学原理、国民经济核算、计量经济学、抽样技术与方法等。而在大数据背景下,教学内容以全数据模式为研究对象,强调对所有的数据进行分析,而不是开展随机抽样;允许不精确的存在,而不是在给定的精确程度下对总体进行推断和分析;关注海量数据之间的相关关系,而不是强调数据之间的因果联系。这些内容都无法在现有的教学体系中体现,因此,传统的专业教学体系与大数据时代是脱节的。

(四)实践教学环节薄弱

随着“应用型”统计专业人才培养目标的提出,学校对实践教学的重视增强,与过去相比,现有的专业教学体系中已经增加了实践教学环节。但是,在大数据背景下,实践教学仍然是统计学专业教学体系中的薄弱环节。主要表现在两个方面:(1)以模型驱动为主的实践教学模式已不适应大数据时代的要求。现有的实践教学内容并不是从数据出发,而是通过寻求一些适合模型的数据来“证明”这个模型的确有意义。这种思维方式与大数据时代的要求是不适应的,因为创造模型的目的是适应现实数据,而不是由模型驱动。(2)以SPSS、Eviews为主的软件教学已无法处理大数据。现有的实践教学中,主要讲授的是传统的统计分析软件SPSS和Eviews,因为这两种软件发展成熟,操作简单,可以处理一般的计量模型和时间序列。但是,大数据时代数据是海量的、复杂的,用简单的软件已无法处理和实施。

三、统计学专业教学体系改革的方向

根据以上分析,时代的发展对统计学专业提出了更高的要求,现有的教学体系中存在的各种问题即为统计学专业教学体系改革的方向。

(一)准确定位统计学专业的人才培养目标,重新设计主干课程的教学内容

大数据时代要求培养“复合型”统计专业人才,因此教学体系的培养目标要从简单的“应用型”向“复合型”转变。“复合型”统计专业人才要求学生除了具备数据收集、处理和分析的能力外,还要对统计学应用领域的背景知识有一定的了解。因此,按这个培养目标,需要对现有教学体系中的主干课程重新进行调整和设计。专业主干课程分为方法和应用两个方面。方法类的课程除了原有的计量经济学、时间序列分析、多元统计分析等外,又增加了机器学习、模拟算法、数据挖掘、R软件分析(或SAS软件分析)等处理复杂大数据的方法的课程。应用类课程在保留原有的国民经济核算,金融统计,证券投资,会计学基础外,增加一些统计学应用领域的基础知识课程,例如商业统计、生物统计、保险与精算统计等。此外,适当调整各专业主干课程的课时,一些课程可以增加课时,如软件分析、数据挖掘等,一些课程可以缩减课时,仅作一些简单的介绍,如抽样技术等。

(二)转变固有的思维方式,在大数据背景下积极推进教学改革

大数据时代,数据更多、更杂,传统统计学思维方式受到了极大的挑战。因此,以大数据为背景,转变固有的思维方式,从以统计技术方法为中心转换到以信息数据为中心,推进统计学专业教学改革十分重要。具体来说,可以弱化传统的推理论证的教学模式,强化数据收集、数据处理和数据分析的能力培养;强调数据本身的价值,让数据说话,用简单的方法了解数据背后所隐藏的信息和规律;使用项目式训练,让学生从项目中真正体验数据化处理的整个过程,达到理论和方法的结合;加强课堂教学与实验教学的统一和贯通,如在传统的教学过程中,将统计学原理、多元统计分析结合SPSS软件介绍,而时间序列分析又采用Eviews进行介绍,造成学生疲于学习各种软件,实际上SAS、R等统计软件可以实现所有的功能,用一种软件与课堂教学融合贯通能帮助学生更好更深地掌握软件的使用。

(三)创新实践教学模式,加强实践教学的开展

从以模型驱动的实践教学模式转变为以数据驱动的教学模式,构造课堂案例教学、实验教学、课后项目式训练、校外实习基地锻炼四位一体的创新型实践教学模式。计算机快速发展的今天使得大数据成为现实,在处理数据的时候,根据数据的特征创造出新的计算方法来满足实际需要,这就是数据驱动模式。在实践教学的过程中,要强调统计数据、计算机编程以及统计分析软件的结合。目前,R软件和SAS软件显示出了强大的数据处理和数据分析功能,实践教学环节中可以把这两种中的一种融入到专业课程中去,将计算机软件与课堂教学结合起来。此外,课后的项目式训练和校外实习可以带动学生了解和掌握整个数据分析实践的流程,激发学生学习的兴趣,在实践教学的过程中要多鼓励、多开展。

参考文献:

[1]曾五一,等.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2010,(2).