欢迎访问发表云网!为您提供杂志订阅、期刊投稿咨询服务!

数据分析的前景大全11篇

时间:2023-06-07 15:33:55

数据分析的前景

数据分析的前景篇(1)

一、大数据时代国库统计分析转变

(一)树立大数据思维

“大数据时代预言家”维克托认为:世界的本质就是数据,大数据将开启一次重大的时代转型,一直以来所延续的传统统计分析思想已变得陈旧且落后。国库统计分析思维应当在大数据背景下加以转变。一是关于大数据抽样调查工作的思想。抽样调查是目前统计分析工作中的重要调查方式,但应该清醒地认识到,传感器、网络和数据处理技术,为获取全局数据提供了可能,抽样调查方式越来越多的被大数据取代成为必然。二是大数据统计思想:允许数据存在不精确性。纵观目前的各类数据,一方面,数据来源不断扩展,另一方面数据处理方法飞速发展,我们应该把重心放在统计分析效率上,而不是一味地追求数据的精确性上。三是大数据相关关系的思想,由验证因果向寻求关联转变。统计分析报告是统计工作的下游产品,对决策的意义常常大于常规报表。大数据的应用,统计分析也将发生转变,在做好因果分析的基础上向寻求关联转变,原因分析更加精准和深刻,对策建议更具参考价值。

(二)被动统计到主动分析,从人工统计到智能统计

在这样一个信息爆炸的大数据时代,无论政府机构还是社会公众都可以通过多种途径获取信息,国库统计分析部门也不例外,更应该变被动为主动,对经济转型期的一些重大问题尤其是关系到可持续发展的重要问题,做好数据统计分析,提高发展质量,实现经济转型。涂子沛指出人类使用数据的巅峰形式,是通过数据赋予机器“智能”。大数据在包括国库统计分析中应用的终极形式就是分析智能化。

(三)从事后统计向事前预测转变

统计分析报告是统计工作的重要产品,完整的进度性常规分析应该包括对未来一定时期数据的预测。但由于小数据和信息量的局限,预测一般很少作为报告的重点,多是在假定发展条件、相关政策不变的情况下对未来情况做出的粗略研判,影响了统计对决策的参考价值。而大数据的核心就是将数学算法与海量的数据有效结合,来预测事情发生的可能性。大数据的广泛应用,将有利于统计报告实现由单一的事后分析,向注重事前预测转变。

二、大数据在国库统计分析全流程应用的探讨

当前,大数据浪潮带来了一场新的革命,面对经济发展的新形势新要求,国库统计分析要学会积极的运用大数据的思想和方法,来应对各种新挑战。国库统计分析要积极主动建立大数据分析应用机制,破解新常态下面对的各种问题,实现工作的创新与发展。本文重点分析国库统计分析全流程下大数据的应用。

(一)数据源:建立国库统计分析数据池

目前国库统计分析所用数据主要通过“3T”系统产生基础数据和监管类数据,通过收集各类型政策文件、影像资料、领导讲话、内网信息等形成综合性数据。但这些数据远未达到支撑大数据统计分析的基础。国库统计分析应当建立“数据池”这一基础工程,通过人行内部数据整合、银行和其它机构数据接入、互联网数据抓取和引入等多渠道扩充基础信息源和数据库,为国库统计分析的大数据应用奠定数据基础。

一是加速整合现有国库数据。我国国库汇集了各级政府财务数据和各级国库管理数据,包括从中央到县乡的各级机构化和非结构化数据,也包括税务、海关、财政、银行等部门处理的各类收支退存等国库资金运行数据,涵盖面极广。但现有数据资源存在着部门隶属、无法共享等问题,大数据要求建立统一、高效、共享的国库业务大数据池,就必须打破现有藩篱,尽早实施“国家金库工程”,完善内部数据源。

二是扩大国库统计分析数据源。最重要的是打通各级政府及其下属各部门之间的数据传输通道,实现政府办公、工商行政、招商引资、外贸出口、仲裁诉讼等政府活动所产生的数据接入共享。其次是实现一行三会、商业银行、行业协会、企业实体等生产运营数据的持续传输和报送。最后是互联网数据,互联网是大数据的重要载体,也是数据收集的快捷途径,通过各类互联网平台,门户以及行业网站,可以收集海量数据来增加国库统计分析领域数据采集的前置性和时效性。

(二)数据采集与存储:软件与硬件结合

大数据的应用中,由于数据来源非常广泛且类型多样化,需要存储和分析挖掘的数据量也是十分庞大的,因此数据展现和处理的高效性以及可用性十分重要。因而,大数据的收集和存储应当通过先进的计算机技术自动实现,并结合线下需求采取人工收集等传统方法,以补足系统无法收集的数据的遗漏。国库统计分析数据的采集应当在国库大数据资源池基础上,通过构建云计算应用平台,统筹整合各直属国库大量分散的数据和软硬件资源,通过应用云计算平台的资源和功能,以提升和优化整体效能,从而实现全国国库统计分析的大集成、大整合以及大应用。对于其他横向联网数据,比如一些保密性较强的科学研究数据和企业生产经营数据,则可以与研究机构和企业建立合作关系,使用特定系统接口等相关方式采集数据。

在数据存储方面,在通过完善的物理存储技术和云计算平台等软硬件设施的基础上,按国库统计层级建立分级仓储式数据中心,以人行总行为总库,各项业务与非业务数据达到汇总存储,各级行通过内部接口或云计算平台实现数据上传下载,同时本级行建立分中心数据存储仓,采集本级区域内纵向和横向数据并存储。同时按照保密和信息安全等要求,实施分级授权和设置防火墙、实时加密存储数据和卷标存储加密等技术。

(三)数据清洗与结构化处理

国库海量的、不规则的数据无法提供有效决策支持,只有通过数据清洗技术将大数据转变为结构化和规则化的数据,才能体现大数据价值。数据清洗包括检查数据一致性,处理无效值和缺失值等,是发现并纠正数据文件中可识别的错误的最后一道程序。经过数据清洗技术处理残缺数据、错误数据和重复数据后将有效数据写入数据库。

在国库大数据统计分析上,通过数学知识(概率、统计、离散化等)建立合理模型,充分利用和挖掘数据内容。综合运用开源类和非开源类数据分析工具包括R、Python、MATLAB、SPSS、EVIEWS等软件进行数据分析。具体实现统计分析、数据挖掘和模型预测等功能,并以可视化的结果予以呈现。统计分析包含假设检验、差异分析、相关分析、方差分析、回归分析、logistic回归分析、因子分析、聚类分析、主成分分析、判别分析、bootstrap技术等。数据挖掘包含相关性分组或关联规则、聚类、描述和可视化、复杂数据类型挖掘等。模型预测包含预测模型、机器学习、建模仿真等。

在统计分析过程中,国库统计分析应该重点实现云应用的创新与共享。统计人员可以根据业务的新要求,在云平台数据开放接口的基础上,自由构建合理的数学模型和算法,实现业务应用的创新和扩展。与此同时,以算法的方式将统计人员的智力成果和业务知识固化,当经验证为可信任应用时,可自动进入云平台的应用共享库,在得到授权的前提下,自由使用或补充完善,实现知识固化、资源共享。

(四)国库运行智能化统计分析

在云应用平台上,国库统计分析首先要将日、旬、月和年作为数据的时间维度,将国库收入、国库支出以及国库库存等统计指标作为数据的为空间维度,利用云计算的强大能力,并借助数据分析展示工具,预先计算处理数据。或者根据用户事先提交的数据挖掘需求自动完成相关数据预处理。统计分析人员随时可以从两个维度上深度挖掘数据,并使用QLikView等数据分析工具,实现统计大数据的多维度、可视化展示。

二是实现常规统计分析的智能化生产。可以通过完善和丰富大数据应用平台的分析功能,实现机器式的学习,输入必要的参数后,系统将自动计算数据,并关联提取大数据池中的相关数据和信息,进而依据特定的模板输出分析报告,最后由分析人员对输出的分析报告进行质量把关和进一步的补充完善。

三是构建统计分析数据模型,提高预警预测水平。不断进行新的分析预测数学模型的探索和构建,充分利用国库统计大数据平台上的海量数据和动态实时数据,不断提高预测水平。

(五)数据展示与反馈

以智能化统计分析为主的大数据应用技术,为数据结构化和可视化的展示提供了支持。简要国库运行数据、系统化运行指标、国库资金运行报告、国情和舆情监测报告、企业和金融服务报告、国库运行情况预测等为中央银行、各级政府部门制定有关政策提供统计信息和参考依据,充分发挥国库在国家预算执行中的促进、反映和监督作用。同时建立信息反馈机制,对现有统计分析结果予以反馈,还包括对未满足需求提出反馈,丰富和完善大数据应用成果,充分发挥国库统计分析应用大数据的社会价值。

综上所述,从全流程看,大数据应用自数据端建立“”数据池“”到处理端智能分析在到应用端数据展示,大致可以通过下图(图1)形象展示:

三、有效提升大数据应用的政策建议

(一)从制度层面保障大数据统计分析的有效开展

制定专门的大数据应用法律法规,在由总行统一部署、统一实施的基础上,各地区分支机构结合当地实际制定特色大数据应用和发展规章制度。从数据产生、采集、存储、挖掘和应用等大数据处理全流程做出明确安排。一是通过总行层面的发文、通知等鼓励通过大数据方法加强国库统计分析,建设大数据共享和应用平台;二是强化大数据统计所需软硬件采购、数据源互联互通及模块化分割等作出具体安排;三是要求大数据应用所应达到的在信息、统计报告、预测与预警等功能上的目标和绩效予以明确,充分利用大数据平台提供统计分析支持;四是强化信息技术安全,防止信息泄露、网络攻击、系统失灵等问题,明确应急处置方案。做到严格立法,有法可依,有章可循。

(二)加大基础设施建设和人才投入,满足大数据应用的软硬件要求

大数据基础设施可分为硬件和软件两类。硬基础设施主要包括用于收集、存储、分析和应用大数据的信息化系统架构;软件基础设施主要包括各类数据信息、数据挖掘和大数据应用专业软件以及金融企业的人力资源。人民银行应通过专项资金投入等方式构建大数据应用的软硬件设施和和培养专业人才,并通过持续培训使全体员工了解并使用大数据进行国库统计分析。也可邀请专业的大数据解决方案服务商作为咨询顾问,整合国库不同生产系统数据,优化数据应用行为,加快统计系统建设步伐。

(三)提高大数据管理和应用能力

国库统计分析应不断的加强国库运行数据的采集、储存、保护和管理工作,不断提升统计分析水平。加强对国库统计分析中涉及的地方债、营改增、房地产、小微企业经营、财政专户、盘活库存等热点领域可以设计建立相应跟踪监测指标体系。与此同时加强改革数据的统计制度、方法以及程序,研究大数据共享制度,为宏观经济分析提供便捷、坚实的大数据基础。

建立国库大数据分析应用机制是新形势下的当务之急。国库统计分析需不断改革创新,强化大数据的思维,提高大数据的意识和驾驭大数据的能力,积极探索新的大数据应用方法和途径,从而在国家宏观决策、服务经济社会发展、服务国库管理方面,进一步提升国库统计分析服务的能力和水平。

参考文献:

[1]沈昱池.大数据时代我国财政信息共享的思考[J].地方财政研究,2015(11):47-67

数据分析的前景篇(2)

当前社会对数字化生活的依赖度不断提高,移动娱乐、移动医疗、移动教育、移动金融及物联网、云计算、大数据等数字化服务需求旺盛,将成为新一轮的消费热点。因此运营商开始研究以网格区域内人群位置数据为核心、用户数据为辅助的大数据基础能力研究,实现网格覆盖区域内的流量监控分析、人口特征洞察、位置轨迹分析、综合价值评估等基础功能,并支持通过组合、复用等方式,支撑旅游、交通、金融、咨询服务等行业应用。运营商处在大数据业务的中心位置,在掌握用户行为方面具有得天独厚的先发优势。基于此,本文接下来将对运营商大数据在旅游行业的应用进行探索研究,总结其拥有的优势以及具体的应用场景。

2 运营商大数据在行业信息化的优势

与互联网公司相比,运营商手中的数据更具有普遍性,甚至几乎囊括了所有的社会个体,尤其是运营商针对社会人群的精准数据,更是一座现成的金矿。目前运营商要做的事情并非“发展客户增加收入的阶段”,而是将客户的精准数据分析、位置数据和用户规模结合起来,再利用大数据技术服务于运营商的转型业务,用于自身业务的精确营销、交通部门的道路规划、商圈的选址及旅游行业,突破原先业务的束缚,在大数据运营的蓝海里寻找一片新的天地。

运营商的大数据来源:

(1)用户资料:这些是用户的个人隐私数据,有些信息可以用于用户趋势性数据分析(用户区域信息),主要包括如下主要信息:用户的归属信息(用户的归属省份信息、地市信息、县市信息)、性别信息(男/女)、年龄、单位性质等信息,这些数据只使用于趋势性分析、地域分析,不能用于个性用户的数据分析。

(2)用户的订购关系数据:用户在运营商订购的业务、套餐信息。

(3)用户行为分析数据:用户的上网行为分析数据、用户的消费信息(通话的通话清单、短信清单、流量消费信息),这些数据是用户的敏感隐私数据,在使用时必须进行脱敏处理。

(4)用户的位置信息:用户在HLR(Home Location Register,归属位置寄存器)登记的位置信息、基于A接口或Mc接口的位置更新信息(Location Update)、漫游切换信息、位置附着信息(Attach)、MT、Mo过程信息及SMS短信过程信息,这些数据都是实时数据,准确地记录了用户行驶轨迹,准确性非常高。

运营商的大数据在旅游行业的优势:

(1)数据准确性

工信部、公安部、国家工商总局联合发文,从2015年1月1日起,所有运营商注册的用户必须实行实名登记,这样确保了用户基础数据的准确可靠。其中位置信息、互联网访问信息都记录了用户实际到访位置及上网行为,再结合用户属性数据、订购业务、详单信息等,和客户的行为、喜好直接相关,有很高的准确性。

(2)权威性

移动运营商的用户规模大,约占70%的市场份额的移动数据更具有权威性,采样数据比较全面,在趋势性分析领域更具权威性。通过用户的行为数据的采集和分析,结合企业数据中心用户行为特征,为集团客户提供精确营销开辟了新途径,为今后的大数据分析提供数据分析源。用户所有在互联网络的操作行为、到访信息,运营商都可以记录,并经数据脱敏,就可以为旅游、交通、政府的业务规模提供趋势性分析数据。

(3)实时性

移动运营商拥有丰富的网络信令数据,用户发生位置移动、发送短信、上网等操作都会在网络的Mc接口(4G网络)或A接口(传统的2G网络)触发信令数据产生。通过这些信令数据的上下文,可以通过基站描点勾勒出用户的活动轨迹,而且这些数据都是实时的,和用户的实际过程相匹配。

除此之外,还有用户的主动位置更新(更新LAI)和定期的位置更新(一般为2小时以内),也会记录用户的位置信息,再利用运营商在旅游景区的基站信息同景区进行有效的结合。

实时客流监控、景区客流分析、游客特征分析就是利用运营商在旅游景区的基站信息,利用实时采集A接口、Mc接口数据的信令数据,实时分析景区的用户轨迹数据,对景区客流信息实行实时监控分析,改变景区只能事后统计用户量的情况,提升实时反映能力,进而加强服务和管控能力,并为推动旅游业信息化发展提供有效信息数据支撑。

3 运营商大数据在旅游行业的应用分析

以游客为中心,服务游客,满足游客需求,运营商可获取相关静态数据:游客人群来源地(用户的归属信息)、性别;再结合用户的动态信息:位置信息、来访时间、在各景点的驻留时间,进行旅游客源分析统计,并对景区客流信息进行实时监控与分析,将有效提升景区的服务与响应能力,为景区应急调度与管理提供依据。同时,如图2所示,通过对游客客源归属地的分析统计及对客户行为、特征的全面分析,为景区信息化建设及市场推广提供有效的数据支撑。

(1)客流分析

通过对景区包含的基站信令接口数据分析,统计出基站当前实时人数,同时参考运营商用户占比模型,计算当前景区(或景区内某一区域)的实际游客数量,实时反馈给景区系统,以趋势图或数字方式呈现。

根据提供景区人流量及归属地的实时统计与分析数据,再结合用户的归属信息,分析出各省市的游客旅游热度分析、游客特征分析、游客驻留时长分析、历史客流比对分析(按周、按月等)、重点节假日游客分析,支持实时客流量GIS地图展示,支持各类分析数据的报表展示。

基于网格管理实现景区网格的人流量可视化,实现实时监控预警、分析预测、深度洞察、信息,为旅游行业在流量情况掌握、应急预案准备、公众信息等方面提供参考和支撑。根据景区的容纳游客人数,同景区实时游客进行比较,达到上限时进行告警,提高景区管理职能和服务能力,及安全保障措施。

客流统计分析如表1所示:

(2)客源特征分析

根据客流分析的用户数据,再根据运营商的用户归属信息,把手机网络信令数据和用户数据结合,为旅游景区提供游客特征分析、游客消费分析、游客精确营销分析,满足景区的游客洞察与营销需求,改善景区管理水平。

通过实时数据采集分析到访景区的当前用户构成,细分到省、地市、县市,并可以按照用户数访问的时段进行归属信息统计,将景区内游客显示在电子地图上,同时对区域进行流量监控。

基于用户的归属信息,根据入园游客年龄分布统计、入园游客性别分布统计、入园游客到访频次统计、游客对景点类型的喜好度、入园游客的消费能力分析以及客户运营商产品订购行为的分析,进行360°游客画像,建立客户的归属地、年龄分布、性别比例、喜好景点类型、消费档次分布数据的分析,根据分析结果进行精准匹配。在用户到达相关景区时,实时推送景点相关信息,在推送渠道、推送时机、推送方式上满足客户的个性化需求,实现全程精准营销。图3为客源特征分析图。

(3)景区欢迎度分析

在了解游客归属地情况下,可以进一步统计各个省市用户到达旅游景区的热度排名,再分别通过当天、周、月、季、年的方式展现各个旅游景区人数排名、分时段人数排名,并提供景区热度排行,包括日排行、周排行、月排行以及节假日的特殊统计分析;确定城市中哪些景区为热门景区,为管理部门制定预案或者提升景区服务能力提供参考;提供外地游客来城市首先访问的景点,或者景点访问顺序,提供给旅游服务企业或者旅游监管部门有关景点的分析,或者访问路径优化等。

提供按时间段(最小统计单位天)景区内各个景点的用户滞留时长数据,时间段可以灵活设定。热点分析包括:热点客流分析、热点客源分析、热点景点分析,通过对客流来源、热点时期每天客流统计以及热点时间段内客源在景区内各个景点的分布情况综合分析,使得景区管理员更充分地了解到热点时期游客游玩景区的行为习惯和分布比例,为景区实施营销策划和资源调配提供有力数据保障。

(4)客流趋势分析、历史对比分析

根据往年的历史数据,可以从横向和纵向时间的维度对流量数据进行分析统计,方便景区管理员掌握景区各维度客流情况。通过对热点景区的专题分析,可通过对节假日的分析了解游客在不同节假日的来源、流量高峰及喜好等特征,进行相关时间段的游客趋势分析,为景区经营决策提供数据支撑,为节假日景区游客提前进行疏导准备工作。

如图4所示,景区内各景点区域实时游客人数地图显示,人员密度根据游客舒适度情况进行颜色标注,在系统顶部以消息滚动条形式实时播报景区内游客总量和拥挤及较拥挤的区域信息。同时手机客户端将推送拥堵信息给景区管理员,提醒景区管理人员做好游客疏导工作。

(5)旅游行业后向广告

结合用户的归属信息、到达景区的时间、在景区的滞留时间,整合旅游景点商家信息,基于游客群体的特征分析,提供后向广告功能,为旅游景点、城市旅游宣传、旅行社热点宣传提供专业的移动渠道广告业务。如用户旅游结束后,在景点出口出可以实时给游客推荐附近的以下信息:

1)住宿设施:酒店、旅店、招待所、家庭旅馆等);服务性设施:餐饮场所、娱乐场所、购物场所、商店;

2)旅游交通线路:高速公路休息站、城市所有的公交站点、长途汽车站点、机场、火车站、交通售票点(航空、铁路)、城市旅游咨询服务中心、租车公司、旅游线路、景区内的通行车线路等;

3)辅助设施:公共厕所、公共停车场、加油加汽站、收费站、车辆维修点;

4)商铺信息:景点的特色服务信息、商家的促销信息可以结合用户的位置信息实时发送到达景点的游客。

数据分析的前景篇(3)

1 引言

随着互联网公司的迅速崛起,传统电信运营商正面临着巨大冲击,原有的价值链被打破,逐步沦为“哑管道”,运营商陷入了前所未有的困境,必须寻找新的业务增长点。

当前社会对数字化生活的依赖度不断提高,移动娱乐、移动医疗、移动教育、移动金融及物联网、云计算、大数据等数字化服务需求旺盛,将成为新一轮的消费热点。因此运营商开始研究以网格区域内人群位置数据为核心、用户数据为辅助的大数据基础能力研究,实现网格覆盖区域内的流量监控分析、人口特征洞察、位置轨迹分析、综合价值评估等基础功能,并支持通过组合、复用等方式,支撑旅游、交通、金融、咨询服务等行业应用。运营商处在大数据业务的中心位置,在掌握用户行为方面具有得天独厚的先发优势。基于此,本文接下来将对运营商大数据在旅游行业的应用进行探索研究,总结其拥有的优势以及具体的应用场景。

2 运营商大数据在行业信息化的优势

与互联网公司相比,运营商手中的数据更具有普遍性,甚至几乎囊括了所有的社会个体,尤其是运营商针对社会人群的精准数据,更是一座现成的金矿。目前运营商要做的事情并非“发展客户增加收入的阶段”,而是将客户的精准数据分析、位置数据和用户规模结合起来,再利用大数据技术服务于运营商的转型业务,用于自身业务的精确营销、交通部门的道路规划、商圈的选址及旅游行业,突破原先业务的束缚,在大数据运营的蓝海里寻找一片新的天地。

运营商的大数据来源:

(1)用户资料:这些是用户的个人隐私数据,有些信息可以用于用户趋势性数据分析(用户区域信息),主要包括如下主要信息:用户的归属信息(用户的归属省份信息、地市信息、县市信息)、性别信息(男/女)、年龄、单位性质等信息,这些数据只使用于趋势性分析、地域分析,不能用于个性用户的数据分析。

(2)用户的订购关系数据:用户在运营商订购的业务、套餐信息。

(3)用户行为分析数据:用户的上网行为分析数据、用户的消费信息(通话的通话清单、短信清单、流量消费信息),这些数据是用户的敏感隐私数据,在使用时必须进行脱敏处理。

(4)用户的位置信息:用户在HLR(Home Location Register,归属位置寄存器)登记的位置信息、基于A接口或Mc接口的位置更新信息(Location Update)、漫游切换信息、位置附着信息(Attach)、MT、Mo过程信息及SMS短信过程信息,这些数据都是实时数据,准确地记录了用户行驶轨迹,准确性非常高。

运营商的大数据在旅游行业的优势:

(1)数据准确性

工信部、公安部、国家工商总局联合发文,从2015年1月1日起,所有运营商注册的用户必须实行实名登记,这样确保了用户基础数据的准确可靠。其中位置信息、互联网访问信息都记录了用户实际到访位置及上网行为,再结合用户属性数据、订购业务、详单信息等,和客户的行为、喜好直接相关,有很高的准确性。

(2)权威性

移动运营商的用户规模大,约占70%的市场份额的移动数据更具有权威性,采样数据比较全面,在趋势性分析领域更具权威性。通过用户的行为数据的采集和分析,结合企业数据中心用户行为特征,为集团客户提供精确营销开辟了新途径,为今后的大数据分析提供数据分析源。用户所有在互联网络的操作行为、到访信息,运营商都可以记录,并经数据脱敏,就可以为旅游、交通、政府的业务规模提供趋势性分析数据。

(3)实时性

移动运营商拥有丰富的网络信令数据,用户发生位置移动、发送短信、上网等操作都会在网络的Mc接口(4G网络)或A接口(传统的2G网络)触发信令数据产生。通过这些信令数据的上下文,可以通过基站描点勾勒出用户的活动轨迹,而且这些数据都是实时的,和用户的实际过程相匹配。

除此之外,还有用户的主动位置更新(更新LAI)和定期的位置更新(一般为2小时以内),也会记录用户的位置信息,再利用运营商在旅游景区的基站信息同景区进行有效的结合。

实时客流监控、景区客流分析、游客特征分析就是利用运营商在旅游景区的基站信息,利用实时采集A接口、Mc接口数据的信令数据,实时分析景区的用户轨迹数据,对景区客流信息实行实时监控分析,改变景区只能事后统计用户量的情况,提升实时反映能力,进而加强服务和管控能力,并为推动旅游业信息化发展提供有效信息数据支撑。

3 运营商大数据在旅游行业的应用分析

以游客为中心,服务游客,满足游客需求,运营商可获取相关静态数据:游客人群来源地(用户的归属信息)、性别;再结合用户的动态信息:位置信息、来访时间、在各景点的驻留时间,进行旅游客源分析统计,并对景区客流信息进行实时监控与分析,将有效提升景区的服务与响应能力,为景区应急调度与管理提供依据。同时,如图2所示,通过对游客客源归属地的分析统计及对客户行为、特征的全面分析,为景区信息化建设及市场推广提供有效的数据支撑。

(1)客流分析

通过对景区包含的基站信令接口数据分析,统计出基站当前实时人数,同时参考运营商用户占比模型,计算当前景区(或景区内某一区域)的实际游客数量,实时反馈给景区系统,以趋势图或数字方式呈现。

根据提供景区人流量及归属地的实时统计与分析数据,再结合用户的归属信息,分析出各省市的游客旅游热度分析、游客特征分析、游客驻留时长分析、历史客流比对分析(按周、按月等)、重点节假日游客分析,支持实时客流量GIS地图展示,支持各类分析数据的报表展示。

基于网格管理实现景区网格的人流量可视化,实现实时监控预警、分析预测、深度洞察、信息,为旅游行业在流量情况掌握、应急预案准备、公众信息等方面提供参考和支撑。根据景区的容纳游客人数,同景区实时游客进行比较,达到上限时进行告警,提高景区管理职能和服务能力,及安全保障措施。

客流统计分析如表1所示:

(2)客源特征分析

根据客流分析的用户数据,再根据运营商的用户归属信息,把手机网络信令数据和用户数据结合,为旅游景区提供游客特征分析、游客消费分析、游客精确营销分析,满足景区的游客洞察与营销需求,改善景区管理水平。

通过实时数据采集分析到访景区的当前用户构成,细分到省、地市、县市,并可以按照用户数访问的时段进行归属信息统计,将景区内游客显示在电子地图上,同时对区域进行流量监控。

基于用户的归属信息,根据入园游客年龄分布统计、入园游客性别分布统计、入园游客到访频次统计、游客对景点类型的喜好度、入园游客的消费能力分析以及客户运营商产品订购行为的分析,进行360°游客画像,建立客户的归属地、年龄分布、性别比例、喜好景点类型、消费档次分布数据的分析,根据分析结果进行精准匹配。在用户到达相关景区时,实时推送景点相关信息,在推送渠道、推送时机、推送方式上满足客户的个性化需求,实现全程精准营销。图3为客源特征分析图。

(3)景区欢迎度分析

在了解游客归属地情况下,可以进一步统计各个省市用户到达旅游景区的热度排名,再分别通过当天、周、月、季、年的方式展现各个旅游景区人数排名、分时段人数排名,并提供景区热度排行,包括日排行、周排行、月排行以及节假日的特殊统计分析;确定城市中哪些景区为热门景区,为管理部门制定预案或者提升景区服务能力提供参考;提供外地游客来城市首先访问的景点,或者景点访问顺序,提供给旅游服务企业或者旅游监管部门有关景点的分析,或者访问路径优化等。

提供按时间段(最小统计单位天)景区内各个景点的用户滞留时长数据,时间段可以灵活设定。热点分析包括:热点客流分析、热点客源分析、热点景点分析,通过对客流来源、热点时期每天客流统计以及热点时间段内客源在景区内各个景点的分布情况综合分析,使得景区管理员更充分地了解到热点时期游客游玩景区的行为习惯和分布比例,为景区实施营销策划和资源调配提供有力数据保障。

(4)客流趋势分析、历史对比分析

根据往年的历史数据,可以从横向和纵向时间的维度对流量数据进行分析统计,方便景区管理员掌握景区各维度客流情况。通过对热点景区的专题分析,可通过对节假日的分析了解游客在不同节假日的来源、流量高峰及喜好等特征,进行相关时间段的游客趋势分析,为景区经营决策提供数据支撑,为节假日景区游客提前进行疏导准备工作。

如图4所示,景区内各景点区域实时游客人数地图显示,人员密度根据游客舒适度情况进行颜色标注,在系统顶部以消息滚动条形式实时播报景区内游客总量和拥挤及较拥挤的区域信息。同时手机客户端将推送拥堵信息给景区管理员,提醒景区管理人员做好游客疏导工作。

(5)旅游行业后向广告

结合用户的归属信息、到达景区的时间、在景区的滞留时间,整合旅游景点商家信息,基于游客群体的特征分析,提供后向广告功能,为旅游景点、城市旅游宣传、旅行社热点宣传提供专业的移动渠道广告业务。如用户旅游结束后,在景点出口出可以实时给游客推荐附近的以下信息:

1)住宿设施:酒店、旅店、招待所、家庭旅馆等);服务性设施:餐饮场所、娱乐场所、购物场所、商店;

2)旅游交通线路:高速公路休息站、城市所有的公交站点、长途汽车站点、机场、火车站、交通售票点(航空、铁路)、城市旅游咨询服务中心、租车公司、旅游线路、景区内的通行车线路等;

3)辅助设施:公共厕所、公共停车场、加油加汽站、收费站、车辆维修点;

4)商铺信息:景点的特色服务信息、商家的促销信息可以结合用户的位置信息实时发送到达景点的游客。

4 结束语

以移动用户的位置信息、用户数据信息为纽带,通过移动大数据的建设,可构建旅游行业新型产业价值链,提升旅游经济附加值。因此,本文对运营商大数据在旅游行业的应用进行了研究,首先分析了运营商大数据在行业信息化所拥有的优势,随后通过客流分析、客源特征分析、景区欢迎度分析、客流趋势分析、历史对比分析及旅游行业后向广告等多个方面探讨运营商大数据在旅游行业的应用,为景区信息化建设及市场推广提供数据支撑。

总而言之,对于旅游行业,通过信息化手段,结合用户的位置信息大数据分析,将分散在各地的单个景点按其文化内涵,串“点”成“线”,强化重点景点、文化和游客的有机统一,可提升旅游行业的整体文化附加值,提高旅游行业档次,促进行业转型升级,通过建立和健全“智慧旅游”综合信息服务系统,提升了旅游监管部门的经营管理能力,为运营商的业务转型提供了新的业务探索。

参考文献:

[1] 谢廷晟,牛化成,刘美英. HTML5权威指南[M]. 北京: 人民邮电出版社, 2015.

[2] 位元文化. JSP动态网页入门实务[M]. 北京: 科学出版社, 2001.

[3] 林星. HTML5移动应用开发[M]. 北京: 人民邮电出版社, 2013.

[4] 王易,蓝尧. 微信这么玩才赚钱[M]. 北京: 机械工业出版社, 2014.

[5] 中国移动通信集团江苏有限公司. 南京智慧旅游客源分析系统技术方案[Z]. 2014.

[6] 中国移动通信集团江苏有限公司. 打造掌厅主入口 促进互联网化营销转型的探索与实践[Z]. 2015.

[7] 中国移动通信集团江苏有限公司. 江苏公司集团市场入口布局汇报[Z]. 2015.

[8] 程德杰. 电信运营商真正的优势在于大数据分析[J]. 移动通信, 2013(17): 76-77.

[9] 陈科帆,周洪成. 电信运营商大数据资源变现模式及策略研究[J]. 移动通信, 2016(1): 63-67.

数据分析的前景篇(4)

2深圳南山科技创新景气指数构建方法

2.1指标选取与数据处理

2.1.1指标筛选

在深圳市南山区统计局的支持下,本文收集了与科技创新活动相关的季度指标53个,季度数据1378个,覆盖年份从2007年1季度到2013年2季度共26个季度,涵盖了南山区高新技术、电子信息、生物医药、新材料,光电一体等几大产业。根据数据的缺失情况,以及指标的重要性和波动性,配合科技创新的过程、结构维度进行指标的筛选。

2.1.2数据处理

由于原始数据在统计过程中不可避免的存在某些失误,为了避免这些数据对分析结果造成损害,因此有必要对原始数据进行处理。本文中把数据正常值界定在内,对异常值和缺失值通过均值法或线性趋势法对其进行替换。对数据进行初步处理之后,计算相应的同比增长率序列。为了剔除季节变动要素和不规则变动要素给景气指数分析结果带来的负面影响,本文采用Eviews中X-12法对数据进行季节调整。

2.2综合景气指数指标的确定

2.2.1基准循环的选取

基准循环既是分析波动周期及波动特征的主要依据,目前国际上正在使用的景气指数有三种循环:古典循环、增长循环、增长率循环。由于目前我国的科技发展速度较快,科技创新投入总量和各项指标都在增长,很少出现绝对量下降的情况,只是增长速度的变化幅度较大,因此本文区域科技创新景气分析采用同比增长率循环法来反映科技创新指标的变化情况。

2.2.2基准指标的确定

景气指数体系是以基于有关科技创新变量相互之间的时差关系来指示景气动向的。基准指标就相当于衡量其时间序列先后顺序的尺度。根据重要性、波动性以及能够敏感反映科技创新变化活动的原则,本文选取了正在申请专利数量为基准指标。这主要是由于专利的申请数量能准确的反映一个区域的科技状态,同时它也是科技力量强弱的一个重要标志。

2.2.3科技创新景气指数指标分类

对初选指标进行筛选后,按这些指标与基准指标之间的时差关系划分为先行、一致和滞后指标组。分组的方法很多,目前采用较多的主要有时差相关分析法、K-L信息量法、聚类分析和谷峰对应法。根据各方法的性质和要求,本文选用时差相关分析法对景气指标进行分析。

2.3科技创新景气指数构造

2.3.1南山区科技创新扩散指数计算

扩散指数(DI)是在对各个科技指标循环波动进行测定的基础上,所得到的扩张变量在一定时点上的加权百分比,能有效地预测科技创新循环的转折点。

2.3.2南山区科技创新合成指数计算

扩散指数虽然能有效地预测科技创新循环的转折点,但不能明确地表示循环变化的强弱,不能反映波动的振幅。而合成指数正好能弥补这些缺点,本文用美国商务部的合成指数计算方法来构建科技创新的景气指数。

3南山科技创新景气指数分析

3.1长期景气波动分析

从总体来看,根据一致合成指数的走势,深圳南山区的科技创新景气指数可划分为四个阶段。

3.2短期景气波动分析

深圳南山区的科技创新景气指数是基于季度数据进行测度的,因此具有更好的时效性。有助于动态地把握科技创新活动的状态,并对制定相关的政策给予辅助。结合近几个季度的走势分析看:(1)先行指数反弹明显,科技创新有望走出不太景气的状态。先行指数在经过11年下半年的低迷之后于12年1季度出现阶段回升,并于2季度上升至100.69,但是上升势态并不稳固,小幅波动之后进入一个企稳回升的上行期,预示着后续季度科技创新景气指数有向好的趋势。(2)一致指数上行企稳。科技创新景气指数在前几年出现了逐季下行的走势,由11年3季度的景气高点下滑到12年3季度的景气历史次低点,景气度由此进入一个不太景气的低迷状态。但是,最近几个季度的数据显示,景气状态逐渐回暖,连续四个季度景气值稳步回升,由99.62微张到13年2季度的100.57,一致指数上升势态明显。(3)景气预警指示灯显示南山区科技创新景气状态由11年3季度的非常景气逐渐下滑到12年3季度的不景气,12年3季度和13年1季度连续显现2个季度不太景气的预警信号,但13年2季度的景气状态出现回暖状态,进入正常状态。最近几个季度的综合预警灯信号表明,深圳南山区的科技创新活动经过一个低迷期后进入一个回暖上升通道。

4主要研究结论

本文以创新周期为理论基础,基于季度数据构造了南山区的科技创新景气指数,为政府科技政策和科技统计工作的改革提供了示范基础,主要得出了以下结论:

结论1:本文的数据是基于深圳南山区科技统计改革的成果,采取季度数据,对测度区域科技创新发展具有很好的时效性;利用合成指数方法构建的创新景气指数能清晰地反映科技创新状态由下降、稳定、恢复到增长的波动特征以及转折点,有助于对我国区域科技创新景气状态进行测度和监测,这是目前以基于年度数据和简单指数构建方法做出的创新指数所不能及的。

数据分析的前景篇(5)

1 前言

1.1 各景区节假日期间持续爆满

2012年9月30日-10月7日中秋、国庆节长假期间,全国纳入监测的119个直报景区点共接待游客3424.56万人次,同比增长20.96%;旅游收入17.65亿元,同比增长24.96%。9月29日至10月6日,民航全国累计共发送55926班次,运送旅客人数760.71万人次;铁路全国累计共发送旅客6095万人次,同比增长9.4%。各地旅游景区游客接待量超过最佳接待量1倍以上。其中,南京中山陵为最佳接待量10倍,厦门鼓浪屿、敦煌莫高窟为最佳接待量8倍,北京故宫、山西平遥古城为最佳接待量5倍,宁波溪口景区、湖南衡山为最佳接待量4倍。

自驾车旅游异常火爆。2012年的中秋、国庆假期,是国务院出台小型客车免收高速公路费政策执行的第一个长假,自驾游成为今年黄金周一大亮点,很多地方甚至呈现井喷之势。上海主要高速公路道口进、出沪客车数分别为83.59万辆次、116.56万辆次,分别同比增长41.27%、71.41%;辽宁自驾游车辆比去年同期增长80%左右;贵州自驾车游客占接待总人数的55%,其中4A级以上景区自驾车游客比重均超过70%。

国内热点景区持续爆满,纷纷迎来史上最热“黄金周”。 故宫博物院仅10月2日一天就接待游客数超18万人次,创造了历年接待游客最高值;四川省九寨沟、黄龙等21个传统景区(点)共接待游客234.4万人次,按可比口径增长17.95 %;湖北各旅游景区10月2日-4日先后迎来旅游接待最高峰。

1.2 政策导向

2012年8月27日提请全国人大常委会审议的旅游法草案对旅游安全作出一系列相关规定,指出县级以上人民政府统一负责旅游安全工作,景区实行旅游者流量控制制度。草案规定,县级以上人民政府应当依法将旅游应急管理纳入政府应急管理体系,制订应急预案,建立旅游突发事件应对机制。突发事件发生后,当地人民政府及其有关部门和机构应当采取措施开展救援,并协助旅游者返回出发地或者旅游者指定的合理地点。而景区实行旅游者流量控制制度,不得超过景区主管部门核定的最大承载量接待旅游者。旅游者可能达到或者超过最大承载量时,景区应向当地人民政府报告,景区和当地人民政府应当及时采取疏导、分流等措施,旅游者应当予以配合。

草案同时规定,旅游经营者应当依法取得安全生产资质,严格执行有关标准、安全技术规范以及消防的有关规定,制定旅游者安全保护制度和应急预案。

《旅游法(草案)》进行二次审议中全国人大法律委、国务院法制办等部门建议增加规定:景区应当公布景区主管部门核定的最大承载量,制定和实施旅游者流量控制方案,并可以采取门票预约等方式,对景区接待旅游者的数量进行控制。

2 系统建设思路

2.1 基础数据源

通过实施采集运营核心交换机上的用户话单数据,包括通话话单、短信话单、VLR话单,尽可能高频次的获取用户位置信息,提高游客采样的精准度。

2.2 分析处理

对清洗后的基础数据进行数据分析处理,了解游客的行为特征,为旅游局提供多方面的统计分析和决策支持。

2.3 提前预防

为景区提供游客人流量预警阀值,一旦人流量超出阀值,自动触发分流短信,为游客提供景区的实况信息,确保旅游活动质量;同时也为景区提供应急短信发送功能,避免景区发生安全事故后出现拥挤踩踏事件发生。

3 业务功能分析设计

3.1 功能架构图

如图1所示。

3.2 业务功能设计

3.2.1 游客行为分析

(1)景区概况总揽。提供本地所有景区的实况预览,包括游客数量和景区人流量情况(通过地图上的景区范围的颜色表示)。

(2)所有景区接待统计。提供本地所有景区的游客数量统计,可按照本地游客、外地游客、所有游客统计,也按照年、月、日统计;提供多样化的展示方式如柱状图、饼状图、曲线图、数据列表。

(3)单个景区接待统计。统计各个景区某段时间内的游客数量,可按年、季度、月、天统计,游客可按全部游客、外地游客、本地游客分别统计,可同比显示去年同期的统计。

(4)景区平均逗留时间统计。统计本地所有景区的游客平均逗留时间,可按年、季度、月、天统计,游客可按全部游客、外地游客、本地游客分别统计。

(5)游客旅游天数统计。统计所有外地游客的旅游天数,可按年、季度、月、天统计,具体包括一日游、二日游、三日游四日游、多日游,可同比显示去年同期的统计。

(6)游客来源地统计。针对本地所有外地游客,按照来源地进行统计游客数量,可按年、季度月统计。

(7)景区游客排行统计。根据本地所有景区的游客数量进行统计排行。

(8)景区游客来源地统计。针对各个景区,按照来源地进行统计游客数量,可按年、季度、月、天统计。

(9)景区新增游客统计。统计各个景区在每个小时内新增的游客数量,可选择经典和日期查询。游客可按全部游客、外地游客、本地游客分别统计,可同比显示去年同期的统计。

(10)景区实时流量统计。统计显示各个景区在整点时间的实时在园游客数量,可选择经典和日期查询,可同比显示去年同期的统计。

3.2.2 数据维护

数据维护功能包括:小区信息配置、景区信息配置、景区范围绘制等。

3.2.3 景区短信发送

该功能包括预警短信发送、应急短信发送。

4 系统详细设计

4.1 系统架构说明

游客采样分析系统主要用于支撑旅游主管部门的旅游资源状况分析、游客属性和行为分析及应急预警等业务需求。从总体架构来看,整个系统分为两个层面,底层是电信网络数据采集层,使用电信业务的游客,在发生通信行为时,系统将采集用户的位置信息,并存储在移动网络数据库中。系统的另一层面是移动数据分析层和展示层,游客采样分析系统,对移动网络数据进行分析,挖掘,将分析结果存储在分析结果数据库中,最终用户通过B/S结构的web系统,登陆访问,获取最终的展示结果。

4.2 系统运行环境说明

系统架构在基于Java EE规范之上,采用Java语言开发。为了减低投入运营的成本后台应用服务器的系统框架采用Redhat Linux+JDK6 + Apache2.0 + Tomcat6 ;用户端采用基于web访问的方式进行管理和配置。

(1)操作系统:RHEL 6。

(2)遵循标准:HTTP、SOAP、REST、Socket 7。

(3)数据协议:JSON、BJSON、XML。

(4)Web服务器及中间件:Nginx 、Apache Tomcat。

(5)缓存:采用memcached分布式缓存系统。

(6)数据库:Oracle 11g。

(7)开发工具:Eclipse IDE、Power Designer、PL/SQL Developer。

(8)系统结构:多层分布式B/S架构。

(9)表示层:使用Struts2 MVC框架。

(10)业务逻辑层:使用Spring3管理业务逻辑,实现依赖注入和面向切面编程。

(11)持久层:采用Hibernate 3、JPA等持久化框架。

(12)Ajax:采用jQuery等JS库优化用户体验。

4.3 系统组网方案

为保证大网话单数据安全,系统通过三道防火墙,不同服务器部署在不同网络上,物理上进行隔离,确保数据安全:

(1)大网话单数据经加密处理后,通过第一道防火墙,提供给系统的数据采集及数据处理服务器,采集服务器进行接收处理后,保存到系统的数据库服务器中;

(2)数据库服务器通过第二道防火墙提供给系统的WEB应用服务器访问;

(3)WEB应用服务器通过第三道防火墙(出口),统一给短信网关、 合作伙伴等提供各类服务。

5 系统接口设计

5.1 提供给外系统接口

5.1.1 游客行为分析对外接口

将游客采样分析的统计结果按照汇聚平台提供的“接口规范”提供给汇聚平台。

5.1.2 短信发送数量统计接口

将平台短信发送数量结果按照汇聚平台提供的“接口规范”提供给汇聚平台。

5.1.3 短信行业网关接口

实现系统的短信发送接口联调。

5.2 与周边系统的接口

移动网络数据获取接口,实现从大网网络话单数据中心实时获取话单数据。

5.2.1 动态数据需求

(1)基础数据要求。提供运营核心交换机的用户话单数据,包括如下:

a. 通话话单:用户号码(Msisdn)、用户当前位置(lac+cell)、通话时间

b. 短信话单:用户号码(Msisdn)、用户当前位置(lac+cell)、短信时间;

c. VLR话单:用户号码(servedMSISDN)、更新前用户位置(oldLocation)、更新后用户位置(newLocation)、更新时间(updateTime)

(2)频度需求。根据核心交换机确定,建议一分钟发送一次话单。

(3)接口方式。接口说明:该接口是指运营商将用户话单数据传输至我们系统的采集服务器。

考虑每次传输的数量相当大,接口方式建议:ftp server,核心交换机网管中心定时发送话单文件。

系统也可定制开发接口主动获取数据。

5.2.2 静态数据需求

(1)基站信息:基站名称、基站cell id、基站位置(可选)。

(2)号段信息:号码前缀、号段对应地区。

(3)导入方式:Excel表格导入。

6 结束语

本系统旨在为景区管理者提供实时流量监控、客流预警、客源地分析等功能,以满足旅游管理需求,为旅游运营管理的措施、政策等提供决策支持定量分析,具有较强的先进性和可操作性,系统的实施对未来在全省乃至全国大规模的建设可以起到积极的示范作用。

参考文献

[1]汪纯孝,温碧燕,姜彩芬.服务质量、消费价值、旅客满意感与行为意向[J].南开管理评论,2001(06).

[2]汪纯孝,温碧燕,姜彩芬.顾客的服务消费经历与行为意向的实证研究[J].中山大学学报(社会科学版),2001(03).

[3]何玉荣,张鑫.体验旅游时代导游服务效果的实证研究[J].皖西学院学报,2011(01).

[4]许丽君,江可申.基于合同与感知导游服务质量的模糊综合评价[J].北京第二外国语学院学报,2007(11).

作者简介

数据分析的前景篇(6)

随着社会信息化程度的不断加深,旅游业也不可避免的逐步实现信息化。开发商在对旅游目的地进行开发前,一定要对该地的时间、空间等信息做到充分了解,从而做出最适宜的开发计划,使该旅游目的地的资源潜力得到充分挖掘,防止资源被浪费,资源的自身价值也将充分得到实现,也能最大限度吸引观光客;规划人员在确定旅游线路前应充分了解旅游景区的地理、属性等信息,进而规划出最适宜的线路,既能保证游客的要求得到满足,又能节约其旅游成本;游客在确定旅游方案前,对景区的服务、路线、沿途旅社、交通状况等要进行充分了解,以便确定出最佳旅游方案和旅游方式。从上述表述可知,现代旅游业发展离不开信息技术建设,地理信息系统也为现代旅游业提供了大量的空间地理数据。因此现代旅游业的发展过程离不开地理信息系统的支持。

旅游业的各个部门几乎都能发现GIS 的身影,总体上可将其划分为下面几方面:信息查询、景区开发与规划、专题制图、景区资源评估以及动态监测。下面具体对各个方面进行分析。

二、信息查询

现代旅游业在发展过程中需要大量使用空间地理数据,如各景点的具体分布位置、规划游览线路图、服务点位置、出行道路、通信状况等都与地理属性密切相关。应用GIS后就能迅速、全面、准确的获知旅游地的地理信息,使用GIS技术建立空间信息数据库,就能实现对海量信息的管理与调用,并在电子地图上对这些空间或非空间的信息进行集成,再利用已建好的数据库系统对其实行统一管理,方便检查。当前GIS被大量应用到旅游信息系统的开发中,电子地图资源和有关查询页面也大量充斥网络,进而为旅游开发决策者提供大量的信息,使其在景点位置分布、旅游线路选定、目的地环境、服务设施等方面做出更好的决策。旅游目的地在电子地图上必须醒目,可使用鲜明的图标标注出来,这样有利于将其所处的空间位置,及其所处城市和周边城市的邻近关系直观的展现出来。在选择旅游路线时,若只有两地,就使用有权图的算法,将最短路径计算出来;若线路上要经过多个目的地,就使用遍历多目的地的方法,计算出最短路径,并将确定好的路径使用鲜明的线性图标在电子地图上标注出来。将依据算法计算出的结果,在空间数据库中进行搜索,并把得到的数据用文本的形式标注在电子地图旁边,使用户对结果了解清楚。电子地图上应反映出旅游目的地大致环境,因此可采取图层叠加的方法或指标分类的方法,在地图上反映出环境实况。电子地图上也应反映出旅游景点的各种服务设施的分布状况,因此应在地图上将其标注出来,让使用者能直观对其进行了解。在确定设施缓冲区范围前要了解相关点或线状标识的情况,避免出现设施服务范围定位不当的情况。范围确定后就能进行服务设施配置工作,并依据空间叠置理论,估算出较为准确的服务设施的服务范围及客流量。

除上述系统,绝大部分的系统都会提供大量的服务信息给使用者,其中包括旅游基础地理、旅行社服务、交通状况、餐饮与娱乐、酒店服务、多媒体形式的景点等,与之相对的系统包括饭店管理信息系统、旅行社管理信息系统、旅游交通信息系统、旅游资源管理信息系统以及旅游规划信息系统等,上述系统能尽可能的给使用者提供详尽的旅游信息,使用者将依据其中的有效信息做出最佳决定。

三、旅游的开发与管理

GIS技术能对空间数据进行快速分析,决策者可据此展开旅游景点开发、管理工作。

(一)资源空间价值评估。当前,旅游业大多使用GIS 技术对旅游目的地进行资源空间价值分析,并将分析数据用空间数据库统一分析整理,进而建立空间价值评估模型,再使用GIS软件在电子地图上对资源价值进行评估。在正式开发前运用GIS技术分析旅游资源的空间价值,可促进资源的合理配置,避免出现资源浪费的情况,使资源最大限度的发挥作用。

(二)发展前景分析。一个地区在开发旅游地前必须要对其发展前景进行分析,不能盲目开发。分析时可使用GIS工具,具体应分析当地的土地状况,为景点规划和场地开发打基础,再应用层次分析的方法对当地的自然、政治、经济、以及文化等与旅游有关的要素进行分析,并使用GIS软件根据分析数据绘制相关图形,再将图形进行叠加处理,进而有效了解当地关于开展旅游业的相关情况、政策以及经济现况等,进而评估土地开发方案的可行性。

(三)环境空间布局分析。对旅游地的环境空间进行分析主要指分析环境廊道规划。也就是分析水体湿地和地形坡度以及植被布局等主要环境因素的情况,可将上述因素的实际分布状况各自用图层进行绘制,并把这些图层叠加起来构制出分析图层,分析图层内出现重叠位置就是空间廊道的最佳分布位置,运用这张环境廊道分布图,就能对旅游地实现合理规划。

(四)分析景点的空间配置状况。GIS技术能实现旅游景点的视域和服务设施空间配置状况的有效分析。运用GIS技术能在电子地图上精确标注出景点的区域空间信息,使视域分析的结果更加精准。分析景点的服务设施主要是指对景点内的植物、盆栽、小路、凉亭以及洗手间等各种服务设施的布局合理度进行分析,使其能贴合游客的时间需求和生理特征需求,进而让游客得到生理上和心理上的双重满足,加大景点对游客的吸引力。

三、绘制游览专题图

绘制游览专题图是GIS的一个重要功能,其在这方面优势十分明显。许多系统都在应用GIS技术绘制出分层后的游览专题图,以供用户使用。GIS软件具有十分强大的绘图能力和文本编辑能力,可将地理数据录入空间数据库内进行统一管理,省却了数据调用的麻烦,在绘制专题图时可统一将数据的相关属性进行显示,同时应用约定模板,进而大大降低制图的复杂性,有效减少出图成本。应用GIS技术绘图还能对图形进行分层管理,同类要素将划分到同一层,各图层在进行修改时不会影响其他图层。也能依据用户的实际需求对叠加相关要素后进行显示,如导游图和旅游路线图以及旅游交通图等不同种类的专题图。

四、资源价值评估

旅游资源价值评估主要指对旅游资源进行外在表现以及内在性质的价值评估,包括评估资源本身价值、评估旅游地的开发价值和利用价值、评估其市场价值等。旅游资源价值评估的主要关心人员是旅游管理者,其和游客的关系不大,但评估结果会对资源管理产生影响,应引起关注,主要是对旅游资源进行全面的价值评估时能促进服务设施的配置合理性。GIS强大的空间分析能力可在进行资源分析时将各项因素综合考虑进去,使管理部门有更全面的数据支持,评估结果也将更加客观、准确。分析旅游资源本身时,主要分析其的质量特征和聚散程度,并在环境可容纳的范围内给出评估指标;在评估旅游资源的开发可行性时,要将旅游地的气侯和交通以及服务设施配置等因素考虑进去,并结合游客的生理特征和心理需求,给出可行性报告;在分析旅游地的客源市场时,可将该地区的人口分布和景区吸引力及其目标群体等情况综合考虑进去,并对旅游地进行缓冲区分析以及空间叠加分析,再使用加权为其在电子地图规划出服务范围,以便准确圈定其客源市场。

五、动态监测

动态监测的对象是旅游景点的各项指标,可将监测得来的数据运用波动曲线或柱状图表示出来,进而使决策者的分析及决策都有据可查。为了及时预知旅游景点的自然灾害状况,可通过连续观测的方法获取景点的地理环境数据,并及时进行数据分析,根据分析结果为旅游景点的自然灾害做出风险指标、收益损害测度指标、灾害防范体系等。运用GIS技术将监测数据分析后绘制成图,使管理部门通过观察图了解旅游景点潜在的灾害威胁,以便使景点的环境得到有效改善。定期进行调查,主要调查游客对旅游景点的交通状况及对服务设施是否满意,并对调查数据进行分类,经分析后得出旅游景点的服务质量,进而编制出游客满意度指标,再结合分类后的统计数据,制订出短期内发展的具体方案。

数据分析的前景篇(7)

中图分类号:G4

文献标识码:A

doi:10.19311/ki.16723198.2017.01.080

1引言

管理定量分析课程是应用统计学、运筹学、预测与决策等理论和方法研究经济管理问题的系列应用性课程,它通过收集、整理、分析和解释实际数据来获得有价值的信息和知识,探索经济管理问题的运行规律,辅助企业管理决策和提高管理效率。

近年来,大数据的出现对企业的生产、经营和决策等活动带来了深刻的影响和变换。越来越多的企业致力于应用大数据技术来挖掘企业经营数据的内在价值。

大稻菁际醯某鱿郑对管理定量分析课程教学带来了机遇和挑战,一方面,它极大地丰富了管理定量分析的教学内容,提供了诸多的新理念、新技术和新工具;另一方面,它对现有的管理定量分析课程的教学内容、教学模式和教学团队等带了更高的要求,已有的教学模式难以匹配大数据时代对管理人才提出的高要求。

如何顺应大数据时代的新趋势开展管理定量分析课程教学,如何结合新趋势优化管理定量分析课程设置,如何建立适应大数据背景下的管理定量分析课程教学团队,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是现有的管理定量分析课程教学所面临的问题,这也促使我们不得不去思考、探究、优化甚至改革现有的管理定量分析课程教学模式。

2现有的管理定量分析课程教学概述

笔者所在的教学团队来自于武汉科技大学管理学院,承担全院《管理统计学》、《运筹学》、《系统工程》等课程教学,具有丰富的教学经验。然而,在教学实践当中,我们发现:尽管现有的管理定量分析课程教学模式比较成熟,但是仍存在“三多三少”的不足,而这些不足恰恰难以应对大数据背景下对管理定量分析课程教学带来的挑战。

2.1理论讲授较多,实践教学较少

随着市场竞争的日趋激烈,越来越多的企业采用定量分析方法进行企业决策,管理定量分析方法也成为管理类专业的重要课程。然而,实际教学过程中却发现,学生对该类课程的积极性不高,学习过程中出现畏难,不耐烦等消极情绪,导致实际教学效果大打折扣。

究其原因,一方面,目前的管理定量分析方法主要介绍各种不同类型的定量方法的原理、模型和理论,因而教师主要采用理论讲授为主的教学手段,加上定量分析方法这类课程对数学要求较高,有不少理论模型、数学公式和逻辑推理,对学生的数学要求较高,相对于理工类学生,管理类专业的学生数学基础较为薄弱,因而学生本能地会产生排斥心理;另一方面,现有的定量分析方法主要讲授其原理,大部分老师缺乏参与企业实际管理决策的经历和经验,难以向学生讲授应用定量分析方法解决企业实际管理决策的情景和过程。

2.2数学推导较多,案例应用较少

目前,关于管理定量分析课程教学存在两种观点:一种是“重理论轻应用”,该种观点认为管理定量分析课程是一门综合统计学、运筹学、预测与决策等理论和方法的理论课程,应该注重定量分析的理论和方法的讲授,以理论推导和数学模式为主;另外一种是“轻理论重应用”,该种观点认为管理定量分析课程应该强调统计学、运筹学、预测与决策等在经济管理中的应用,以Excel和SPSS等工具为手段,突出应用案例教学。

目前,“重理论轻应用”的教学模式占大多数,这种模式注重理论讲授和数学推导,理论方法与实际案例结合不够,学生掌握了零散知识,但无法解决实际问题。此外,部分教材也以理论讲授为主,缺乏深度的应用案例,也不注重定量分析软件的应用,学生面对实际问题往往束手无策。

2.3知识传授较多,综合训练较少

管理定量分析课程考核一般采取闭卷考试,题型包括填空题、单项选择题、多项选择题、简答题和计算题等,尽管题型多样,但是这种考核方式仍然只能考察学生对基本的单一知识点掌握情况,难以考察其综合运用定量分析方法解决实际问题的能力。

然而,大数据时代的到来对从业者提出了更高要求,除了掌握基本的定量分析方法原理,还要求从业者具备应用定量分析方法来实现数据获取、数据预处理、统计建模、模型检验、模型评价、模型部署等,从而解决实际问题的综合能力。而这些综合能力无法通过单一知识点的考核来实现,需要通过参与理论学习、软件操作、模拟场景或实际项目等综合训练才能够达到。

3大数据背景下管理定量分析课程教学探讨

面对发展迅猛的大数据技术,现有的管理定量分析课程教学模式难以跟上大数据时代对其提出的新要求。如何顺应大数据时代的新趋势开展管理定量分析课程教学,如何结合新趋势优化管理定量分析课程设置,如何建立适应大数据背景下的管理定量分析课程教学团队,如何增强大数据背景下学生的数据驱动的管理决策意识,培养适应大数据时代要求的高素质人才,这些都是现有的管理定量分析课程教学所面临的问题,这也促使我们去思考、探究、优化甚至改革现有的管理定量分析课程教学模式。

3.1构建知识融合的课程设置

合理的课程设置是开展课程教学的前提,更是人才培养质量的重要保障。课程设置应适应于教学目的、培养目标和学科发展趋势。

最初,管理定量分析课程以“统计学”、“运筹学”为主干。随后,根据学科的发展趋势,先后加入“统计软件应用”、“计量经济学”等新课程。近年来,大数据的发展对从业者提出了更高要求,简单定量分析方法传授难以适应新要求,需要从业者掌握更多的分析方法和数据挖掘、机器学习等新技术。遵循知识融合的思路,管理定量分析课程应引入大数据分析、数据挖掘、机器学习等前沿技术,加强SPSS/SAS/R等操作能力,尤其应注重培养应用新技术解决企业实际经营管理问题的能力。

3.2探讨案例驱动的教学模式

尽管目前的管理定量分析n程有多媒体教学、板书教学等方式,但是管理定量分析课程仍以理论教学为主,简单统计工具应用为辅,忽视了培养学生的实际操作能力,无法形成“教-学-用”的良性闭环。

大数据时代下,数据拥有更大的价值,从业者应具备从数据中挖掘知识和信息的能力。因而,管理定量分析课程应引入实际案例,综合训练应用定量分析方法解决实际问题,挖掘新知识和新信息的能力。

管理定量分析课程教学应逐步转向理论传授、案例驱动相结合的模式。近年来,业界出现了不少应用大数据解决企业管理决策问题的案例。例如IBM开展基于大数据的订购分析;Google利用大数据预测全球流感趋势;百度预测春运流量等。这些都为管理定量分析课程教学提供了丰富的案例。

在课堂教学之外,通过参加大数据竞赛、邀请大数据分析专业人员开展讲座,参加科研项目,参与企业实习等,培养学生应用SPSS/SAS/R等处理和分析数据的综合能力。

3.3建设学科交叉的教学团队

管理定量分析课程教学离不开教师和教学团队的支持。大数据对管理定量分析课程教学提出了新要求,新背景下的管理定量分析课程教学涉及统计学、运筹学、统计软件、计量经济学、数据挖掘等不同学科的知识,因而建设一支适应大数据背景下的新要求的管理定量分析课程教学团队尤为重要。

目前,管理定量分析课程的教学师资主要以统计学和运筹学等学科背景为主,大部分老师未掌握数据挖掘、机器学习、R、SPSS等,建设学科交叉的教学团队是课程教学质量的重要保障。新型的管理定量分析教学应加强SPSS、R、数据挖掘、机器学习等的学习,建立学科交叉的教学团队,加强管理统计软件和数据挖掘等训练,注重理论教学和上机实践的结合,培养学生应用分析工具进行实践的能力。

4结语

管理定量分析课程是一类应用统计学、运筹学等理论和方法研究经济管理问题的系列应用性课程。大数据技术的迅猛发展对现有的管理定量分析课程教学带来了极大的挑战。本文以大数据背景下的管理定量分析课程教学模式为主线,首先,分析并总结现有的管理定量分析课程教学的“三多三少”的特点和不足;其次,结合大数据背景探讨了新型的管理定量分析课程教学模式,提出了:(1)构建知识融合的课程设置;(2)探讨案例驱动的教学模式;(3)建设学科交叉的教学团队的新型管理管理定量分析课程教学模式,它融合了课程设置、教学模式和团队建设,注重定量分析理论和应用的结合,有助于顺应大数据时代对管理类专业学生的新要求,培养他们的数据驱动的量化分析和管理决策意识,增强其解决实际问题的能力,进而提升其职业竞争力。

参考文献

[1]顾剑华.关于工商管理专业管理定量分析课程建设的思考[J].当代教育论坛,2009,(4):127128.

[2]邓淇中,周志强.管理定量分析课程教学改革探讨[J].当代教育理论与实践,2013,5(4):9294.

[3]龚丽.管理定量分析课程的教学探讨[J].大学教育,2014,(17):111112.

数据分析的前景篇(8)

中图分类号:F592.3 文献标识码:A 文章编号:1672-3791(2011)09(a)-0237-01

1研究背景和意义

随着旅游业的蓬勃发展,地理信息系统(Geographic Information System,GIS)作为一种通用技术,在国内外旅游领域的应用呈不断扩展的趋势[1]。旅游业是与地理信息相关性极强的行业,GIS中的诸多要素如图件、区域景观资源、交通路线等与旅游密不可分。借助于GIS的空间数据的检索功能,不仅可以从系统中查出所需的属性信息,而且可以直观地以图形方式看到信息实体的分布,为管理和决策人员掌握旅游资源空间分配、实时动态变化、最佳线路设计以及最佳景点组合方案提供科学的依据[2]。中国科学院遥感应用研究所研制开发了国家旅游资源信息系统,王铮等在论著中用较大篇幅阐述了旅游GIS的应用与研究进展,较为详细地介绍了部级管理旅游资源系统研究与开发、旅游空间分析等方面的旅游GIS应用与研究[3]。

在河南省利用GIS技术进行区域旅游与环境的网络分析的主要目的包括以下几个方面。一是提取河南省省市界,河南省高速路和国道道路网,河南省著名旅游景点,为环焦作云台山旅游业提供更为直观的基础空间数据。二是依据区域地势特征与道路特征分析旅游最佳路线,及服务区覆盖范围。

2网络分析的前期准备

2.1 主要内容

进行网络分析建模,首先应明确操作对象。网络分析建模的核心内容是对河南省的道路网络进行矢量化提取,建立拓扑,生成网络数据集。旅游景点也是网络分析的主要对象,依据河南省旅游专题地图对景点进行矢量化。

2.2 设计流程

根据主要研究内容,选取遥感影像、DEM、等高线、行政区划图等原始数据,利用ArcGIS、MapInfo、Global Mapper等工具实现旅游信息可视化。

2.3 数据处理及软件的选择

(1)数据来源。本研究基础地理数据取自1比25万数字地图。(2)软件选择。由于原始数据格式不统一,首先通过ArcGIS、MapInfo、Global Mapper等相关工具进行转换,最终统一生成ArcGIS的“.shp”文件。

3河南省旅游道路网络数据集的生成

3.1河南省旅游景点数据库的建立

本研究是基于GeoDataBase空间数据库理论建立以河南省为对象的旅游信息空间数据库。共包括三个数据集,六个要素类,课题研究以河南省旅游景点为对象,以河南省国道和高速路及其它主干道所形成的道路网络为途径,河南省行政区划为范围,进行景区网络分析。

3.2 河南省行政区划图,主干道路网络,主要景点的获取

(1)投影变换。在地理信息系统中广泛采用各种不同的地图资料。这些地图资料数据进入GIS数据库时,首先必须进行转换,以统一在同一个地理定位框架之内,用共同的地理坐标系统和网络坐标系统作为参照系来记录存储各种信息要素的地理位置和属性,从而保证同一GIS系统内,甚至不同的GIS系统之间的信息数据能够实现交换、配准和共享。

(2)在已给的数据基础上提取河南省的行政区划图面要素类并提取河南省的著名旅游景点、交通站点要素类。用追踪工具(tracking)对给定的数据进行图面要素类的重新矢量化,再依据河南省的旅游景点分布图和河南省的交通专题地图,进行配准后矢量化,提取相应点要素。

(3)提取河南省的道路线要素类。依据河南省交通图,对给定的道路线要素图层进行配准提取出国道,高速公路和通往景区的主要道路,并且给主要等级道路都在属性字段加入通行时间,通行交通费用,用于网络分析。

3.3 河南省主干道路网络拓扑的建立

创建拓扑关系流程图,如图1所示。

3.4 河南省旅游道路网络数据集的建立

现实世界中,人员的流动、货物的流通、信息的传递、能量的传输等等,都是通过可确定的网络系统来进行的。本课题要建立的网络数据集权重参数包括长度、时间,通行费(Length,Hours,Spend)用于进行多种网络分析。

3.5 河南省旅游道路网络分析

(1)河南省旅游景点服务区分析分析。以云台山、少林寺、龙门石窟、殷墟、清明上河园、宝天曼、鸡公山为例进行100km,200km的服务区分析。(2)河南省旅游景点最短路径分析。以云台山、少林寺、殷墟、清明上河园、龙门石窟等为例进行最短距离路径分析。(3)河南省旅游景点最近设施分析。以郑州为例搜索距离郑州最近的5个旅游景点。

4应用前景

河南省旅游资源丰富,云台山景区是河南省唯一集国家重点风景名胜区等七个部级称号于一体的风景名胜区。借助于GIS的网络分析功能,不仅可以从系统中查出所需的属性信息,而且可以直观地以图形方式看到信息实体的分布,为管理和决策人员掌握旅游资源空间分配、实时动态变化、最佳线路设计以及最佳景点组合方案提供科学的依据[2],更有利于日益兴起的自助旅游。

5结语

本文在参考国内外大量相关文献及研究成果基础上对旅游信息网络分析方面做了深入的研究,对完全实现数字旅游具有一定的意义:(1)针对与旅游信息相关的不同数据格式、不同数据结构、不同坐标域的空间数据进行了大量的数据组织、数据组织工作,最终实现基于GeoDataBase空间数据库,建立道路、区划、景点站点等多个要素类,为今后的深入研究提供了数据处理经验。(2)基于ArcMap、ArcCatalog、ArcScene、ENVI、Global Mapper等相关系统工具进行GIS的空间分析,主要实现了旅游信息的、旅游最佳路线选择、旅游景点邻近区分析等主要功能。(3)以网络分析为基础,灵活、机动地帮助用户选择最优自主旅游路线。基于GIS强大的空间分析功能,实现旅游景点在给定服务范围的邻近区分析。

旅游信息的可视化研究以及真正实现“数字旅游”是一个庞大的系统,涉及众多相关知识及众多相关部门的协调工作,本研究仅涉及“数字旅游”的基础部分,仍有许多方面需要深入研究有待完善。

参考文献

数据分析的前景篇(9)

尽管目前的IT技术和网络应用发展迅猛,从网络获取包罗万象的资料已经几乎没有困难。然而目前从事档案工作的存放或利用纸质档案获取有用信息还有许多困惑。在不同的工作中积累起大量的数据信息,不同类别和科目,不同的承载体。面对这些有针对性庞大的数据或数据集,如何快速分类存放,如何从中快速检索有用的信息成为档案工作的当务之急。目前借助数据挖掘技术作为采集分析档案的工具是较为便捷的。所谓数据挖掘可以从浩瀚的数据中快速提取潜在有用的信息的过程,尽管这些数据潜隐在巨量纷繁、相互交叠、模糊随机且事先未知的档案事件中。利用这样一个有效的分析工具可以实现快速检索出高校档案中有用信息和相关知识。

本文分别简述各种数据挖掘方法,并举例学校档案管理加以说明,紧扣高校档案管理,叙述在档案管理中应用数据挖掘分析技术的一般步骤,再以三个实际案例来说明利用数据挖掘这个有效工具快速检索高校档案有用信息,最后明确结论数据挖掘作为数字化管理的先进便利高效的工具,在高校档案管理方面大有发展前景。

1、数据挖掘方法

数据挖掘(Data Mining,DM),从大量数据中抽取出有用的信息和知识,形象喻为在庞大数据山中挖掘出有用信息。挖掘数据加以分析的技术可以实现对档案信息在需求量、系统性、时效性和快速检索方面的要求。常用的数据挖掘方法有下列几种:

1.1 关联分析(Association analysis)

关联是反映两个或者两个以上事件之间存在某种依赖或联系规律性。设想在数据集中如果一

项事件或数据与多项数据之间的相关联系,那么其中一项的属性值就能够依据其相关项的关联属性值推测出来。关联可分为时序关联、因果关联和简单关联,利用关联分析的目的就是找出数据集中所有频繁相关属性项目集,这是数据挖掘中最成熟的技术之一。例如教师教学档案与科研档案的关联,可以发现与教师的成长和发展有很大关系;还可以发现学生的学籍档案与专业发展的关联,得出学生就业率的变化趋势。

1.2 聚类分析(Cluster analysis)

聚类是把数据按照标定距离d或相似度r划分成若干组别,“物以类聚”即同一组中的数据均在标定距离和划定的相似度以内,不同组中的数据之间则保持较大标定距离和相似各异。聚类之前不知道组别数和各组的相似特性,聚类分析可以根据标定距离d 或相似度r的取值不同可以将数据分成不同的组别数和共有的特性,从而可以发现数据的分布模式和频度。例如可通过标定分数线定量地将学生分为成绩优秀、良好和一般的几组;也可以通过档案的多种属性列成矩阵分析,定性地将高校档案聚类成不同类别的档案。

1.3 分类分析(Classification analysis)

分类就是按照数据集合的属性和典型特征表述,并利用这种表述构造区分模型,一般用规则或决策树模式表示分类,分类在于事先明确类别,适宜于决策划分大类,而聚类在于标定值的确定后才能明确组别数,可在事后先确定数据的分布模式,适宜于快速找出数据间的差异。例如学校可根据职称将教师分成不同的类别,就可以职称划分并结合工作积累来区分新老教师,以采取不同的待遇分配方案;也可以根据工作属性或评定因子来确定档案类别的划分。

1.4 预测分析(Predictive analysis)

研究历史和当前的数据呈现统计的变化规律,利用动态规律推测未来数据的种类及特征即为预测。通过预测可以对分类进行调整,对聚类进行相似度调适,同时提高快速检索的准确指向性。例如利用学校教职工各支队伍建设培养档案进行预测分析,从而对学校人力资源的配置优化有发展的判断;利用历届学生成绩考核档案的预测分析,可对当前的教学工作做一定的调整。

1.5 偏差分析(Variance analysis)

在数据集中的数据之间存在很多差异,而偏差是对差异和极端情况的数学表征,若发现数据集中数据有偏离异常的现象,偏差分析就可揭示内在原因并作出相应调控。例如在某次物理测试中有30%的同学不及格,为了提高教学质量,教师就要找出这30%不及格同学的动因,作出正确的分析和判断,提高下次测试的及格率。还可以根据历次档案的比对分析,找出数据信息出现偏差的工作原因或档案信息因存放粗忽的失真。

2、数据挖掘应用到高校档案管理中的技术步骤

数据挖掘分析技术要求对档案信息实现数字化管理。从完善高校档案资料的建档、备案、修改、备份、保存等各个环节开始,对档案信息进行录入和数据转换,以实现数字化管理。为提高档案检索和利用的效率,充分利用数据挖掘使查询检索变得更加便捷。数据挖掘分析技术促进了档案管理的科学规范化管理,提高服务效率,还能确保了数据的准确性,提高工作效率,缩短工作时间。

2.1 确立目标,划定需求

利用数据挖掘要避免盲目性,首先就必须清晰地明确要快速检索档案的业务问题,确立利用数据挖掘的目标和划定检索的需求。明确了档案数据挖掘的目标,才能确定检索的需求,制定数据挖掘的计划。

2.2 有效聚集,构建模型

(1)选择数据。在现存档案的庞大数据集和数据库中搜索相关的内、外部数据目标信息,提取适宜数据挖掘的数据信息;

(2)预测数据。分析研究和甄别档案数据信息,有必要进行数据的加工、集成等,剔除重复或异常的数据信息,选择规范的数据并定义数据类型;

(3)数据转换。这一步决定数据挖掘的关键,数据转换就是将档案信息数据转换成可利用的数据,再将数据集成为一个针对挖掘算法的模型。

2.3 筛选算法,实施操作

按照档案的功能、类型和事件转换的数据特性,筛选和优化适宜的算法,对所有经过转换的数据实施挖掘操作。若是良好的算法,其结果没必要完全符合已有数据,但所建模型对大量未知的数据集中的数据信息应有较好的预测。认真考察不同的模型以判断哪种模型对所需解决的问题最有效,这一步是数据挖掘的核心环节。如决策树模型、相似聚类模型都属分类模型,即将一个事件或对象归类;回归分析则是通过具有已知值的变量来预测其它变量的差异值。按时间序列排序即是用变量的过去值来预测未来值。

2.4 评估模型,分析结果

为验证模型的有效性、可信性和可用性,需要对模型进行评估。我们可以预测模型的准确性、运行速度、实现代价和效率精度等属性。分析模型的建立和检验是一个反复的过程,通过这个阶段的分析工作,能使档案检索以最优或较优的模型运行。

2.5 部署应用,快速检索

分析和评估数据挖掘的结果,最终转换成检索用户能够理解的档案事件信息和知识。须将挖掘得到的信息归档返馈给检索需求系统,对挖掘抽取的有用信息采取必要的修正措施,迅速消除与以前信息和知识可能存在的冲突,并将分析所得到结果集成到档案检索结构中去。在应用模型的过程中,还需要不断地对模型进行评估和检验,并采取适当的加工和调整,以适应不断变化的应用环境而实现快速检索。

3、数据挖掘在高校档案管理中的应用

3.1 聚类分析在高校教师教学质量评价中的应用

对高校教师的教学质量评价,办法很多,争议也很多。我们根据聚类分析原理,使用层次聚类分析法是比较科学的。若以分数来评价,教师之间的分数差异很小,水平差异不明显。因此不以分数排名而以分类为好,宜分为优秀、良好、合格和较差四个等级,等级不宜分得太多。

在进行等级分类前,设将教学质量评价指标体系中的十个指标评分,按ABCD四个等级分别记为4、3、2、1分。若有20位教师从事基础课程《大学外语》教学工作,让学生测评,以班为单位,每个学生对任课教师的各项指标打分评价。将20位教师的评价实测数据输入计算机测评系统进行数据处理,按数据挖掘处理要求计算平均得分,最高得分和最低得分,最后将20位教师的评分情况返馈输入计算机分析系统得到20×10矩阵表,再经快速聚类检索:

(1)如果聚成两类,则结果为:

I. 1,2, 4,5,6,7,8,9,10,11

II. 13,14, 3,15,17,12,16,18,19,20

(2)如果聚成三类,则结果为:

I. 1,2, 4,5,6,7,8,9,

II. 10,11, 13,

III. 14, 3,15,17,12,16,18,19,20

(3)如果聚成四类,则结果为:

I. 1,2, 4,5,6,7,8,9,

II. 10,11, 13,

III. 14, 3,15,17

IV. 12,16,18,19,20

这样分类按十项指标评分,再按20×10矩阵数据分堆成类,这比只按照分数累聚进行划分准确和人性化,使水平相近的教师处于同一层次。避免因差0.1分的僵硬因素,使水平相差不大的教师落入不同等级而造成人为矛盾,评价也不客观。其中因为使用了计算机分析处理系统,数据挖掘分析可以按需求迅速得到结果。

3.2 关联分析在高校档案个性化利用中的取向应用

利用数据挖掘算法的关联分析,广泛研究和运用的是决策树算法。以本校档案馆调研用户利用档案情况分析为例,可说明决策树算法在关联分析中的简单明了的作用。一般档案馆要求各用户查阅档案前要进行个人信息登记,用户可以方便的通过各种方式进行查询所需资料和信息。档案馆的工作人员通过信息关联到用户查询,从高校教师用户的查阅兴趣的情况进行关联,可以得到模型树1,其中清楚,年龄在20~30岁之间的年轻职工喜欢调阅成果影响档案,年龄在30~40岁之间的教师大部分是关心学校发展和激励机制档案。而年龄在40~50岁之间的则主要是调阅学校发展档案,很少查阅成果影响档案。再从用户身份关联档案类别得到决策树模型2,分析明确,学校机关人员调研档案的内容和偏好与教师科研人员有明显不同,学校机关人员主要偏重于激励机制的档案,查阅成果影响则主要是教师科研人员。通过关联分析可知,档案人员能够按照教职工的不同要求或习惯,能够有指向性地快速检索,同时为用户组织和提供更多、更好的高质量信息(图1)。

3.3 分类分析在高校新校区绿化建设中的应用[25,26]

分类分析以本校新校区绿化建设布局为例,设定校园绿化建设的定性评价因子,对校园分布的绿化景观建设图片档案进行筛评,最终可快速检索得到绿化景观建设的取向因子评价的分类。

具体作法是选取校园建设中某一绿化景区为研究区域,通过对研究区域的绿化景观设计展评,以500张设计效果为图片档案。其中精选20张具有代表性的设计图,并设定20对形容修饰辞,交由学校师生进行问卷调研。采用正负对称评定尺度,其排序为-2,-1,0,1,2,经整理得出真实的矩阵评价结果。其中列向量1~20分别代表20张设计图,代表校园建设中20个绿化景观。

然后行向量为对图片中景观描述的20对形容辞,1~20依次代表:空间、层次、体积、形体、韵律、幽静、熟悉、色彩、关联、变化、动感、连续、整齐、吸引力、光感、氛围、与主体建筑的协调、植被覆盖、生命力象征、美感。再使用Mathlab多元统计软件对上述的调查数据进行划分类别分析。

从矩阵分类结果看,16、20;12、13;5、9;10、17;2、4两两分别构成同类。

从分析层次图中明确,以d=0.35为界,可以修饰形容辞,把这些校园绿化景观分成4类;

若以d=0.28为界,可以修饰形容辞,把校园绿化景观分成5类:

其中16(氛围)、20(美感)、14(吸引力)、6(幽静)、12(连续)、13(整齐)、19(生命力)、7(熟悉),这些因子定义为氛围因子,它们代表了绿化景观的氛围;

3(层次)、5(韵律)、9(关联)、10(变化)、17(与主体建筑的协调度)、8(色彩丰富)、15(动感)、11(光感),故将这些因子定义为形式因子,它们代表了校园绿化景观的形式;

2(体积)、4(形体),故将这些因子定义为体量因子,它们代表了绿化景观的占有体量;

18(植被覆盖度),故将其定义为环境因子,它代表了校园绿化景观的植被覆盖状况;

1(空间),故将其定义为整体因子,它代表了校园绿化景观的空间感和整体性。通过分类划分可将校园绿化景观评价简化为氛围因子、形式因子、体量因子、环境因子和整体因子。此例通过设计图片档案和繁复的形容形容辞,利用分类分析可以快速检索到随机又能达到满意的权重较大的五因子评价体系。从而可以快速检索到校园绿化景观建设的分类信息。

4、结语

目前数据挖掘(DM)分析仍然是一个全新的研究领域,新的数据挖掘方法和模型在不断更新,随着计算机、网络和数据库等技术的发展,作为高新技术在不断提升和改进,其分析应用领域日趋广泛和深入。虽然这项技术的应用还存在许多待解决的问题,亟待提高的是超大规模数据信息的检索效率。本文通过本校实例说明对档案信息挖掘利用可以快速检索不同档案中的有用信息,使档案部门主动提供有效服务。

参考文献

[1]胡春红.数据挖掘技术在高校信息化管理中的应用[J].长江大学学报(自然科学版),2010,7(3):592-594.

[2]李雄飞,李军.Data Mining and Knowledge Discovery.数据挖掘与知识发现[M].北京高等教育出版社,2003.

[3]Jiawei Han,Micheline Kamber著,范明,孟小锋等译.数据挖掘概念与技术[M].机械工业出版社,2001.

[4]王玮,蔡莲红.关联规则的高效挖掘算法研究[J].小型微型计算机系统,2002,23(6):708-710.

[5]殷云霞,杨松涛.关联规则在图书管理中的应用[J].河南工程学院学报(自然科学版),2011, 23(1):67-71.

[6]许海洋,汪国安,王万森.模糊聚类分析在数据挖掘中的应用研究[J].计算机工程与应用,2005,(17):177-179.

[7]刘放,叶菲.改进的聚类分析算法在高校人力资源管理中的应用[J].皖西学院学报,2011,2011,27(2):39-41.

[8]肖明,李国俊,杨皓东.国内信息资源管理研究热点分析[J].情报科学,2011,29(4):535-540.

[9]崔玉华,李俊杰,刘国华,王东方.基于分类挖掘的企业定单分析系统[J].计算机系统应用,2007,(10):11-14.

[10]程兰芳,陆敏.我国高等教育投入的时序建模与预测分析[J].中国市场,2011,18(5):152-154.

[11]李阳生,未来档案开发利用趋势的预测分析[J].档案学通讯,2002,(2):34-35.

[12]胡小勇,教育信息化政策执行偏差分析与对策研究[J].中国电化教育,2011,(5):35-39.

[13]马秀麟,衷克定,张倩.学生评教偏差分析与控制模型研究[J].现代教育技术,2011,21(2):40-44.

数据分析的前景篇(10)

地理信息系统(Geographic Information System,GIS)是一种采集、存储、管理、分析、显示与应用地理信息的计算机系统,是分析和处理海量地理数据的通用技术[3].它广泛应用于测绘、地图制图、资源管理、灾害监测、国土规划管理等领域.GIS在林业中的应用包括:天然林保护、生物多样性保护、防治土地沙漠化、区域综合治理决策支持等[4].

2 GIS在森林监测中的应用

2.1 森林资源调查与评估

要实现对森林资源的管理,需要获取有用的森林资源基础数据.运用GIS数据获取功能,可以把不同历史时期的森林资源分布图进行矢量化,也可以通过与RS综合应用,解译遥感图像,获取森林资源分布现状.宁晓波等[5]在贵州省森林资源清查及评价工作中引进3S技术,克服传统森林资源清查存在的调查周期长、现势性差、主观影响大、数据可靠性低等问题.结果显示应用3S技术,林业用地的综合判读精度为93.5%,节约成本,取得显著的经济效益和社会效益.荆耀栋等[6]应用3S技术,对新疆维吾尔自治区精河县的精河林场森林资源进行调查、基础数据的处理,并进行合理区划和面积统计.张怡春[7]应用3S技术,通过分析森林资源、森林景观与DEM,对黑龙江东北部汤旺河近40年的森林资源变化进行分析,提出了对林业资源管理利用、生态环境建设方面的重要建议.黎良财等[8]以广西沙塘林场为实验区,将GPS采集到的森林资源数据导入GIS软件中,对准确的森林资源调查方法进行了探索.

2.2 植被监测

森林信息诸如面积、蓄量、类型、林种、树种结构、分布及变动情况等,在很长一段时间内只能通过文字和表格记录在森林资源档案中,在信息更新很快、以低碳经济保护林业资源的今天,显然在很大程度上与主流的经济取向相违背.通过信息网络和新的管理系统,可以实现森林信息的无纸化管理和方便快捷的查询、更新.上述森林信息是处于不断的动态变化中,传统的林业管理方式在数据更新方面需要耗费大量的人力物力和财力,该方法不能对变更的数据及时更新,也不利于数据的传递.抑或是传统的管理数据库能够比较快速地更新数据,但这也仅仅是反映在数量上,而未反映在空间上,难以分析林业空间变化规律和预测变化趋势,给林业管理和决策带来一定的影响.GIS具有较强的空间数据管理和分析功能,它可以有效地对森林空间数据进行组织和管理,提供数据查询、数据分析、成图输出,具有数据库管理、更新、维护等功能,辅助管理层决策.

2.2.1 森林景观监测应用

GIS在描述景观特征方面,具有节省时间和费用、处理较大的信息量、可以对景观进行多层面分析、数据补充和更新快捷等特点[9-10].在森林景观管理中应用GIS技术,可以简化管理程序,促进管理信息化和规范化.曹辉[11]以GIS技术为平台,将福州国家森林公园的森林景观资源进行划分,并评价了景观生态质量.杨珍珍等[12]以大兴安岭呼中林场调查数据为基本资料,利用GIS技术对图形、数据进行处理分析,并结合景观生态学的原理和方法,按用地类型和优势树种划分研究区森林景观要素类型组,选取多项景观格局指标,对其景观的结构分布和空间格局特征进行系统的分析研究.孙玉军等[13]以吉林省汪清林业局金沟岭林场为例,以电子林相图和森林资源二类调查资料为基础,运用GIS技术和景观生态学原理与方法,同时采用类平均聚类法,对林场的景观格局进行了分析,定量地划分森林类型.付春风[14]依据广州市数字化林相图和土地利用图等资料,通过景观组成要素分析,拟定广州市流溪河国家森林公园森林景观分类系统,利用GIS与数字制图手段编制流溪河国家森林公园森林景观类型图.罗龙海等[15]以1999年沐川县森林资源分布图和DEM数据为信息源,运用GIS空间分析功能,用坡度、距离两个分量对沐川林场主要观景线路上森林景观斑块类型进行景观敏感度评价.夏伟伟等[16]以2004年SPOTS卫星影像数据为基础资料,应用遥感技术、地理信息系统技术和多种森林景观结构分析指标,对庞泉沟自然保护区的森林景观结构类型和异质性进行分析.

2.2.2 森林动态变化监测

林木在生长过程中不可避免的受到自然或人为因素的影响,诸如:山体滑坡、植被砍伐等而发生覆盖变化,通过GIS及GIS与其他技术综合应用,可以及时方便地了解森林动态.刘常富等[17]在RS和GIS的支持下,应用景观生态学的理论和方法,借助各种遥感影像,采用景观空间格局指标定量分析,研究1992~2006年沈阳城市森林景观格局的动态变化,对城市森林景观类型合理性进行论证.李登科等[18]在GIS技术的支持下,利用SPOT影像数据、TM影像数据、DEM数据等,综合分析陕西省吴起县土地利用状况、植被覆盖度变化、坡耕地面积、土壤侵蚀强度等,研究其在退耕还林前后的变化.侯文良等[19]通过对新疆维吾尔自治区巴楚县1999年、2004年两期的TM影像进行解译和判读,利用地理信息系统空间分析技术,结合野外调查,对森林资源的地类进行空间分析,从而得出巴楚县森林资源空间变化分布状况.白艳芬等[20]利用1995年TM影像和2000年ETM影像,分别提取青海湖流域的植被指数,计算植被覆盖度,根据覆盖度等级的空间分布特征,比较分析研究区域植被覆盖变化情况及原因.李虎等[21]以新疆全区为研究区域,综合应用遥感与GIS技术,对1996年和2001年两期TM遥感影像进行解译,研究境内的森林资源动态变化.

2.2.3 森林病虫害监测

病虫害是林业灾害之一,也是森林监测中一个重要的研究内容,在国内也有很多研究成果.黎镇湘等[22]通过分析比较传统的森林病虫害监测技术和现代集成技术的优缺点,指出RS与GIS集成技术在监测的及时性和准确性、最优路径选择、缓冲区分析方面的巨大潜力,以及该集成技术与三维可视化技术在森林病虫害监测中的应用前景.王蕾等[23]通过总结3S技术在森林虫害动态监测中的应用现状,介绍3S集成在森林虫害动态监测中的应用动态及应用趋势,并在总结实际工作经验的基础上从害虫的生存环境角度构建森林虫害动态监测3S集成技术体系.

3 林业管理

3.1 日常管理信息系统

传统的管理信息系统数据源主要为表格、统计数据、报表,处理以属性数据和统计分析数据为主,输出结果为报表、报告、表格.而现实中林业分布具有区域性等特征,且林业管理受到分布区域自然条件和基础设施的限制.GIS技术以图形图像及地理特征属性为数据源,以图形图像产品、统计报表、文字报告、表格等方式为主要的输出结果,因此,GIS技术在处理空间属性数据方面具有独特优势.应用GIS技术,可以给林业管理带来极大的方便.洪军等[24]人以研究区域森林资源调查资料为数据源,结合区内地形地势,应用地理信息系统,按照森林功能类型将研究区域的森林进行划分.张超等[25]利用福建省永安市2003年森林资源基础地理信息数据,考虑区域生态、经济、市场、自然环境、生物物候等原则,应用地理信息系统建模技术,建立了县级林业区划模型.李新贵等[26]对贵州省林业有害生物管理地理信息系统的内业和外业系统部分设计提出了初步构架.曹庆先等[27]以ArcView为平台,根据林业有害生物信息管理的实际工作流程,设计开发了“基于GIS的天津市林业有害生物管理信息系统”.郭志华等[28]设计并实现了仁寿县森林资源管理地理信息系统,详细介绍其体系结构、主要功能、数据库、模块功能等,该信息系统已应用在仁寿县森林分类区划界定、集体林权改革、林业血防等工作中.冯仲科等[29]针对我国森林资源经营管理还处于比较粗放的水平,把现代测绘科学应用于林业研究中,构建基于广义3S技术的森林资源经营管理系统,同时也展望基于广义3S技术的森林资源经营管理系统.

3.2 应急管理

森林应急管理主要为损害损毁林木生长等突发事件做预测和控制,森林火险是其中之一.预防和监控着火点,建立相应的应急预案,是GIS在林业中的应用方向之一.文中就GIS技术应用在森林火险等级划分,着火点监控,火场模拟和应急综合信息系统建设方面的文献做介绍.

3.2.1 林业火险区划与着火点监控

火险区划是进行林业火险监控的第一要务,是摸清森林火险基本数据、进行火险应急管理的前提,没有进行火险区域和等级区划的应急管理系统都不是科学的系统.而着火点的监控与准确定位是分析扑火路径与决策考虑的首要问题.因此,林业火险区划和着火点监控具有必要性.唐季林等[30]以甘肃省迭部县为例,应用TM影像,结合地面调查和实验,在综合分析评价的基础上模拟森林火险领域,以各自然沟系作为总体评价单元,用小班火险等级加权平均计算面积、沟系的平均火险等级及迭部县平均火险等级.胡林等[31]通过收集北京市房山区1987~2003年林火历史和现实数据,运用GIS和通信技术,建立数学模型,实现房山区森林火险动态区划.朱煌武等[32]选取一实际林区,收集与森林防火相关的地理信息资料,建立地理信息系统,设计并实现了复杂条件下林火蔓延的计算机模拟预测,完成森林火灾扑救辅助决策系统的建设,并在预测结果的基础上提出了合理、优化的防火道开设方案.在地形复杂的林区,监测林火定位、测距等受到极大的影响,李龙国等[33]研究设计了与视频监控技术结合的GIS系统,实现二维平面地图、三维立体场景和监控画面三者所显示区域的一致和相互间的联动控制功能,该系统设计开发完成后,应用在内蒙古白狼林区,给森林防火提供了有效的管理平台.于文华等[34]根据森林防火管理的实际需求,以瞭望塔视频监控设备为硬件基础,提出了双点定位方法与单点定位方法相结合的综合方案,综合运用组件GIS、ArcSDE引擎、以NET为开发工具,设计并实现鹫峰国家森林公园森林火灾定位系统,解决了目前森林防火着火点现场定位问题.

3.2.2 林火蔓延模拟与路径选择

在确定了着火点位置后,需综合分析该地点的地形、地貌、坡度、风向、气候等实际情况,应用计算机程序模拟火势蔓延,初步划定火场范围,选定扑火最优路径.朱启疆等[35]分析森林火灾发生发展的因素,应用地理信息系统和遥感技术,利用植被起火概率图控制像元,在火场扩展中将Rothermel模型和经验模型结合使用,考虑坡度和风向带影响,实现了火场在地理信息系统支持下的空间蔓延动态模拟.黄作维等[36]综合分析林火蔓延的影响因子,借助基于GIS的林火蔓延模型,结合林火蔓延算法并考虑到环境因素的影响,进行火场空间蔓延计算机模拟和火行为的时空格局分析.宋丽艳等[37]利用GIS软件建立林火蔓延模拟的空间背景,运用林火蔓延模型且综合考虑火场条件,采用点到点的传播方式,实现林火蔓延的动态模拟,结果表明,地形条件一定时,林火的初始蔓延速度和风速的大小对林火蔓延有明显的影响,不同的坡向和坡位也会影响林火的蔓延速度.毛学刚等[38]在GIS技术的支持下,建立林火蔓延的空间背景数据库,采用王正非林火蔓延模型和遍历算法,设计并实现了任意地点、任意气象条件下的林火蔓延动态仿真模拟.王明玉等[39]以河北省张家口地区为例,将最短路径问题与成本路径分析相结合,以地形数据、网络数据、植被数据等作为基本数据,实现最优路径的确定.

3.2.3 防火信息系统建设

数据分析的前景篇(11)

一、引言

目前对旅游业发展趋势及预测研究主要集中在旅游资源条件、旅游人次数、旅游服务设施、旅游基础设施、旅游接待设施和旅游总收入这几个方面的研究。本课题准备考虑杭州市境内旅游人数、境外旅游人数、星级宾馆数目、景点数目以及旅游总收入这几个影响因素,基于灰色理论的相关性分析,主要运用调查研究法、灰色预测、时间序列分析以及多元线性回归,研究近年来杭州旅游业与当地其它产业的对比分析实证,分析旅游业的发展情况,以期给杭州市旅游业的当前发展做出科学的评价,以及预测杭州旅游业未来几年(包括中长期和短期)的发展趋势,为杭州旅游业的发展提供科学依据。

二、杭州市旅游业的发展趋势分析

(一)旅游业各因素的相关性分析

首先,利用[SPSS]软件对境内外旅游人数、A级景点数目、星级宾馆数目以及旅游总收入这五类数据进行[Z-score]标准化,实现量纲统一。其次,在0.01的显著水平下,对这五类旅游业指标进行相关性分析。结果显示,境内外旅游人数、A级景点数目、星级宾馆数目与旅游总收入的显著相关,且相关性程度由大到小排列依次为:境内旅游人数>境外旅游人数>A级景点数目>星级宾馆数目。由此可见,旅游人数与旅游总收入呈正相关,而星级宾馆数目与旅游总收入呈现负相关。

(二)旅游业发展趋势分析

在对2005-2014年的境内外旅游人数、A级景点数目、星级宾馆数目以及旅游总收入这十年的历史数据进行统计分析,并绘制十年间数据变化的折线、柱状图。观察图表可知:在2005-2014年间,杭州市的旅游业发展速度持续加快,呈现良好的发展趋势。与此同时,在2006年间,由于杭州市成功举办了首届世界休闲博览会、第八届西博会等重大节庆活动,境外旅游人数同比增长了20.3%,在2010年的“十一五时期”,全市旅游总收入年均增长速率达到最大,为17.1%。

另外,通过对境内外旅游人数、A级景点数目、星级宾馆数目与旅游总收入间的相关性分析可知:近年来,杭州市的旅游人数持续增长,景点的级别也在不断地提高,星级宾馆数目在逐年减少,但五星级酒店的数目在不断增加,可见,人们正在追求高品质的旅游生活。

三、基于多元线性回归的旅游总收入模型的建立与检验

(一)基于多元线性回归的旅游总收入模型的建立

建立经验线性回归方程利用最小二乘法原理寻求使误差平方和达到最小的经验线性回归方程:

[y=β0+β1x1+β2x2+β3x3+β4x4] (1)

由其确定的模型为:

[Y=Xβ+εE(ε)=0,COV(ε,ε)=σ2In] (2)

首先,将境内旅游人数、境外旅游人数、A级旅游景点数目以及星级宾馆数目依次记为[x1,x2,x3,x4],旅游总收入记为[y],其次,利用[Excel]将2005-2014年间的十组数据随机抽样分为两个样本,其中,2005年、2006年、2009年、2008年、2013年以及2014年作为训练样本,其余四组数据则为测试样本。根据建立的多元线性回归模型,利用[Matlab]软件进行模型求解。显著水平[p=0.0326

[y=-586.08+0.2506x1-2.0973x2+0.054x3+2.4328x4] (3)

(二)基于多元线性回归的旅游总收入模型的检验

对于建立的多元线性回归的旅游总收入模型,[R2=0.9995],[F=528.375],说明回归方程的拟合优度较高,在经过[F]检验之后可知,该回归方程效果显著。

另外,以2007年、2010年、2011年以及2012年的数据作为测试样本,将数据代入公式(3)得到预测值,并与其真实值进行比较,测试值与样本值间的差值相对而言比较小,所以可以判定建立的多元回归分析模型成立。

综上所述,旅游总收入[y]与境内旅游人数[x1]、境外旅游人数[x2]、A级景点数目[x3]、星级宾馆数目[x4]之间存在线性关系。

四、结束语

将杭州市的旅游总收入作为反映杭州市旅游业发展的量化标准,然后利用多元线性回归分析的方法,得到旅游总收入与其他影响因素之间的函数关系,此外,还利用[SPSS]软件,对境内外旅游人数,星级宾馆数以及A级景点数与旅游总收入之间的相关性进行分析,从而反映这些因素对于杭州市旅游业发展的具体量化关系。并且,根据这些数模研究得到的量化关系,该改变全市当前的旅游现状,以此推动全市当前旅游业的发展,从而获得更大的经济利益。

参考文献:

[1]李海伦.中国第三产业发展趋势分析及预测[J].经济,2011,03:44-45.

[2]成秀杰.“城市旅游”的杭州模式[J].决策,2013(6),52-53.

友情链接