大数据论文范文第1篇
〔关键词〕大数据;共词分析法;聚类分析;多维尺度分析;可视化
DOI:10.3969/j.issn.1008-0821.2013.09.026
〔中图分类号〕TP391;G250.252〔文献标识码〕A〔文章编号〕1008-0821(2013)09-0129-06
2011年5月,麦肯锡全球研究院(McKinsey Global Institute)了研究报告《大数据:创新、竞争和生产力的下一个前沿领域》(Big data,The next frontier for innovation,competition,and productivity)[1]。2012年1月在瑞士达沃斯举行的世界经济论坛上,“大数据”是讨论的主题之一,论坛上的题为《大数据,大影响》(Big Data,Big Impact)的报告中提出,“数据已经成为一种新的经济资产类别,就像货币或黄金一样。[2]”2012年3月29日,美国政府在白宫网站上了《大数据研究和发展倡议》(Big Data Research and Development Initiative),该倡议涉及联邦政府的6个部门,这些部门承诺将投资超过两亿美元,来大力推动和改善大数据的提取、存储、分析、共享和可视化。
无论是美国政府的倡议,麦肯锡的研究报告,还是世界经济论坛的议题,都预示着人们,大数据时代已经到来。大数据正在撬动全世界的神经,大到一个国家、企业,小到每一个独立存在的个人,都将成为大数据时代的贡献者和受益者。那么,大数据究竟是什么?维基百科将大数据解释为“是指无法在一定时间内用通常的软件工具进行捕获、管理的数据集合”[3]。关于数据量究竟要达到多少才可以被称之为大数据,目前尚无统一说法。一般认为,大数据的数量级应该是“太字节”,即240。大数据之“大”,并不仅仅在于其“容量之大”,更多的意义在于,人们可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”[4]。
目前国内学者中,杨绎以国内文献为研究基础,以关键词分析为主要方法,对目前国内期刊和报纸上有关“大数据”的文献进行了研究[5]。韩芳芳等以CNKI为数据源,从文献、作者、关键词3个角度分析我国大数据领域的相关文献。笔者认为很有必要对国际大数据领域文的献进行分析,从而把握国际大数据领域的研究现状与热点,以供国内学者参考借鉴。
1数据来源与研究方法
Web of Science(简称WOS)是美国汤姆森集团开发的产品,是大型综合性、多学科期刊引文索引数据库。WOS收录了世界上经过同行专家评审的有影响力的文献,选用WOS作为数据源进行研究可以保证研究资料的权威性。本文选取WOS数据库下3个子库Science Citation Index Expanded(SCI-EXPANDED,科学引文索引扩展版)、Social Sciences Citation Index(SSCI,社会科学引文索引)、Arts & Humanities Citation Index(A&HCI,人文艺术科学引文索引),检索年限为“所有年份”,数据库更新日期为2013年4月5日,以“big data”为检索词进行“主题”检索,共检得171篇大数据领域的相关文献(检索日期:2013年4月10日)。
本文借助SPSS 190软件,采用共词分析法对国际大数据的研究热点进行分析。共词分析法(Co-term Analysis)最早是在20世纪70年代中后期由法国文献计量学家提出的,其思想来源于文献计量学中的引文耦合与共被引的概念。共词分析法的基本原理是,统计一组词(关键词或者主题词)两两在同一篇文献中出现的次数,以此作为基础进行聚类分析,从而得出这些词语之前的亲疏远近的关系,进而分析出这些词语所代表的学科或者主题的结构变化情况[7]。共词分析法研究的是某一学科领域中当前的学术文献所集中关注的主题,很适合于分析某一学科的研究热点和知识结构[8]。
2013年9月1第33卷第9期1现?代?情?报1Journal of Modern Information1Sep,20131Vol.33No92013年9月1第33卷第9期1国际大数据研究论文的计量分析1Sep,20131Vol.33No92文献计量分析
2.1年代分析
通过对文献发表时间的分析,可以勾勒出国际大数据研究领域的发展轨迹,揭示其发展的总体趋势。将在数据库中检索得到的论文按照年度进行归类,如表1所示。
大数据论文范文第2篇
只有在同一时间同一地区大量采集样本,才有可能满足RCT随机对照实验的样本要求。RCT样本问题可望在大数据时代得到解决,随着泛在随时采集样本的大数据时代的到来,以及不间断采集医疗数据的可佩戴设备出现,样本数据的稀缺等问题将随巨量数据消失。而随着新型大数据分析挖掘工具的出现,特别是深度学习技术的不断发展和应用,证据及其结论的准确可信性必将大大提高。目前,深度学习识别5749个人脸的精度已达99.15%,其准确程度已经超过人眼和大脑。因此,深度学习必将为循证医学带来一场新的革命。本文将分析循证医学在数据证据获取、分析、制作等方面所面临的挑战,介绍医疗大数据时代的数据采集、整合、分析和处理方法,介绍面向医疗大数据的深度学习技术自动提取疾病特征的原理和方法,以及医疗大数据及基于云计算的深度学习对循证医学所带来的各种变革。面向大数据的深度学习将特征提取与决策分析过程合二为一,大大降低了医生在临床及医学研究中应用循证医学的劳动强度。结合医疗大数据、云计算和深度学习的循证医学,将克服过去数据证据稀少、偏颇、失信、不公、过时等不足,将具有更加广阔的推广应用前景和发展动力。
1循证医学与数据证据
循证医学,简之就是“遵循证据的医学”,又被称为实证医学。循证医学重视医生的临床经验,即传统意义上的经验医学,同时又强调诊断、治疗等决策应在临床证据最为符合病症的基础上作出[1]。在循证医学的创立、发展与传播方面,英国的科克伦(ArchiebaldL.Cochrane)、美国的费恩斯坦(AlvanR.Feinstein)以及萨克特(DavidL.Sackett)做出了重大贡献,成为循证医学的奠基人。科克伦强调大规模随机临床试验的重要性。他认为只有在大规模临床试验中使用随机分组策略,才能避免因样本分组而产生的选择性偏差,保持对照组和试验组样本的背景因素平衡,从而才能做出最终正确的比较与评价。他建议及时将切实医学证据传播给使用者,接受专家评估并对可信度进行适当分级,以使医学证据能被及时整理、归纳与更新。费恩斯坦奠定了现代流行病学的数理统计与逻辑基础。从1970年到1981年,他在美国《临床药理学与治疗学》杂志(ClinicalPharmacologyandTherapeutics)上,以“临床生物统计学”(ClinicalBiostatistics)为题连续发表了57篇论文,将数理统计学和逻辑学导入到临床流行病学,科学系统地建立了临床流行病学的有关理论体系。萨科特则为循证医学的传播与发展做出了巨大贡献。他发起并主编了与循证医学有关的两本著名杂志:《美国内科医师学会杂志俱乐部》和《循证医学》。
1997年,他还主编出版了《循证医学》一书,该书被译为多种文字并在世界上广为传播。正是在《美国内科医师学会杂志俱乐部》上,加拿大盖亚特(rdonH.Guyatt)于1991年首次提出了循证医学一词[3]。从循证医学与数理统计和逻辑学的渊源,便可以看出循证医学注重证据的内涵。它是一门非常强调证据制作的学科,同时又非常重视医学证据的传播和评估,这正是它区别于以往医学的特点。通过评估产生可信证据,通过传播发挥证据价值。医生在诊断与治疗过程中,不仅基于经验直观判断,而且结合证据科学决策,更加客观地进行诊断与治疗。短短十多年的时间,在世界各国医学研究与临床实践中,循证医学得到了广泛深入的应用。科克伦最初创建的世界循证医学协作网已经包括约50个专业协作小组,所收集的医疗证据几乎覆盖所有临床医学领域。1996年,我国华西医科大学建立了中国循证医学中心,并于1999年正式加入世界循证医学协作网;2001年,中国循证医学中心创办了《循证医学》杂志,发表在各类杂志的循证研究论文达45842篇。但是,循证医学也有其面临的问题,如对证据进行科学评价等问题。临床证据目前还没有完整、科学的定义,证据评价标准及推荐级别尚未完全统一,不同国家不同疾病的证据质量分级不尽相同。而且,随着人类对疾病认识的加深以及诊疗手段的革新,评价标准还会随这些因素的变化而变化。
循证医学的基础是数理统计学,要求RCT的实验样本及环境一致,以便排除个体差异及环境干扰,但这在现有条件下近乎不可能实现。号称大规模随机对照实验的样本偏少,对照组和试验组难有条件一致的个体,环境随时间空间变化造成实验对照控制困难。目前,大规模的医学样本采集困难,几百个样本已经算是比较大的样本了;而根据统计理论如要达到90%的敏感度,至少需要约1300个的数据样本。为了克服RCT样本不足的问题,Meta分析方法得到了广泛应用:通过综合已有研究多个样本集的结果,可以推得大规模样本集的综合结果。Meta分析取得了很多有价值的研究成果,但是,Meta分析的基础也是数理统计学,其运用的前提是样本及实验环境一致,正是在这一点上它备受质疑。首先,不同样本集的权重控制难于完全公正,因为其实验环境难于恰当评价和把控,实验结果难免有过度包装和偏颇之嫌。Meta分析存在的另一个问题是:它所依赖的数据往往不是最新的即时案例,制作的证据可能因环境与气候的变化而失去应用价值。总之,循证医学所面临的问题包括:证据的稀缺性、偏倚性、可靠性、及时性、公正性,以及环境的一致性等方面的问题。由于证据的一致性和及时性存在问题,基于历史数据进行Meta分析备受质疑。2014年,《英国医学杂志》在名为《循证医学濒临破产》的文章中指出[5]:循证医学的证据属于间接证据,基础建立在已经发表的研究文献上,利益冲突容易影响证据的公正性,证据环境与临床决策环境存在距离;循证医学助长了过度诊断、过度治疗,并可能存在沦落为利益集团代言人的危险。
2大数据对循证医学的影响
大数据(Bigdata)又称巨量或海量数据,是指数据规模巨大以至在合理时间内,无法通过当前主流软件工具,获取、处理、分析以便决策的结构复杂的数据[6]。大数据如下具有4V特点:Volume(巨量)、Velocity(瞬速)、Variety(多样)、Value(价值)。巨量是指已经不能再用GB(即1024MB)和TB(即1024GB)为单位,来衡量大数据的存储容量或规模,而要以PB(即1024TB)、EB(即1024PB)乃至ZB(即1024EB)为单位来计量数据容量。在巨量的医疗大数据中,各种条件的样本都会存在,因此,证据的稀缺已经不是问题。瞬速是指兼具方向的快速变化,即数据随时间和空间快速变化。大数据中的样本通常是全空间的、多维度的、全时间的及瞬时变化的。由于大数据地域环境广,数据样本量巨大、正反样本齐全,证据的“制作”已不再必要,而是随时随地客观地存在。瞬速性通过可佩戴健康监测设备体现,这为及时获取病患信息提供了极大便利。多样是指数据的种类繁多、结构复杂、因果并存、甚至同一数据表现出不同形式。数据的多样性对数据的理解和分析是一个巨大挑战,但同时也为样本分析结果的验证带来便利。因此,在医疗大数据环境下,不仅随时可以采集样本进行分析处理,还能对分析得到的结果马上进行验证,从而能够保证医学证据的可靠与可信。
价值是指相比小规模、历史数据而言,大数据具有更高的研究和使用价值。由于任意时刻任意地点都有大量样本,样本的稀缺性和及时性已经不是问题,这为医学研究扫清了采样障碍;同时由于样本丰富冗余多样,也为研究结果的验证提供了便利;大数据除具有巨量历史数据外,还有不同地域环境的巨量即时数据,这使循证决策更具应用价值和时效性。大数据将首先改变医学数据的采集方式。大数据的形成往往依靠自动采集技术,随着可佩戴监测设备如iWatch等的出现,医学数据的采集及积累速度将出现爆炸性的增长。以往的数据同大数据相比,如同沧海之一粟。且以往的数据往往靠手工采集完成,普遍存在稀缺、偏倚、可靠、及时、公正等问题,这样采集的证据必然会影响医学研究的结论。基于手工证据进行决策,其结论未必准确及时公正可靠。医疗大数据不间断地在不同地点同时采集,不仅包含历史数据以及即时数据,甚至还可能包含未来需求信息,例如,ogle就是通过人们对感冒药品的搜索来预测流感的。大数据的出现将改变医学数据的管理方式。在网络数字化高度发达的今天,尽管已经出现了电子病历,但纸张病历在数据管理中仍然重要。然而,纸张病历有其固有缺陷,如容易破损或丢失、整理归档的周期过长、借阅的时间成本极高、研究采样的工作量巨大等等。伴随大数据出现的数据融合技术能将不同医院的电子病历整合在一起,并同可佩戴健康监测设备的数据及时集成,大大减少了电子病历的整理、借阅和数据采集时间,这不仅对病人的疾病诊断和预警监控更加有利,同时也对医生的临床及医学研究更有帮助。通过语音和可视眼镜等现代化的数据浏览设备,医生在查房间隙就能获知下一病人既往病情,从而能大大减少医生的劳动强度,使医生有更多时间治疗病人,有更多的时间进行医学研究。
大数据的出现将改变医学数据的分析方式。以往在收集样本数据以后,通常使用SAS或SPSS等软件,对采集的数据进行统计分析,发现相关病因或建立决策模型。这些软件受计算能力及内存容量的限制,只能处理样本量不大的数据,并且处理的数据维数有限,例如,SPSS不能超过40维,而医疗大数据的维数成千上万。通过手工或统计软件的计算方法,将无法满足医疗大数据的分析需要。
当维数超过30个致病因素时,可能要考虑230种因素组合,普通统计软件已无法计算和处理,必须依靠内存及速度“无限”的云计算。必须研究与开发基于大数据和云计算的分析与挖掘技术如深度学习技术,使其能够自动完成高维病因数据的分析与主要病因的提取。总之,医疗大数据的采集、整合、分析、处理、研究完全靠人工完成已极其困难,没有利用云计算的统计分析软件也难于完成医疗大数据的分析和处理。在大数据时代,必须借助深度学习等技术完成医疗大数据的分析和挖掘。虽然医疗大数据能够弥补数据样本的不足和不公,但只有借助更为先进的分析工具和软件,才能为循证医学带来进一步的变革和发展。
3大数据对循证医学的变革
证据制作是循证医学的核心,证据能为医生的诊治提供参照,因此,循证医学得到了快速发展。但是,矛盾、偏颇、过时的证据也使循证医学备受质疑。首先是证据及其结论存在大量的矛盾,使人们对循证医治的结果产生怀疑;其次是证据偏颇使其成为利益代言人的工具;其三是证据时过境迁使医治达不到预期效果。而医疗大数据的出现恰好能够弥补以往证据采集与制作的不足。首先,医疗大数据使证据的稀缺问题得到解决;其次,随大数据广泛汇集的医生及病人评价,可有效避免证据成为利益代言人的工具;其三,可穿戴等自动采集设备可保证证据的时效性。这将有助于循证医学同中医的结合。中医的治疗过程通常比西医长,其证据采集及疗效评估存在很大问题,而随着可穿戴健康监测设备等技术的发展,长期持续采集治疗证据及疗效将不再困难,从而有助于循证医学在中医等领域发展壮大。此外,随大数据兴起的先进数据分析与挖掘技术,将对循证医学起到巨大的推进作用。临床决策分析评价是确定循证治疗方案的关键步骤,现有的决策分析评价模型包括决策树、Markov过程等一系列模型,这些模型在面临高维大数据时力不从心,难于继续提供较高的决策精度,使医生对医治方案是否有效失去信心。随着大数据深度学习技术的出现,病因的分析和提取已完全自动化,且大大降低了建立决策分析模型的工作量,提高了治疗方案的决策精度。对于任何疾病诊治方案,考虑的疾病致病因素越多,即证据或特征维数越多,得到的参考信息就越多,诊治的准确性就会相应提高。但是,医生在遇到大量高维的证据数据时,往往面临从中选择少数有效证据的难题。例如,假定要考虑30个致病因素或检验指标,建立决策模型就要考虑230种因素组合,从中筛选一个最优因素组合作为模型输入的工作量是巨大的。因此,要得到由若干最优证据构建的最佳决策分析模型,医生们所投入的研究精力可想而知。
筛选最优因素组合是医生们最费精力的工作,目前这项工作可以被深度学习自动完成了。深度学习最早由Hinton等人在2006年提出,它是一种无监督的特征学习和提取技术,它通过低层特征的组合构建更加抽象的高层特征。2012年,Lecun等人利用卷积神经网络真正实现了高效的多层深度学习。传统的神经网络学习只有单向认知过程,通常只包含一个隐含层,因层数较少而被称为浅层学习。深度学习则包含认知和生成两个过程,并且每个过程都包含多个隐含层,其模型的总体框架如图1的虚框部分所示。如图1所示,深度学习的“输入层”可以理解为各种致病因素以及各种检查化验结果,例如遗传环境因素以及肝功全套指标等;自底向上的箭头表示认知过程,自顶向下的箭头表示生成过程,即深度学习由两个互逆的过程构成;认知权重向量WnT和生成权重向量Wn表示深度模型的知识。原始“输入层”经“隐含层H0”认知得到输出,输出又经“隐含层h0”生成得到新“输入层”,如果原始“输入层”和生成的“输入层”完全一致,则说明认知产生的输出是完全正确的。根据信息论的有关理论,学是会产生损失,新旧输入不可能完全一致。因此,只要两者近乎一致就可以了。认知和生成权重同隐含层的每个输出相关联,wake-sleep深度学习算法用于双向调节权重:(1)利用下层输入和认知权重向量WiT产生输出表示,然后使用梯度下降法调节生成权重向量Wi;(2)利用输出表示和生成权重向量Wi产生输入表示,然后使用梯度下降法调节认知权重向量WiT。通过逐层学习最终得到顶层的认知和生成权重向量WnT、Wn。在深度学习完成后,如果要建立决策分析模型,只需将顶层输出即自动提取的特征,作为分类模型如支持向量机的输入,并用类别标记如肝硬化分级训练支持向量机,就可以得到用于决策分析的精确分类模型,分类模型如图1的虚框外部所示。2014年,香港中文大学汤晓鸥教授领导计算机视觉研究组(mmlab.ie.cuhk.edu.hk),开发了一个名为DeepID的深度学习模型,在LFW数据库上识别5749个人脸的准确率已达99.15%,其精细和准确程度已经超过了人眼和大脑。医疗大数据及深度学习必将为循证医学带来一场新的革命。不仅数据缺失、偏颇以及过时等问题会被迎刃而解,而且证据收集、制作以及诊治方案的决策都将会自动化,这将扩大循证医学在所有领域包括中医等领域的应用范围,大大降低医生在证据制作、治疗方案决策与疗效评估等方面所付出的精力,推动循证医学向更深更广更加现代化的方向发展。
4总结
医疗大数据带来的变革将是全方位的,它不仅为医学研究和证据制作带来便利,同时也将促进中医等替代和补充医学的发展。作为大数据采集的一项关键技术——便携式/可佩戴健康数据自动采集技术,将大大提高医疗数据采集以及证据制作的效率,解决中医等疗效数据需要长期采集观测的难题,弥补循证医学存在的证据偏颇、不公、过时等缺陷,促进循证医学更加客观、公正、可靠地在临床治疗中应用。在循证医学的证据评估以及利用方面,伴随大数据出现的云计算能够提高证据分析与处理的效率,大大节省医生临床应用和医学研究所需要花费的时间;面向大数据的深度学习能够从浩瀚的高维医疗数据中,自动完成疾病致病因素及环境因素等的筛选与提取工作,并能建立精度远远超过人脑的决策分析模型,从而大大提升医生建立和应用循证治疗方案的信心,有助于循证医学被各科医生更加广泛地接受和应用。尽管深度模型包含更多的隐含层,其学习时间要远远长于浅层学习,但两种模型的决策时间相差不大,因此,这并不妨害深度模型的有效应用。特别值得一提的是,深度学习将证据提取与决策分析两个过程合二为一,大大降低了医生在临床及医学研究中应用循证医学的劳动强度。基于大数据、云计算和深度学习的循证医学,由于能够降低劳动强度、提升工作效率、提高决策精度,因而将具有更加广阔的应用前景和发展方向。
5展望
大数据和云计算时代的到来,将推进循证医学的研究和发展,并为其提供深度学习等先进手段。医疗大数据将不再稀少、偏颇、过时以及不公,将避免循证医学成为利益代言人的工具;便携式/可佩戴健康设备作为大数据自动采集数据的工具,将有助于解决循证医学证据采集的难题,促进循证医学在包括中医在内的更广领域推广应用;自动整理大数据的数据融合技术、以及自动提取证据并建立决策模型的深度学习技术,将大大提高医学证据提取及医治方案决策分析的效率,推动循证医学被临床医生及研究者更加广泛地接受和应用。总之,大数据/云计算和深度学习将为循证医学带来一个崭新的春天。
大数据论文范文第3篇
1、对大学教育的影响
大学教育是第二次产业革命时为了适应工业所需的大量的技术人员的产物。当今,学生知识的来源不再局限于课堂,不再拘泥于某一个专业,他们可通过互联网、微信、微博等信息平台来获取文本的、图像的甚至是视频的各种知识。学生的知识面将比以往的任何朝代更加宽范,对校园以外世界的了解将更加深入。比如现在的在线教育平台edX和Mooc,上面有世界著名学府的各种课程,包括我国清华和北大的优秀课程。学生只要通过互联网,就可以接受到名校的教育,在学习过程中,通过鼠标点击的记录,可以研究学习者的活动轨迹,发现不同的人对不同的知识点有何不同的反应,用了多少时间,哪些知识点需要重复或强调,哪种陈述方式或学习工具最有效。通过分析这种秩序和规律,在线学习平台也在逐渐弥补没有老师面对面交流指导的不足。同时现在的教育平台还能通过虚拟现实进行实践辅导。以麻省理工开放的电子电路课程为例,注册这一门课的人比整个麻省理工所有在世校友总数还多。由此可见,许多学生已经把注意力放到了课堂之外。
2、如何积极应对
对于学校:在学生从课堂走到互联网时,未来的学校存在的意义在哪儿,是学校更应该关注与关心的。学生可以在宿舍甚至在家就完成了各种课程的学习和同学之间的交流,那么对学生的考核和效果的评定也不再局限于某一个固定场所来进行。学校更应该重视图书馆电子资源的建设和开放,更应该重视实践实验室的建设,提供更多方便学生来进行实习和实践训练的场所和项目。对于教师:在大数据时代,教师的教与授又该体现在哪儿呢?我们更应该深刻思考,改变传统的课堂教学的思维模式。我们可以将教的过程放在网络平台上,放在课前来进行,课堂中以学生做作业、教师指导和答疑为目的。这只是改变了传统的教学模式,对于教师自身我们又该如何作呢?在面对丰繁复杂庞大的数据时,我们应积极跟进发展自我,重新进行定位。一类应加强自己的实践操作能力,专业从事实践辅导和教学;另外一类专业从事研究;另外一类抓住大数据所给予的机遇,发展自己,跟上时代步伐,成为专业化极强的教师,对专业进行解惑和学习方向的指导。对于学生:知识和信息量极大丰富,我们如何从中甄别出有利于自己的知识,对自己进行特色化的教育,需要自己的判断力和教师、家长的指导。我们要关于利用已有的学习平台和学习媒介,不断提高自己的自学能力,发展自己的创造性和创新性的能力。
二、小结
大数据和大数据时代,数据量的指数级的增长,给我们带来了无限的机遇,同时信息的准确和真实性也是需要我们不断地发掘方法和技术进行改进的。高等学校的教师和学生如何应对这个新的时代,跟上时代的步伐是我们每一个都应该深思的问题。
大数据论文范文第4篇
(一)反馈信息电子化物流信息化、电子化是电子商务物流的基本要求,是以电子计算机为主、以各种电子设备为辅助工具的物流信息形成、传递、储存的管理方式,不同于计算机诞生之前物流信息反馈主要通过书面、口头形式进行传递和储存。物流信息作为企业信息化的重要组成部分,物流信息电子化减少了企业组织的差旅费用、提高了工作效率、降低了劳动强度、减少了污染和拥挤等等。但是,电子化的信息出现了泛滥、甄别困难等问题,同时计算设备的损坏可能导致大量信息的损失等。在电子商务时代,要提供最佳的服务,物流系统必须要有良好的信息处理和传输系统。
(二)反馈内容全面化云计算的出现,为处理大量不规则的“非结构数据”提供了技术方法。以云计算为基础的物流技术,可以便宜而有效地将物流活动中大量、全面、多变的数据内容存储下来,并随时进行分析和计算。这些技术主要有数据采集技术、数据存储技术、数据交换技术、数据处理技术等。采集技术有传感器、扫描仪等,在物流中移动数据采集器(MDE)经常用于对仓库库存的盘点或者货架上预订数据采集,该技术在运输部门或者外部服务也有重要的价值。另外,电子数据载体如芯片、程序化数据载体(PDP)、移动数据存储器(MDS)及卫星接收发送装置,可以超越数米的距离进行读取、编辑和存储;电子数据交换(EDI)可以节省时间、提高质量和降低成本。物流信息技术是物流现代化的重要标志。
(三)反馈速度迅捷化电商物流服务业不同于传统物流服务业,快速反应是电商物流企业的核心竞争力。电子商务物流重在提供及时的服务、信息和决策反馈。目前,在大型的配送公司里,ECR和JIT系统使得顾客化服务得以快速响应。ECR即有效客户信息反馈,据此可做到客户要什么就生产什么,而不是生产出东西等顾客来买。物流企业快速反应的影响因素主要有信息系统、顾客服务、时间管理、成本控制、物流硬件、协调控制和物流人才等。
(四)反馈信息社会化在我国,企业甚至是上市公司信息披露不足,而数据、信息共享是电商时代的趋势和必然。因此,如何建立信息处理系统,及时获得必要的信息,对电子商务物流企业来讲,是个时代的考验,更是个难题。在将来的物流系统中,“24小时送达”成为物流配送的极致追求,搭建社会化物流平台成为电商企业共同的事业。阿里巴巴从2011年开始规划的天网地网,就是要做一个信息平台,向物流合作伙伴开放相关信息接口以分享数据。数据服务是阿里巴巴物流战略核心,更是未来大物流系统的支撑。未来物流系统的输出内容———信息,可以当作独立的商品或者作为商品成分进行出售。
二、电子商务物流服务业的反馈机理
反馈是大数据时代物流组织受社会需求推动,为了满足企业和消费者的个性化需求,运用收集、存储和融合信息的技术方法,引发的以数据化为核心的物流管理变革。随着互联网在经济与社会活动中的广泛渗透,将电子商务物流产业发展推向新的高度,其发展日益受到政府、企业、消费者和环保主义者的广泛关注。企业和消费者的满意度,取决于快速响应的物流管理系统。
(一)电子商务物流服务流程电子商务物流服务流程,可以用图直观表示,通过流程图可以窥见电子商务物流的反馈流程和反馈形式。图1融合了B2B、B2C、C2C交易的物流服务流程,不同的电子商务模式交易特点不同,但都具备总物流量大、服务范围广的特点,服务内容和服务特点基本相同,物流服务一般都采用第三方物流。B2B和B2C电子商务物流关键在远程运输,而C2C的关注点在末端配送。
(二)电子商务物流反馈内容电子商务物流服务内容涵盖了订单管理和数据分析、仓储与分拣、运输配送与交付、逆向物流服务、回收物流服务和客户服务。可以讲,电子商务物流服务内容有多广,物流系统反馈的信息内容就有多丰富。物流系统会对顾客提交的订单相关数据进行分析,透过分析报告可以帮助制造商以及经销商及时了解市场,便于随时调整市场推广方法;电子商务物流系统可以对仓储和分拣中心进行监测,提供有效的库存管理信息,使制造商或者经销商保持合理的库存;电子商务物流系统通过网络将供应链节点信息进行集成、整合,将实物库存信息化作为虚拟库存;运输配送与交付环节,通过融合多种终端技术采集物流信息并进行综合处理,增强了物流企业对物流配送过程的可控性,消费者则通过互联网对配送企业和商品“宝贝”信息流动实时状态了如指掌;电子商务的逆向物流反馈服务关键在提高顾客满意度。当然,随着环境保护的加强,废弃物处置问题不断受到关注,物流系统必须提供回收服务物流服务,这有利于提高物流企业在电子商务市场上的低碳竞争力。追求客户满意,挖掘潜在需求是电子商务物流企业不断创新的动力。
(三)电子商务物流反馈技术物流技术指物流活动中所采用的自然科学与社会科学方面的理论、方法,以及设施、设备装置与工艺的综合。而电子商务物流反馈技术,主要指物流服务流程中物资信息的收集、存储和融合方法。先进的信息融合技术提高了物流系统的信息处理与控制能力,使物流配送信息的交互和处理跨越时空限制,通过终端物流信息反馈与融合,实现信息到实际操作的高速转换,为物流企业决策层提供信息支持,从而不断提高物流企业的服务能力。常用的物流信息反馈设备有:各种传感器、GPS定位设备、射频识别设备、扫描器等;信息融合方法有:嵌入约束法、证据组合法、人工神经网络法等;信息传输交换技术有:计算机网络技术、电子数据交换技术等。
三、对大数据时代电子商务物流行业发展的建议
大数据作为信息革命的第二个高潮,为电子商务物流行业的发展提供了广阔的空间。电子商务物流行业必须树立并强化数据优化行业的理念,以大数据的眼光,加强大数据研究,为客户提供更先进、增值性的服务。
(一)树立并强化大数据理念现代物流的发展趋势是全球化、信息化、系统化、标准化和多功能化,而数据化则是现代物流的核心。当前电子商务物流体系虽然在业务经营中加强了对数据的分析和应用,但缺乏对大数据应用的战略性思考和主动挖掘意识。信息采集较多,但深度加工挖掘较少,导致大量的数据信息成为“睡眠数据”而不能发挥其应有的价值。客户细分不够精准,没有在业务营销和客户关系管理活动中运用科学模型,缺乏对客户服务需求的偏好判断和消费行为习惯的细分。在大数据时代电子商务物流的发展必须要有效整合大量的数据,通过各种分析模型,将数据转化为信息资源,只有这样才能将大数据作为战略性资产,为行业管理和决策提供强有力依据。
(二)开拓新的数据服务市场目前,电商业、物流业的发展呈现跨界竞争,电子商务企业进军物流行业,物流企业开发电子商务,行业间呈现交叉融合发展。当大家的目光还停留在究竟是做电商赚钱还是搞物流赚钱时,我们可将大数据看成一个大市场,联合电商业、物流业、银行业乃至通讯业合作,通过各大行业间的数据存储、加工、分析、融合,形成大数据产品,提供大数据服务,开辟数据服务市场。
(三)构建大数据物流体系构建大数据物流体系,就是电子商务企业和物流行业都要树立数据观念,从经营管理理念上重视大数据,在人才队伍建设上吸纳数据分析人才,从供应链条上强化数据信息的收集、存储和处理技术,对物流、商流、信息流、资金流进行计划和控制,也就是采用信息数据处理和融合技术对电子商务物流服务进行优化整合,打造准确及时精细的高端物流服务体系。
大数据论文范文第5篇
(一)物流配送的服务水平直接影响着电商的服务水平作为电子商务的末端环节,物流配送是电子商务里面唯一面对面接近消费者的环节,在消费者看来,无论物流企业是否是电商本身,物流企业的服务水平都代表了电商的服务水平。京东商城作为电商里面的佼佼者,得到了消费者的普遍认可,其高效的配送起到了至关重要的作用。凡客诚品的如风达,也曾经给凡客带来了比较高的顾客认可度。
(二)良好的物流配送能够增加电商的顾客忠诚度随着电子商务的发展,人们的信息化水平已经远远超过了过去,获取信息的渠道也更加的多样化,与之相对应的是,消费者的忠诚度也大大降低,消费者可能今天钟情于这个网站,明天又会认可那个网站。能够在消费者的的心目中形成良好的品牌效用,稳定有效的物流配送极其重要。
(三)物流配送的成本直接影响了电商的盈利状况中国目前的电商发展势头良好,双11每年的数据刷新都让人眼前一亮,这样的数字在一定程度上反映了消费者的消费理念已经发生了巨大的变化,以前是在网下买东西,现在是网上网下对比着卖东西。但是,在这样良好的势头下,有一个问题也引起了人们的思考,就是电商的盈利问题。物流配送是电子商务的瓶颈,指的不仅仅是物流配送的速度约束着电子商务实现的速度,还指的是物流配送的成本是传统商务所没有的,电商的竞争优势很大是由于价格优势,而如果包邮以后依然有这样的优势,电商的利润究竟在哪里?数据对物流从产生了巨大的冲击,迫使电商物流迅速的适应信息化和数据化的浪潮,同时,也给电商物流配送带来了巨大的机会,将其配送过程中产生的大量数据整合,用于配送计划的安排、电商服务的优化,更好的为卖家和卖家服务。
二、大数据时代电子商务物流配送存在的问题
虽然电子商务物流配送已经成为电商的重要利润源泉,也成为一些大型的B2C商家的主要盈利点之一,京东商城就将自己的物流配送优势作为自己的主要竞争优势之一[2],但是电子商务物流依然存在着一些的问题,主要有以下几个方面:
(一)相比于电子商务的发展,物流配送的发展依然滞后。电子商务主要包含信息流、资金流和物流。其中信息流和资金流在点击之间就可以实现,不受时间和空间的限制,物流就受到时间和空间的限制。随着物流信息化和网络化的发展,现在物流已经有了很大的进步,近几年的发展也可以用日新月异来形容,但是相对于电子商务的发展来说,物流的发展还是相对滞后。
(二)分散的物流配送造成了社会资源的重复配置,物流企业竞争力低下。我们国家2014年的第三方物流企业数目众多,但是,大多数是中小型物流企业,竞争优势不明显。2014年,天猫在B2C领域的市场份额为57%,第二位的京东为21%,二者就占到了B2C的78%。但是在物流领域,民营快递前十名的市场分额占到了80%。大部分物流企业小而分散,网点重复建设,浪费了大量的社会资源。
(三)O2O的发展对电商的配送水平提出了更高的要求。随着移动商务的发展,O2O成为电商发展的必争之地,但是,O2O对配送的要求更高的迅速、快捷、准确。某配送小区提出了线上线下一体化、闪配(60分钟配送)、增值服务(代收、代缴)的服务理念,这些理念对配送提出了更高的要求,如何均衡配送的成本和服务,成为O2O电子商务发展的一个重要课题。该图表来源于物流沙龙通过上述图表我们可以看到,O2O的配送成本是非常高的,假设平均每单的价格为50元,利润率为30%,则利润为15元,扣除配送成本11.25元,利润变为3.25元,利润率变为6.5%。由此可见,配送导致了利润率的降低。4、大数据本身对电商物流配送造成了更大的冲击。大量数据的归集和挖掘使电商物流配送越来越透明,电子商务企业对于物流的要求也越来越高,这样就迫使物流配送企业竞争更加激烈,并且有传统的价格竞争向更高的服务层次的竞争转化。
三、电子商务与物流配送的发展的新特点
国务院2014年9月12日印发的《物流业中长期规划(2014-2020年)》中指出,物流行业的重点工程之一就是电子商务物流工程,建成一批区域性仓储配送基地,吸引制造商、电商、快递和零担物流公司、第三方服务公司入驻,提高物流配送效率和专业化服务水平。[3]随着电子商务的飞速发展,信息化对各行各业的影响越来越显著。作为与电子商务有着亲密接触的物流业,更是受到信息化和网络化的深刻影响,不能适应信息化的物流配送企业几乎不能在大数据时代的竞争中获得一席之地。电子商务和物流配送的关系也随着时代的发展表现出了很多新的特点,主要由以下几个方面:
(一)物流配送企业自身的网络化、信息化。物流企业不同于生产企业,其业务不仅仅局限于本地,因此,通过传统的口碑、人脉宣传是远远不够的,随着网络化的发展,物流的宣传也必须通过网络来进行,物流企业大部分都建立了自己的官网,来宣传自己的企业。物流配送设计的面比较广,一个物流配送企业在各地有多个仓库,如何实现仓库之间的合理调配、仓库内部的有效管理、运输过程的快速准确,仅仅通过传统的管理方式是远远不够的,目前,有很多的管理系统的出现应用于物流企业。TMS、WMS、LMS、SCM、CRM、OA都是信息化与物流相结合的产物,提高了物流配送的效率,更好的提高了物流配送的服务水平。随着移动商务的发展,物流APP也逐渐投入使用,很多的物流APP开始应用于运输领域和配送领域,丰富了物流配送的形式。2014年5月起,越来越多的快递面单变成热敏标签面单,新面单是由菜鸟网络联合各快递企业共同成立的“电子面台”出品。这种电子面单面向60多款主流配送软件,使用软件的可免费使用电子面单,节省了纸张,提高了打印速度,节省了人力资源。电商物流配送的信息化深入到配送的各个环节和领域。
(二)物流资源的共享成为物流发展的必然趋势。2013年5月28日,阿里旗下天猫、银泰集团联合复兴集团、富春集团在深圳成立了“菜鸟网络科技有限公司”,此外,马云邀请三通一达和顺丰加入,这几家民营快递各投入了5000万,占股1%。以上资料显示,民营快递正通过自己的方式谋求资源的共享,中国邮政也表示要与阿里巴巴合作,将自己的网点对民营快递开放。电子商务物流配送企业虽然是竞争关系,但是,在配送的过程中,网点的重复建设大大的耗费了社会资源,也占用了大量的社会资金,各个快递公司之间实现资源的共享既能够提高配送的服务水平,也能够大量的节省资金,降低道路的拥堵程度,提高配送的经济效益和社会效益。
(三)数据、资源的整合成为大数据时代电商物流配送发展的大势所趋。[4]随着物流企业应用大数据的不断深入,数据被不断的分析和挖掘,将卖家、卖家、物流企业所有的资讯有效的连接在一起,最终实现资源与数据的有效结合,所有的物流资源在数据的牵引下共同服务于电子商务平台的卖方和买方,既降低了成本也提高了整个电商配送领域的服务水平。举例说明,当客户选择所想要的快递组合类型后,大数据平台会根据以往的快递公司的表现、各个分段的报价、即时运力资源情况、该流向的即时件量等信息,甚至可以加上天气预测、交通预测等数据,进行相关的“大数据”分析,从而得到优化线路选项,以供客户选择。之后,系统会将订单数据发送到各个环节,由相应的物流公司完成。
大数据论文范文第6篇
在大数据时代,优质教育资源共享的主体包括共享的双方,也就是资源需方和资源供方。随着时代的发展,优质教育资源的供方不仅包括各级各类学校、教育职能部门、公益组织和科研机构等非营利机构,也可以囊括教育资源提供商,甚至个体也可以成为优质教育资源的供方。要促进优质资源的共享,就要充分发挥互联网的共享性、平等性、开放性特点,全面拓展优质教育资源供方的来源。优质教育资源的供需双方并非一成不变的,在大数据时代,要积极促进优质教育资源供需双方的相互转化,尽量做到各取所需、各尽其能,使优质教育资源的供需双方能够互相交叉和重叠。
二、大数据时代优质教育资源共享的运行系统
要提高优质教育资源共享的效率,促进我国高中教育的不断发展,就必须重视优质教育资源共享的运行系统建设,要使共享的优质教育资源能够满足我国高中教育教学的需要,从而使优质教育资源的利用效率得到提高。
1.优质教育资源共享的建设系统
优质教育资源共享运行系统的第一个环节就是建设系统,进行优质教育资源的汇集和开发工作。建设系统要将教育资源分为非数字化教育资源和数字化教育资源两种,对于数字化教育资源主要是直接汇集和开发,对于非数字化教育资源还要进行数字化加工和制作,使其符合媒体文件的载体和格式。建设系统还要将已有的教育资源进行汇集和整合,使其汇聚起来,能够进行推广、评估和归类。
2.优质教育资源的传送系统
传送系统主要负责传输和配送优质的教育资料。例如,可以向特定的目标区域进行优质教育资源的配送,包括少数民族地区、贫困地区等等。也可以通过对口帮扶的形式,使优质教育资源的供需双方结成对子。在大数据时代,要充分利用先进的社会计算、4G技术、三网融合、宽带网络等技术,提升优质教育资源的投入产出比。
3.优质教育资源的使用系统
使用系统要具备相应的硬件设备条件,使资源需方能够顺利获取教育资源。使用系统还应该具备指导、培训、高级检索等功能模块,使资源需方能够按照自己的具体需求获取和检索优质教育资源。需方也可以对优质教育资源进行再加工,例如,高中学校可以对先进的教育教学理念进行二次加工,使之能够与自身的教材版本、学情相符合。
4.优质教育资源的评估系统
通过评估系统,可以对优质教育资料的共享效率和共享质量进行切实反馈,对共享进行保障。评估系统先要评估本身的教育资源,从而解决数字化教育资源建设层次较低的问题,将真正有价值的、优质的教育资源挖掘出来。评估系统还要评估教育资源的传输配送情况。我国很多地区的地理条件比较恶劣,基础设施建设薄弱,要确保教育资源能够按照需方的要求进行传输。此外,需方对于优质教育资源的使用情况也应该纳入评估系统,并让需方根据教学活动的需要选择合适的优质教育资源。在大数据时代,通过信息技术,可以有效地促进高中阶段优质教育资源的共享。从社会发展的角度来说,优质教育资源的共享促进了不同地区和学校之间教育资源的交流,有利于我国教育公平的发展和实现。在大数据时代,要进一步发挥信息技术的重要作用,更加深刻和全面地推进优质教育资源的共享。
大数据论文范文第7篇
1.海量信息思维模式
以往人们总是尝试先发现问题,再获取相关信息,探索解决之道。而大数据时代,人们总是先尽可能多的去获取和储存信息,而信息数据价值密度低、数据量大,当遇到问题时再尝试解决问题,其解决的效率和精准度率也有所提升。这种“海量信息”的思维在进行服装流行款式、流行色彩的市场调研时,依然十分适用。
2.新媒体思维模式
信息数据附着在各类新媒体之上,数据格式多种多样,从网页论坛、视频、网络日志、微博微信、甚至地理位置信息等等。新媒体思维正在改变服装市场的营销方式,服装企业传统的营销手段是实体店集中推广、平面广告以及电视媒体宣传,节假期间雇佣大量劳动力街头派发促销传单。而大数据时代,服装企业充分利用互联网的植入式广告、病毒式推广以及低成本营销,打造网络交易平台,全方位收集消费者信息数据,分析消费者潜在消费动机与偏好,从而在推广品牌的同时扩大销售量。
二、大数据时代对高校服装设计教育的启示
1.教学方式的变革
随着笔记本电脑、平板电脑逐步进入课堂,教材、教学活动不断被数字化,教育方法应以更丰富多彩的形式融入课堂。网络教学和讨论方式也是大数字时代课堂经常采用的一种教学方式。以服装设计课程为例,在服装风格与流派章节学习中,鼓励学生利用网络资源,进行相关文献查阅,了解不同历史时期服装风格的含义与表现,以演示文档的形式进行小组讨论,并设计“最受欢迎的大学生潮流服饰搭配”问卷进行市场调研,感受数据的多样性以及数据分析方法。
2.课程知识点的设置
“因材施教”的理念在班级授课制中开展有着相当的难度,在有限的教学时间和教学空间内,教师对学生的“材”无法充分的了解和引导。在大数据时代,教师可以对每个学生学习数据进行分析,将学生的整个学习过程数字化,例如知识点可以被数字化并与测试题建立联系,测试题中每道题的完成时间、错题数等都以数据的方式记录。计算机通过错题分析出每个学生对各章节知识点的掌握程度,从而从根本上落实“因材施教”的教育理念。在服装结构设计类课程中,将知识点与知识点进行组合并设计考核题目,例如人体测量部位与原型版的对照练习,放松量章节的知识点与不同类型板型对应,款式分析与服装风格分析相关联,从而建立知识点与测试题的联系,用相关性思维解决结构类课程中的每一个细节问题。
3.侧重对学习过程的评价
随着笔记本电脑、平板电脑逐步进入课堂,教材、教学活动不断被数字化,学生学习过程也将逐渐数字化,学生的学习过程更加受到关注,而对于这些数据的分析与利用,将使得每位学生的发展都有据可依。例如,在服装工艺类课程中,将更注重实验课程环节的设计与实验过程考核,根据自学能力、创新能力和动手能力来评定学生的综合成绩。鼓励学生海量收集学科咨询,通过自主学习发现问题解决问题,而通过不同考核项目的得分,分析学生的自学能力与学习类型。
三、大数据时代对高校服装人才培养提出的新要求
1.获取有效信息数据的能力
互联网上各类教学视频、教学文库林林总总,各类网络学院、网络公开课、精品课程应接不暇。高校须引导学生自主学习,加深学生对当今社会变革的理解和认知,使学生具有大数据思维能力和判别能力,能够在时间学习中利用资源,使数据为专业学习所用。
2.分析数据的能力
要求学生能根据不同的需求,利用有效的问题解决思想和方法论,最终形成有效的数据,并能够为大多数人使用。利用定量和定型的分析方法,挖掘数据之间的相关性,并形成数据分析报告。该项能力需在服装专业考察、服装创新实践平台等实践环节的课程中,得到充分的训练。
3.团队的建立和管理
在大数据时代,单凭一己之力无法应对海量的数据,需要以团队的形式,在共同目标的引导下齐心协力、分工合作,因此要求学生具有很强的团队意识、良好的沟通能力和完善的团队管理制度。基于以上大数据背景和启示,大数据思维模式正在由商业服务领域向教育领域快速蔓延,大数据时代带给人们主要的思维模式为相关性思维、海量信息思维和新媒体思维,能够与高校服装设计教育理念多角度、多层面融合,从而指导服装设计专业从教学方式、课程知识点设置、考核评分标准等方面做出适应时代的变革。
大数据论文范文第8篇
在桥梁工程中,数据按时间上的划分可以分为两类,静态数据与动态数据。静态数据主要指桥梁的相关信息资料库与科学实验产生的数据。信息资料库是一种相对静态数据,因为这些数据资源每过一段时间将更新一次。各国家和各地方政府部门基本建立了桥梁工程资料库及相关系统,列举出主要国家和地方政府的桥梁管理系统,包括建成时间、系统功能、与建设部门等。除国家政府部门外,各科研单位也在完善各自的桥梁统计分析系统,系统中主要包括桥梁的桥型、跨径、材料、建成时间等基本信息,还包括桥梁的病害、桥梁状况评定等相关内容。桥梁的科学试验数据主要来源于各大高校和科研单位科学研究中的模型试验、振动台试验、风动实验、桥梁的荷载试验等产生的数据。这类数据的有效分析处理形成各类科学研究成果,但是此类数据的开放程度低,造成数据资源的极大浪费。桥梁的动态数据主要来自于桥梁的施工监控和成桥运营阶段健康监测系统,此类数据由安装在桥梁上的实时监测传感器获得,包括位移传感器、速度传感器、加速度传感器、应变计、温度计、风速仪、GPS等。统计了国内部分桥梁健康监测系统的传感器数量以及安装时间。各类传感器配以相关的采集系统来获得数据信息,再通过相关软件分析、处理,从而掌握桥梁的实时健康状况,对桥梁的状态进行评估与预测。整个桥梁健康监测体系。
2开发桥梁工程领域大数据资源意义
利用桥梁的静态数据库,可以了解桥梁的基本信息,为全国的桥梁统计、普查与管理提供信息资源。科研数据的开放有助于学术界的交流、创新,取得更为丰富的科研成果。桥梁动态数据包括施工监控数据与成桥运营阶段的监测数据,充分利用与挖掘大数据资源,可以提高桥梁的施工质量、加快施工进度,提前预测和解决施工过程中可能出现的问题,减少质量事故和经济损失。成桥运营阶段的监测数据主要为桥梁的健康状况评估提供依据,掌握桥梁所处的状态,分析、处理数据资源,提高预测、分析、解决问题的能力。可为同类桥梁的施工管理与养护等,提供宝贵经验。同时大数据资源的开放、共享,有助于节约国家资金和社会资源。
3存在问题及解决方法
(1)最先遇到的也是最棘手的问题是数据的去冗、去噪,从海量数据中挖掘大数据资源价值。目前,所列一座特大桥上各类传感器每天采集的数据达到几个GB到几十GB,甚至上百GB,如此海量的数据如何去处理,有效剔除无用的信息,找寻剩余有用的信息,从而产生新的价值、新的资源。这也是在大数据时代有效利用大数据资源要解决的首要问题。解决这一问题的主要途径是编译相关的去冗、去噪的智能分析软件,同时可以利用云计算、云分析、云管理等方法来提高解决这一问题的效率,使大数据变为有用数据,做到真正智能化分析。
(2)现在各政府部门和科研单位,都在做自己的桥梁信息库以及监测研发数据库等,而且大多数数据库都是相类似、重复的。这样造成资源的极大浪费,包括劳动力、资金等。解决这一问题的有效途径是加强政府部门、科研单位内部以及之间的相互合作,开放和共享数据资源,这也是大数据时代的必然趋势。各部门和科研单位可以有步骤、分阶段地开放共享各自所拥有的数据资源,不论是采用付费或免费的方式。
(3)由于大数据具有“4V”等特点,在大数据研究的初期阶段,大数据的价值还未充分体现时,要储存、分析、利用大数据资源,需有软件、硬件等基础设施的投入,国家和科研单位应提供专项资金的支持,同时国家可制定相关鼓励支持政策。
(4)在大数据时代成熟以后,应建立相关法规,规范和保护数据的开发利用,制订相关统一标准,提高数据的使用效率。
4结语
本文首次在桥梁工程领域引入大数据概念,提倡用大数据的观察事物的方法和思维方式来分析、处理、挖掘早已在桥梁工程中应用的大数据资源。文章首先介绍大数据的概念及特点,和在桥梁工程领域产生的静态与动态数据的来源。其次、说明充分开发桥梁工程领域大数据资源的重要意义。最后,就目前在桥梁工程应用中存在的问题提出相关解决途径。
大数据论文范文第9篇
对于新媒体文学意味着什么大数据让新媒体文学回到“去作者化”的共在混融状态:在传统声音媒介时代,读者与作者共同创作、修改诗歌;到了纸质媒介时代,作者的地位上升;在新媒体文学时代,读者可以对作家进行积极主动的反馈,但这种反馈呈现出信息零碎化、评价随性化以及无法把握所有地域、身份、族裔的不完整状态;到了大数据时代,新媒体文学借鉴《纸牌屋》的数据挖掘模式,可以对读者信息进行全数据收集整理,以最大的吸引力呈现一个文本(其中包括一种可能性,即同一个故事开头,针对不同人群有不同的故事演进和情节,乃至人物设置)。舍恩伯格认为,“大数据是指不用随机分析法这样的捷径,而采用所有数据的方法”,因此,我们分析的大数据其实应该被称为“全数据”。在网络新媒体时代,人类所有的网络行为都可以被数据化,而这些数据又能完全被收集、存储、交换和分析。人们在不经意之间产生的数据总量大到我们难以想象的程度。“据有关研究报告,2013年中国产生的数据总量超过0.8ZB,相当于2009年全球的数据总量。预计到2020年,中国产生的数据总量将超过8.5ZB,是2013年的10倍,一个大规模生产、分享和应用数据的崭新时代正在到来。”新媒体文学在发展过程之中当然也生产了大规模的数据,这些数据对新媒体文学意味着什么呢?第一,以PC和移动终端为主要载体的新媒体文学产生巨大的相关信息数据库,比如新媒体小说阅读量排行榜、新媒体作家数据库、读者阅读时间和习惯、哪些文学章节被反复阅读等等。与此同时,因为网络媒介的公开性和“无门槛”标准,新媒体文学的阅读者和创作者数量达到了文学史上前所未有的奇迹。2014年,中国网络文学的读者已突破5亿人,保守估计整体收入突破65亿元。这样大规模的用户群保证了巨大的数据量,也使文学网站拥有所有与网络文学相关的数据。网络文学带来的巨大经济效益成为对网络文学进行大数据分析的资本基础和动力。作为迄今为止最为强大的分析技术,大数据的重要价值在于预测趋势,即“正在发生的未来”。通过对这些大数据的分析,内容生产者可以有针对性地将作品推送给受众,而这种经过精心设计的文学作品恰好就是受众所需要的。这是因为大数据分析可以采用理想状态的全数据分析(目前还不能完全达到),而全数据分析由于分析的数据量巨大,单个数据的误差可以在分母巨大无比的全数据海洋之中被忽略。相反,在数据量有限的时代,我们就只能追求单个数据的精准。“因为收集信息的有限意味着细微的错误会被放大,甚至有可能影响整个结果的准确性。”当数据量持续积累增加时,对单个数据的精准性追求不是全数据的方式,放弃精准性、适度接受不精准性,仍然不会影响其结果。这类似于医用手术无影灯,从各个角度照射对象,永远不会存在盲区。盛大文学董事长邱文友认为,事实上国内文学网站在10年前就在运用大数据思维了:文学网站上有200多万名作家,700多万部作品,怎么在茫茫作家海中找出下一个唐家三少?靠数据分析。此外,在网络连载过程中,作家跟读者之间有互动,这些讯息也是数据。“比如作家本想让甲娶乙,可是绝大部分读者希望甲娶丙,这时候作家可以选择,是按原来思路,还是按小说可能延伸的商业价值去改写结局?所有决策的因素、动机跟方式,也是数据分析。”瑏瑡但是受网络技术发展的限制,当时新媒体文学的数据挖掘不可能像现在这样彻底和全面。第二,大数据时代新媒体文学批评走向多元化。当前的新媒体批评既包括传统精英式的学院派批评,也包括点赞、跟帖式的草根批评;学院派批评以黄鸣奋、欧阳友权为代表,草根批评以崔宰溶为代表。“黄鸣奋和欧阳友权以从西方新媒体技术层面发展出来的超文本理论作为理论生发点,对网络文学进行后现代性的学理探讨。”瑏瑢而崔宰溶认为,对中国网络文学的研究需要从原著理论(vernaculartheory)和网络性理论入手,才能真实地对新媒体文学进行研究。新媒体文学的接受者并不会以文化精英式的方式来俯视作品,他们对新媒体文学的批评是纯感受性的、本能直观的和零散局部的。这种自下而上的反叛式文学批评,迥异于传统精英式的学院批评。对中国新媒体文学的研究必须从网络的“原著居民”(网络文学读者)出发,由于他们大部分时间栖居于网络之中,因而对新媒体文学具有不受传统文学理论影响的本性感受力和知识系统。瑏瑣笔者认为,无论是西方网络文学理论还是原著理论,在大数据时代,它们都会被作为大数据库中的一个组成部分,再结合“总点击量”“总推荐”“月排名”等进行分析,从而寻找出读者最有可能喜欢的作品。无论如何,大数据时代给新媒体文学研究带来一种新实证研究路径。米埃尔(Miall)认为,文学的实证研究像灰姑娘一样总是被人们忽视或反对,早晚会有一天,实证研究将统领整个文化研究领域。人们会通过实证来研究理论观念,反思文学的本质和文化地位。瑏瑤网络技术的发达与新媒体文学的繁荣促成了大数据分析对于新媒体文学的数据实证性研究。
二、大数据思维给新媒体文学带来的理论思考新媒体文学的大数据分析
从学理上带来三组思考:一是大数据推动了新媒体文学的发展,然而新媒体文学能被彻底数据化吗?如果不能,那在什么样的层面上可以被数据化?新媒体文学与大数据思维融合的真正重要意义在何处?二是新媒体文学遭遇大数据思维之后,是否意味着对于新媒体文学的研究可以完全转换为数据式的实证研究?如果不能,对新媒体文学的研究还有哪些方面是大数据不可能涉及和完成的?三是当我们将文学接受者的大数据作为文学创作的唯一和最高标准之后,新媒体文学在题材选取、形式美学和叙事节奏等方面是否走向绝对迎合读者的趋势?如果是的话,新媒体文学作家的意义何在?他们又应该采取迎合还是引领的姿态呢?
第一,新媒体文学活动都发生在网络之上,因而可以被充分数据化。大数据自产生之日起,就迅速与人类已有的知识和学科产生了极强的关联,比如医疗健康、交通规划、公共管理、教育培养等领域都在你看不见的地方悄悄运作着大数据分析。“大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至本质的变化和发展,进而影响人类的价值系统、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论都将转变为实证科学中的具体问题。”瑏瑥大数据的此种趋势根源于它能将所有网络行为数据化的能力,比如在新媒体文学活动之中,我们可以轻松采集到作家和读者的数量、年龄层、分布地域、经济状况、教育程度、阅读习惯、题材喜好,等等。除此之外,大数据可以分析:哪种题材的文学受众最多?同一种题材之中,什么样的文学桥段让读者喜欢?幽默、推理、悬疑还是浪漫?文学作品之中什么样风格的语言会更受哪种人的喜爱?什么样的故事情节发展路线和结局是最受人欢迎的?等等。这些方面都可以通过读者的评论和阅读数据反馈到内容提供商和文学作家那里,从而对作品进行实时调整。但是,我们不能因为大数据有这样的效果,就认为新媒体文学可以被完全大数据化。其实,作为技术和艺术合一的新媒体文学在多个维度上是不能被量化的,比如作家的灵魂高度、文学思想的深邃性、文学的意境、文学的美感、文学的终极关怀和文学对人性的探测等都不能被量化,而这些维度恰恰是文学之为文学最核心的内容。不管大数据技术怎么发达,它所追求的绝对客观性其实在数据产生之初就不存在。数据无论在表面上看起来多么客观地再现对象情况,它本身其实是在一种具有倾向性和差异性价值观基础上被建构的。因而,大数据的生成和分析永远不可能摆脱自己天生就具有的价值主观性。我们能看到的数据是研究者有能力或者热切希望看到的数据,若非如此,即便大量数据生成了,也不能被数据识别系统发现。这就好比雷达效应,你的关注点除了对象之外别无他物,但是“他物们”却客观大量地存在于你的意识之外,只不过你无意或不能去抓取它们。所以,大数据不管看起来多么科学客观,背后其实与主观价值判断是分不开的。“大数据”并不等同于“大智慧”,即使占有大量的数据,还必须有对数据具有专业化分析能力的人。Netflix的CEO里德•哈斯廷斯利用数据分析的方法也是受他前期从事碟片租赁服务的启发。他一方面熟悉在网络上怎么通过数据分析为别人推荐自己喜欢的电影和电视剧,另一方面他在无数的观影之中对影片具有极强的审美鉴赏能力。科技和人文的结合让他具有对《纸牌屋》数据进行采集和分析的能力,这才是Netflix进军艺术界成功的原因。所以,同样的大数据在不同主体那里得出的结论或者采取的应用是相距甚远的。就好比同样是医学CT扫描,仪器是相同的,照出的片也是相同的,为什么大家愿意去权威医院检查呢?问题的根源在于对CT成像进行分析的医生水平,同样的CT成像,在拥有不同经验的医生那里得出的结论很可能有天壤之别。大数据作为一种技术在教育、电影、艺术等人文领域广泛运用已是不争的事实,除了让人文领域的成果与经济效益直接产生关联之外,它的最重要意义其实是在哲学思维层面。大数据分析使我们抛弃传统哲学一直追求的现象背后的原因,而转向为关注事物和事物之间的关系性,即从因果关系转变为相关关系。瑏瑦这种思维方式转变是顺应时代的实用需求而产生的。一方面,大数据思维不去深究因果关系,而是绕开因果关系,退到因果关系的上层———相关关系(包含因果和非因果关系)。这种搁置因果的选择更是由于因果关系和相关关系之间复杂的关系:“(1)两个事物间有因果关系时,这两个事物间往往会有相关关系;(2)两个事物间不存在因果关系时,这两个事物间也可能会有相关关系(虚伪相关关系);(3)两个事物间有因果关系时,这两个事物间也有出现零度相关关系的可能(虚伪零度相关关系)。”瑏瑧当略过这些复杂关系,只关注“相关关系———结果预测”,就会省去无数不必要的麻烦,而直接得出需要的答案。“相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,其他数据值很有可能也会随之增加。”瑏瑨2004年,沃尔玛公司分析顾客消费时的各种数据时,意外察觉到数据和数据之间的相关性:飓风来之前,手电筒和蛋挞都销量增加,因而超市毫不犹豫地将它们放在飓风用品附近。这个例子就表明在大数据时代,深究原因并不一定能找到答案,而对数据进行相关性分析才是其核心。另一方面,大数据带来的相关性分析由于技术的成熟变得比因果分析更容易。丹尼尔•卡尼曼(DanielKahneman)甚至认为,人类之所以一直热衷于因果关系思维,是因为在信息不发达的社会采用因果思维可以快速地作出决定。相反,在那个时代如果采用相关思维会特别费力且不可能有任何结论。大数据由于技术的支撑完全可以支持相关性思维,但我们在现实之中会发现传统因果思维得出的结论被置于大数据时代后是有问题的。
第二,新媒体文学的学术研究与新媒体文学的大数据研究不能混为一谈,二者采用的研究方法不同,而这两种方法也只有被局限在一定范围之内才能发挥出自己的长处。19世纪,类似大数据思维的实证主义就已经僭越过文学的领地。当时实证主义提出,表象本身才是具有研究确定性的对象,对象背后所谓的本质是并不存在的。实证主义“反对追求绝对的知识,它停止去探求宇宙的起源和目的,拒绝认识诸现象的原因,只专心致志地去发现这些现象的规律,换言之,去发现各种现象的承续与类似的关系”瑏瑩。实证主义的“只研究怎么样(how),而不研究为什么(why)”瑐瑠主张与大数据思维追求相关关系而悬置因果关系的方式极为相似。文学虽然作为语言的艺术具有强烈的主观情感色彩,但是对文学的研究在很大程度上可以采用实证主义的方法,比如对文学流派、文学史、作家时代背景、作品传播状况的研究等。实证主义既要有“实”,又要有“证”:从研究对象入手得到大量材料,在此基础上,还需要进行分析论证的过程,否则材料只是死物。反过来,我们认为实证主义精神只能限定在以上研究领域才是对文学研究有益的。如果实证精神进入文学意义范围,文学的灵魂、精神和审美只能被理性实证逻辑消解磨灭,最后成为他者的“嫁衣”。从传统的实证主义对文学的研究经验可知,任何一种研究方法是不可能包打天下的,对文学研究不同的维度只能用不同的方法。针对新媒体文学的实证主义(大数据思维),只能研究新媒体文学的,即对新媒体文学的传播效果进行分析,预测新媒体文学会怎么样,提供什么样的文学作品其传播力更强等。然而,对新媒体文学研究本身就不能是技术式的,而应该是美学式的。在具体研究方法上,新媒体文学与传统文学走的是不同的理论路线。但就其艺术品格来说,文学应该研究的依然逃不脱深层的价值审视:从感官刺激的表层能否将读者引向一般生活状况,如生死、战争、世俗、宗教等,进而感受人类的终极意义和终极关怀。即使新媒体文学从表征上带有后现代的去中心、平面化和反经典的倾向,但我们还是坚信好的文学与人性追求是同一的,狂欢式的浅薄带来的是“娱乐至死”的悲哀。
第三,大数据思维带来的新媒体文学审美形态是不是对大众的迎合呢?纯粹的迎合带来的是否只是新媒体文学短时期虚假的繁荣?众多网络之中是否有一批逆潮流而上的引领美学品味的真正意义上的作家呢?如果只是一味迎合大众趣味,以大数据的反馈作为依据,新媒体文学到一定阶段完全可以通过技术手段调整写作的内容和风格,这样作家就成了读者们意见的平衡机制,这样的新媒体文学家没有太大的存在必要。我们可以设想一种状况:一部小说,作家只需要给一个开头,后来的情节发展完全通过数据汇聚网民的意见和倾向进行延伸,最后,小说成为读者们合力形成的整体,这样的小说(姑且称其为小说)就是优秀的文学作品吗?真正伟大的作家并不迎合当下的恶俗状况,而是写出深刻的作品,慢慢培养读者的审美趣味,让我们真正感受文学的意义、领悟存在的价值、思考人生的真谛。就像史蒂夫•乔布斯做苹果手机一样,他坚持认为不用考虑消费者的兴趣,你需要做的是培养和引领审美。两种不同的文学态度使得对文学具有深入思考的作家陷入两难境地:迎合还是引领读者和市场?迎合读者型的新媒体文学只需要通过大数据分析带给读者们娱乐风格的作品,这种作品只需要考虑文字故事如何带来感官的愉快,读者怎么舒服怎么写。引领型的新媒体文学有一个共同特征———“反浅薄”,文学作品需要读者理解力的参与和感受力的调动,从作品之中读到的除了“文之悦”之外,还有深邃的心灵和精神层面的内容。新媒体文学植根于众生喧哗的网络媒介之中,但是我们不能据此将新媒体文学必然地视为通俗艺术。新媒体文学不一定必须提供短暂的、不能激发任何智性思考和审美挑战的作品。在新媒体之中不可能存在可以吸引所有读者的文学作品,因为这就是新媒体的性质:作家创作风格的多元存在和读者审美兴趣的散点式分布。也就是说,新媒体文学的审美情趣和属性不是由它所寓居的媒介来决定的,而是由作家自己的选择决定的。网络媒介带给人表达的自由和平等,从而带来大众极大的参与兴趣和阅读快乐,其中不乏并未获得话语权的精英作家。所以,新媒体文学应该生长在一个包容性极强的场域之中,否则,引领文流的作家就不可能拥有宽松的成长环境。但是,如果我们单纯用技术方式来衡量艺术,艺术将会走向媚俗的商业逻辑道路,而优秀的艺术因其表征具有长期性会被戴着大众文化眼镜的数据技术过滤掉,剩下的只是众生喧哗的靡靡之音。
本文链接:http://www.vanbs.com/v-141-2194.html大数据论文范文10篇
相关文章:
英语小学生自我介绍08-17
语文老师教育08-30
最新业务员个人工作总结简短(18篇)08-09
房地产全程策划合同08-15
企业用工劳动合同07-26
学校周年庆典策划书08-31
名著《奥塞罗》读后感11-16
男子跳远加油稿10-11
中学生运动会广播稿09-12
阿尔山森林公园的导游词07-26
柳暗花明又一村作文10-12
童年比喻句08-02
祖国在我心中作文07-23
2024武汉传媒学院在湖南怎么招生的11-23
2024扎兰屯职业学院在湖南怎么招生的11-22
湖南文科二本大学有哪些09-07