童鞋论文网专业提供代写本科论文、代写硕士论文、代写职称论文、代写毕业论文、论文发表等服务,上万成功案例,欢迎咨询。 网站地图  |  加入收藏  |  设为首页
童鞋论文网
热门搜索
行政 教育 营销 法律 经济 护理 心理 会计 文学 工商 计算机 旅游
站内搜索:
童鞋论文网
 当前位置:童鞋论文网 > 专科论文 > 文章正文
 
大数据背景下档案数据管理研究
论文作者:童鞋论文网  论文来源:www.txlunwenw.com  发布时间:2019/11/14 8:53:13  

摘要:2008年,《自然》杂志发布了大数据的专刊,大数据这一话题迅速成为全球范围内的讨论焦点;2012年,奥巴马政府启动“大数据研究和发展计划”,关于大数据的讨论进一步升级。国家档案局响应政府的号召,在《全国档案事业发展“十三五”规划纲要》(以下简称“纲要”)中指出,“采用大数据、智慧管理等技术,探索电子档案与大数据行动的融合,对加快档案管理信息化进程,满足社会各方面对档案信息的利用需求,更好地为党和国家各项事业发展服务”有着积极意义。[1]与国际社会相比,大数据在我国的研究还处于起步阶段,档案学界对网页资源的采集,社交媒体文件归档等与大数据相关的话题是否具有档案学范畴的研究价值,以及其责任权属等问题逐渐受到人们关注。《纲要》将这些专业术语纳入其中,充分体现了大数据时代档案数据概念的外延和国家档案局将大数据与档案信息资源建设相结合的决心。从整个政策导向上来看,我们的话语体系正从“信息化”逐步向“数据化”发展。在大数据时代,我们应当拓展自己的研究视野,将档案信息化与大数据行动相融合,寻求出更加科学合理的档案数据管理模式。

关键词:大数据; 档案数据; 数据管理;

1 引言

1.1 研究背景

2008年,《自然》杂志发布了大数据的专刊,大数据这一话题迅速成为全球范围内的讨论焦点;2012年,奥巴马政府启动“大数据研究和发展计划”,关于大数据的讨论进一步升级。国家档案局响应政府的号召,在《全国档案事业发展“十三五”规划纲要》(以下简称“纲要”)中指出,“采用大数据、智慧管理等技术,探索电子档案与大数据行动的融合,对加快档案管理信息化进程,满足社会各方面对档案信息的利用需求,更好地为党和国家各项事业发展服务”有着积极意义。[1]与国际社会相比,大数据在我国的研究还处于起步阶段,档案学界对网页资源的采集,社交媒体文件归档等与大数据相关的话题是否具有档案学范畴的研究价值,以及其责任权属等问题逐渐受到人们关注。《纲要》将这些专业术语纳入其中,充分体现了大数据时代档案数据概念的外延和国家档案局将大数据与档案信息资源建设相结合的决心。从整个政策导向上来看,我们的话语体系正从“信息化”逐步向“数据化”发展。在大数据时代,我们应当拓展自己的研究视野,将档案信息化与大数据行动相融合,寻求出更加科学合理的档案数据管理模式。

1.2 国内外研究现状分析

我国关于档案大数据的文章大多集中在2012年以后,其研究主要集中在档案大数据的内容和大数据环境下档案工作的开展两方面。

在对档案大数据的内容直接研究方面,有学者从档案大数据基本概念出发,认为“档案大数据是一定空间与时间范围内所有档案数据的集合”[2];有学者从档案大数据深层内涵出发,认为“档案大数据既是指档案部门管理的各类档案数据,又包含档案部门自身产生的大数据,而其核心之意应是档案工作领域的大数据应用”[3];有学者从档案大数据属性出发,认为档案具有“资源整体量大且增长快”“类型繁多且结构复杂”“资源价值高”等大数据特征[4];有学者从档案大数据核心价值出发,认为“档案大数据的核心内容与价值是挖掘提取有价值的信息,进行科学预测”。[2]

在大数据环境下档案工作的开展方面,各学者从大数据语境下档案信息资源建设、档案信息安全、档案信息开发利用、档案信息服务、档案教育、档案学科发展[6]等角度展开讨论,着眼于大数据环境下档案工作面临的机遇、挑战和应对策略。其研究内容主要集中在实践性方面,观察的视角着眼于微观层面,在研究内容的理论性和宏观角度有所欠缺。

国外学者对此方面的研究更注重宏观层面的整体性思考。Dobreva等[7]认为数据管理是一个多科学研究领域,大数据时代它与档案学的关系是双向的。Doorn等[8]将档案学对数据管理的研究与科研数据管理联系起来,认为以往科研数据管理与文件档案管理相关度不大,但随着信息技术和开放存取的发展,二者之间将出现交汇的迹象。Lemieux[9]则着眼于大数据时代技术应用在档案方面的可行性,指出现在正是探索新技术与新实践在档案活动中的应用的绝佳时机。

2 大数据背景下档案数据的内涵和特点

2.1 大数据背景下档案数据的内涵

档案也是一种数据,但档案数据与一般数据又存在着较大的差异。档案数据的特殊性主要体现在保存单元、来源和关联三个方面。从保存单元来看,档案是以文件为单元保存的。这里的文件不是计算机文件,而是具备完整的内容、结构和背景要素的业务记录,因此,档案文件是逻辑上的数据组合。[10]在后续归档过程中,数据归档的颗粒度相比文件归档更加细。从来源方面来看,档案文件一般直接在机关业务活动中形成,属于内部来源数据;而一般数据既可能在本单位内部形成,又可能从外部购买。从关联方面来看,档案文件之间的关联一般是其形成活动之中的业务关联;而一般数据之间的关联除了业务关联还会有技术关联,比如在同一个数据库中同属于非结构化的文本类型。

档案是一种特殊的数据,在大数据时代,档案数据的内涵进一步拓展。根据DIKW模型,即数据(Data)→信息(Information)→知识(Knowledge)→智慧(Wisdom)的金字塔模型,数据在加工处理后成为信息,信息通过提炼成为知识。而在大数据时代,更加先进的数据挖掘技术和数据关联技术可以跳过信息层,直接从数据本身中挖掘出知识甚至智慧,档案数据亦是如此。档案数据只有与其他数据进行关联分析时才有新的应用价值,甚至需要进行跨领域的数据分析,才有可能形成真正的知识和智能,产生更大的价值。[11]因此,大数据时代,档案数据价值超越档案信息的凭证和参考价值向知识层面价值转换。[12]目前所提倡的“知识化服务”“智慧档案馆”等也正是基于大数据时代档案数据的内涵,对其进行更好的开发利用。

2.2 大数据背景下档案数据的特点

首先,大数据时代档案数据时间跨度大。大数据时代档案数据产生的节点并非是来自大数据技术应用所产生的档案数据,追溯其整个产生过程应当还包括之前档案电子化、电子文件时代所产生的档案数据。大数据在我国兴起的时间并不长,我们正经历一个从档案数字化到档案数据化的逐步转变过程。从档案的数字化到档案的保存,从电子档案的保存到对更深层次的档案数据增值问题的关注,这是一个漫长而循序渐进的过程,其中涉及的大量数字资源都应当纳入大数据时代档案数据管理的范畴。因此,大数据时代的档案数据应当是传统档案数据和新时期实时产生的档案数据的集合。

其次,大数据时代档案数据的范围广。一方面,大数据时代的档案数据来源传统的电子档案,还包括了社交媒体文件、超大规模数据库、3D图形等形式各异的渠道;另一方面,档案数据除了包含档案内容、结构和背景数据之外,还包括档案部门在档案业务活动中产生的数据,以及那些具有长久保存价值但还没有纳人档案部门保管的数据,如政府开放数据、网站数据、智慧档案馆的运维数据、利用物联网技术对档案馆人和物全面感知的数据,即档案馆的建筑环境、设备资产、档案资源以及用户等主要构成因素的关键数据等。[13]

最后,大数据时代的档案数据更加多元化。一方面,大数据时代档案数据的形式更加多元。档案本身具有历史的凭证性和记忆性,其属性以传统意义来看应该是属于滞后的。但在大数据时代,档案数据更加突出了数据的实时性特点,档案学界也开始更加关注这些实时数据的保存以便发挥更好的社会效用。因此,大数据时代档案数据的形式不再拘泥于档案文件本身,可以是一个复杂的数据库,也可以是一条简单的微信推送。另一方面,档案数据的内涵在大数据时代得到了进一步的拓展,档案数据超越不仅仅只是指代档案信息。大数据时代的档案数据内涵不局限于档案的内容,还关注以数据包为单位的多元数据。因此,大数据时代档案数据是一个总称。[12]

3 大数据背景下档案数据管理新思考

3.1 技术角度思考

正如Lemieux[9]所说的现在正是探索新技术与新实践在档案活动中的应用的绝佳时机,在大数据时代,面对海量的档案数据时,新技术的引进与推广是解决档案数据管理难题的一大策略。例如,在上述提到的数据的多元对应方面,传统的关系型数据库已经无法满足多元数据的管理需求,因此可以运用No SQL、Hadoop等分布式存储技术。在数据的安全性保护方面,可以运用仿真技术,通过封装数据、软件和环境信息等,到仿真环境下加载执行,以此来保证了数据的长期存取[16]。Lemieux[9]将可视化技术运用在档案数据的分析整理中,他建议在视觉上表示类似于群集的档案文档,其中单个文档在语义上映射到群集中的单个点并投影到2D空间,以便能够按文件类型和空间布局对文档进行聚类。

国外部分机构面对数据管理中遇到的问题时,在技术方面也有所回应。例如英国国家档案馆(TNA)以文件格式登记技术(PRONOM)为核心,以面向服务的可拓展架构为基础,提出了数据主动保存技术框架。[16]PRONOM的优越之处在于,其可以识别最佳的迁移数据格式,并提供最佳的数据迁移路径。

国外部分机构应用新技术优化了大数据时代数据管理中的部分问题,但对更多新技术的引入,目前尚处在理论假设阶段,实际可操作性如何还有待商榷。例如,Rosenthal和Varias指出[19],相较于本地磁盘存储,系统的云存储方式并不具备成本优势。在可视化技术的引入方面,其在档案数据管理领域是否可以直接照搬其他领域的应用模式,还是需要具有自主的研究创新,目前这方面的研究也有所空缺。总之,在大数据时代新技术的引入是档案数据管理领域一个必然的趋势,但对其适应性和功能性的研究还有待进一步的深化。

3.2 理论角度思考

大数据时代,档案学与数据管理的影响是一种双向的影响。

一方面,在大数据观的推动下,档案数据的内涵和档案学的学科边界都有所扩展。从微观层面来看,电子文件时代,学者们构建了新来源原则、双重鉴定理论等来适应新时期的电子文件管理工作。同样,在大数据时代,档案数据的新内涵和特点对原有的档案管理理论发起了冲击。例如,和在上述数据的归档保存中讨论的一样,原有的职能鉴定法无法完全适用于大数据时代的档案数据,其鉴定的范围需要进一步扩展,我们需要对其进行新的阐释。因此,在大数据时代,随着档案数据内涵和外延的扩展、技术环境的变化,档案学的管理理论需要重构和优化。

另一方面,数据管理继承了一些档案学的原理与概念,我们可以用档案学的方法进行更好的数字管理。Dobreva等[7]指出,数据管理应该采用档案学的原则概念,如真实性和完整性,来要求保存对象的背景及内容和结构。Gilliland-Swetland[21]倡导,要将档案范式灌输到数字环境中。Ray[21]指出,档案对数字基础设施的最有价值的贡献是通过数据文档和证据规则进行未来使用的背景原则。总之,在大数据时代,档案学原理如来源原则、真实性原则、选择和鉴定原则、元数据、风险管理等都可以应用于数据管理中。

3.3 实践角度思考

大数据时代,受到技术的冲击和政策的影响,档案数据管理的主体原来越多元化,各种各样的数据管理机构应运而生。[10]为了满足大数据时代的技术发展需求,档案部门与新兴的数据管理部门合作在所难免。诚如上面理论论证所说的那样,大数据时代档案学的学科边界进一步被拓展,多学科、多部门的交流合作是一种必然的趋势。但在实际操作过程中,除非档案部门强制要求或介入,一般数据管理机构很少考虑数据管理时的档案需求,可能仅仅只是将其存贮保存,而忽略了档案数据之间的内在联系,削弱了其档案学色彩。这也是在今后档案数据管理中需要思考改进的地方。

大数据时代,档案管理和数据管理这两个概念相互碰撞,相互影响。对于这两个概念,我们应该寻求一种更科学的方式对其进行衔接交汇,以使数据管理部门能够按照档案部门的要求,将档案数据在物理上以数据的形式保存在系统中,在逻辑上以文件的形式保留其内在联系。

大数据时代,新技术的引入能对档案数据进行更好的管理,但对其适用性与功能性的研究还有待进一步的深化;档案管理理论与数据管理理论相互碰撞交汇,使得档案数据的内涵和整个档案学的边界到得到了扩展。在此基础之上,档案部门应该依旧坚持其主体地位,联合新兴的数据管理部门,主导整个档案数据管理工作科学有效的开展。

参考文献

[1] 国家档案局.全国档案事业发展“十三五”规划纲要[EB/OL].[2016-11-O1](2016-04-07).

[2] [5]鲁德武.试述档案大数据的定义、特征及核心内容[J].档案,2014(4):13-15.

[3] 郑金月.关于档案与大数据关系问题的思辩[J].档案学研究,2016(6):37-40.

[4] 宋淑琴.大数据视野下档案管理思维方式的转变[J].档案学研究,2015(3):36-39.

[6] 周耀林,常大伟.我国档案大数据研究的现状分析与趋势探讨[J].档案学研究,2017(3):34-40.

[7] [20]Dobreva M,Duff W M.The ever changing face of digital curation:introduction to the special issue on digital curation[J].Archival Science,2015,15(2):97-100.

[8] Doorn P,Tjalsma H.Introduction:archiving research data[J].Archival Science,2007,7(1):1-20.

[9] [15][17]Lemieux V L.Visual analytics,cognition and archival arrangement and description:studying archivists’cognitive tasks to leverage visual thinking for a sustainable archival future[J].Archival Science,2015,15(1):1-25.

[10] [23]刘越男.大数据政策背景下政务文件归档面临的挑战[J].档案学研究,2018(2).

[11] 郑金月.数据价值:大数据时代档案价值的新发现[J].浙江档案,2015(12):11-14.

[12] [14]于英香.从数据与信息关系演化看档案数据概念的发展[J/OL].情报杂志:1-6[2018-11-19].

[13] 郝伟斌.面向智慧城市的档案信息化[J].档案管理,2013(4):21-23.

[16] [18]李翔,张斌.数字策展的研究进展[J].情报杂志,2014(8):130-138.

[19] Rosenthal,David S H,Vargas,et al.Distributed Digital Preservation in the Cloud[J].International Journal of Digital Curation,2013,8(1):107-119.

[21] [22]Poole A H.How has your science data grown?Digital curation and the human factor:a critical literature review[J].Archival Science,2015,15(2):101-139.

上一篇:档案展览工作的开展探讨     下一篇:论档案数字化破解数字档案馆建设难题对策
 
论文客服 95702844
论文热线18796337551
本站网址 www.txlunwenw.com
郑重承诺 原创,包修改,包通过!
童鞋论文网真诚欢迎新老客户的光临与惠顾!
 
 热门文章
· 住宅建设用地使用权续期研究
· 用户锁定效应视角下的网易云音
· 众筹产品创新性对融资绩效的影
· 南京市城镇居民冷鲜肉认知度问
· 摩拜共享单车可持续盈利研究
· 催生地方政府隐性债务风险的原
· 社交媒体中不实信息转发主体心
· 基于网络平台的SPA模式研究——
· 基于游客感知的云台山景区微信
· 新媒体时代背景下乡村旅游企业
 
 推荐文章
· 大学生网红消费探讨
· 论我国跨境电商平台进口文具用
· 论消费者微商化妆品购买行为及
· 中美贸易摩擦中的贸易失衡误区
· 大学生校园外卖研究
· 大数据“杀熟”现象探讨
· “@故宫淘宝”微博的文化品牌传
· 物理专业师范生PCK发展研究
· 鄂西土家族音乐档案保护探讨
· 广西地区农家乐经营模式研究
 
 相关文章
· 高校党员教育量化分析的大数据
· 基于大数据的通信企业管理会计
· 大数据时代基于云会计的财务共
· 大数据对NBA赛事的影响研究
· 基于大数据的企业财务管理创新
· 国防动员大数据的应用前景探讨
· 大数据时代企业危机管理探讨
· 普通企业也可以玩转大数据
· 大数据时代大学生诚信意识的培
· 大数据背景下的电子数据证据挑

论文原创,准时交稿,包修改,包通过,八年信誉,品质保证
童鞋论文网提供代写本科论文,代写专科论文,代写毕业论文,代写职称论文,代写硕士论文,论文发表及查重服务
备案号:苏ICP备11011187号-1 苏公网安备32030502000117号
版权归童鞋论文网所有 禁止一切商用盗用