电子文件元数据自动采集的原则和实施路径研究论文

时间:2023-04-29 16:40:34 论文范文 我要投稿
  • 相关推荐

电子文件元数据自动采集的原则和实施路径研究论文

  本文系“电子文件元数据自动采集与智能分析实证研究”的项目成果。通过探讨理论架构并系统实施电子文件元数据自动采集,实现标准化、自动化管理,全面提升机构电子文件管理水平,同时为电子文件内容信息智能分析奠定基础;通过智能分析研究,充分挖掘隐含在电子文件内容信息中的知识关联,深度开发,支持决策。

电子文件元数据自动采集的原则和实施路径研究论文

  一、元数据自动采集需求分析

  元数据是描述文件背景、内容、结构及其整个管理过程的数据。不同于传统意义上的着录,元数据内涵更丰富,功能更全面,要求更严格,不可能由档案管理人员在文件归档后进行着录,更不可能由形成机构文件管理人员或业务人员手工录入。元数据需要全程规划,需要嵌入系统,需要实时自动采集,需要真实、动态地再现电子文件管理的背景信息及过程信息。实现元数据自动采集,是元数据自身管理的要求,也是形成机构实际业务的需求。

  (1)元数据管理要求

  国际标准《信息与文献电子办公环境中文件管理原则与功能要求》(ISO 16175 1-3)一再强调,文件管理元数据(metadata)包括“识别、认证文件和文件背景关联等信息以及生成、管理、维护和使用文件的人员、流程和系统的信息,文件管理政策”。只有伴有界定了关键特征元数据的文件才是真实有效的文件,这些特征必须被清晰地记录下来。元数据在文件捕获点上对文件进行详细说明,固化文件与其业务背景的关联,对文件实施管理控制。在整个生命周期中,新的元数据不断伴随业务的开展、提供利用而持续增加,以长期保证真实性、完整性、可靠性、可用性,使得对文件的管理成为可能。

  在电子文件管理系统中必须实现元数据的有效管理。电子文件管理系统(ERMS)作为专门用于对文件的维护和处置予以管理的系统,具有如下属性:在背景中生成文件;管理和维护文件;依据要求的时间长度维护文件;文件管理元数据要可以设定。

  作为描述文件背景、内容、结构及其整个管理过程的数据,元数据最大的特征是动态性,动态地再现文件生成、流转、管理的全过程,在整个生命周期中为电子文件(包括由此转化而成的电子档案)的真实、完整、可靠、可用保驾护航。元数据的重要价值在于还原文件的背景信息,反映其所生成的政策法规和技术环境,显示与其他文件以及业务行为责任者等的各种关系,克服电子文件虚拟存在的局限。可见,元数据记录和反映的这些错综复杂、动态变化的信息已经无法仅仅依靠手工进行记录,必须嵌入系统,由系统自动判断、计算与识别,实现系统自动采集元数据是元数据自身管理的要求。

  (2)机构业务需求

  电子文件的特点决定了对元数据的采集必须前置,由前端形成机构伴随业务活动的开展和其间文件的形成进行采集与管理。《文书类电子文件元数据方案》(以下简称《元数据方案》)给出了88项元数据元素,其中80%需要形成机构进行采集,而且过程性元数据需要反复着录,侧重记录电子文件生成的技术环境与业务过程信息,所涉问题难度大且较复杂。特别是《元数据方案》中规定的一些元数据项存在“宏观”或“笼统”的情况,比如元数据中“日期”项,如不结合文件生成、运转、处置的流程予以细化,则无法确定采集节点和采集方式;仅从文件生成流程来看,面临着起草、会商、审核、签发等诸多“日期”,哪些日期最为关键、哪些应作为元数据予以采集、在文件生命周期中是否重复元数据以及如何采集等,都需要结合机构业务流程和相关规范深入研究,并实施精细化管理。对文件形成机构(即业务机构)而言,因为元数据管理而徒增繁重手工着录工作量,造成人力物力财力的巨大浪费,进而影响机构工作效率与绩效。需要指出的是,元数据并不是独立的,而是与机构自身电子文件管理基础密不可分。没有科学的电子文件、档案一体化全程管理流程,没有完备的电子文件元数据管理功能要求,便无法构建完善的元数据管理方案。因此,本文的研究内容是综合性的,从狭义来讲是电子公文元数据自动采集方案;从广义来讲是机构电子文件管理方案。

  二、元数据自动采集原则

  (1)基于档案管理的基本原则

  1.来源原则。元数据采集虽然通过对电子文件信息加以采集、提炼、分析和组织,揭示文件、档案的内容及其产生规律,但是仍然以尊重档案的本质属性和规律为前提,在采集时注重体现电子文件来源,使机构中同一来源的电子文件通过元数据采集得到集中反映,使元数据与档案的来源相联系,以此通过元数据揭示同一来源的档案、文件之间的各种联系,为档案、文件的理解与利用提供来源方面的背景信息。

  2.有机联系原则。有机联系原则也是档案管理的基本原则,是指系统中文件及组成系统的诸要素之间需保持时空上的相互联系。由于电子文件是以二进制代码的形式分散存在于计算机之中,因此保持文件之间的有机联系显得尤为重要,而要保持这种有机联系,必须依赖于元数据。以此原则为导向的元数据采集实质上就是电子文件信息的系统化增值过程,其目的是把分散的文件信息转化为互相联系、系统的信息流,形成文秘站-您的专属秘书!更高级的信息产品,满足用户的特定利用需求。通过元数据采集与管理过程,使大量文件特征信息加以系统化和组织化,有效控制档案、文件信息揭示的数量和质量,克服档案、文件查询和利用的困难,提高检索效率,节省查询成本和精力耗费,实现价值增益。

  (2)基于电子文件管理的原则

  1.前端控制原则。就元数据采集来说,在已经建立了电子文件管理系统的机构,电子文件在系统中生成、运转,电子文件元数据采集的前端“超前”至系统的设计阶段,前端控制的形式也部分转移到系统功能的设计之中,即尽可能地把文件生命周期各个阶段的元数据需求设计在系统之中,以功能合理的OA系统作为管好电子文件的先决条件。

【电子文件元数据自动采集的原则和实施路径研究论文】相关文章:

舰船数据信息采集方法研究04-29

浅谈自动观测数据文件的预审04-26

浅谈自动观测数据文件的预审04-29

大数据环境下的电子商务安全研究论文12-14

在互联网上研究电子文件04-27

道路纵横断面测量数据的半自动采集方法04-28

制药企业生产过程的数据采集及电子记录系统04-30

金属切削数据采集05-02

研究生论文选题、开题报告的原则和要求04-27

水下地形测量数据采集系统开发的研究04-28