论文查重 | 论文文献库 | 电子图书采购批查重研究

电子图书采购批查重研究

来源:论文查重 时间:2019-08-06 10:59:56

[摘要] 电子图书采购论文查重工作的质量直接影响到图书馆馆藏文献建设的质量和电子图 书购买经费的控制。本文详细的讨论了批查重方法在电子图书采购方面的应用,在实际工作中 使用批查重方法可以大大提高电子图书采购的质量和效率。
l 电子图书采购查重的概念
电子图书采购查重就是对决定要购买的电子图书进行核查重复记 录。即利用有关计算机工具对馆藏总书目进行检查,若图书与某一馆藏 记录的题名、责任者、出版项、ISNB等著录信息(字段)完全相同,则为重 复。通过查重来核对以前是否人藏或预订过这种电子图书,以避免重订 误订,并在该电子图书缺少或需要补充时,能够确定订购。 传统的手工查重工作费时费力,效率很低。本文介绍利用数据库处 理的方法进行电子图书批查重,在手段上较之以往的手工查重方式更为 方便、灵活,在查重字段数量选择上,可以更大限度地满足采访人员的查 重需要,从而提高电子图书采购工作的质量和效率。
同时,由于电子图书不同于纸本图书的特点,可根据纸本图书的流通 率大小来进行电子图书的补订查重,同一订单中的图书查重也是查重工 作的重要内容。
2图书馆电子图书采购批查重的类型
电子图书采购查重工作的质量直接影响到图书馆馆藏文献建设的 质量和电子图书购买经费的控制。图书馆电子图书采购批查重有两种需 求,一种需求是检查跟图书馆馆藏不重复的电子图书,得到非重复的书 单。另一种需求是检查跟图书馆纸本馆藏同名的电子图书,得到跟纸本 图书重复的电子图书。
2.1与馆藏图书不同名的电子图书批查重
购买跟馆藏图书不同名电子图书,有利于优化本馆文献收藏结构,增 加图书馆馆藏数量。得到和图书馆馆藏不重复的订单。图书采购查重就 是利用各种检索途径调查、了解本馆新书的预订、文献的收藏情况,以便 有的放矢地购买和增补图书,有计划、按比例地进行文献资源建设。查重 是采购图书必不可少的前期工作。没有查重工作为前提,不了解某种图 书在本馆的收藏等情况,就容易盲目购书,造成图书经费浪费,文献资源 建设无序。
2.2与流通率大的纸本图书同名电子图书批查重
在纸本图书的流通过程中,常常会出现一些借阅量特别大的热门图 书,由于纸本图书的馆藏复本数限制,这类图书远远不能满足诸多读者的 同时借阅。此时,电子图书不受复本数限制的优点就显露出来了。
图书馆一般有哪些纸本图书流通率大适合于采购相应的电子图书 呢?一是最新出版新书,读者一般都喜欢看新书,新书能够较快地被阅 读、吸收和利用,这样可以弥补图书馆由于经费匮乏而导致纸质图书采购 不足的缺陷;二是那些经典名著、畅销书、著名学者的著作等一直是具有 很高流通借阅率的图书;三是公共课教学参考书、英语等级考试图书、部 分考研参考书、计算机等级考试类图书等,由于考试的特殊性,此类图书 也供不应求。
针对以上要求的电子图书的批查重,就是将这些流通率大的图书输 出到表单,再通过对书商订单进行批查重。得到的是和图书馆提供的书 单部分重复的书单.
2.3同一订单批查重
通过数据库方法批查重可以去掉同一订单自身中重复的数据。
3电子图书采购批查重的方法
针对上文对电子图书采购批查重类型的分析,笔者提出了解决两种 类型批查重的方法。
3.1跟馆藏图书不重复的电子图书
图书馆的馆藏图书包括两种,一是电子图书,二是纸本图书。每个图 书馆查重也分两种情况:一是仅查电子图书之间不重复;二是要求电子图 书和纸本图书之间不存在重复。
3.1.1针对本馆电子图书馆藏的批查重
笔者调查过很多图书馆,这种针对电子图书的采购查重都比较简单, 一般都是把图书馆馆藏导出来让电子图书供应商去查重,这样做存在两 个问题:一是查重的准确度和过程得不到控制;二是如果同时采购几家电 子图书的时候,由于供应商之间会存在重复的图书,如果不去重的话,就 会导致重复购买。在这个情况下,根据笔者的经验,由电子图书供应商提 供电子图书目录给图书馆,让图书馆自己查重,这样做很准确,也可以避 免漏查的问题。下面详细介绍一下批查重的内容。
首先将本馆的和供应商的电子图书目录分别转换成ACCESS格式, 存储在同—个库中。在ACCESS数据库中,本馆的总电子图书目录表命 名为“图书馆”,供应商的表按查重顺序分别命名为“书商1”、“书商2”等 依次类推。
第一步,选中窗体左边“查询”,然后点击“新建”,如图l,这样创建的 查询可以在一个表中查找那些在另一个表中没有相关记录的记录(行), 我们的目的就是在“书商1”表中查找在“图书馆”表中没有相关的记录 (行),从而得到我们需要的图书馆没有的电子图书记录表。第二步,所建 查询将列出下面所选表中的记录,并且那些记录将在下一步所选的表中 没有相关记录。这里选择“书商1”。第三步,请确定在哪张表或查询包 含相关记录,这里选择“图书馆”。第四步,请确定在两张表中都有的信 息。这里选择我们作为查重的字段,比如ISBN,题名,作者,如果想做到 精确查重,三个字段都选上,如果只做简单查重,那么选ISBN就可以。第 五步,请选择查询结果中所需要的字段。这里一般把表“书商l”所有的字段都选择,因为在输出的查询中,电子图书供应商要根据这个表来为图 书馆配置图书,那么他们是需要这些字段,才能做好匹配工作的。第六 步,选中“查看结果”,点击“完成”后就得到查询的结果。第七步,将查询 结果“导出”为.dbf格式存储,命名为“书商1采购书目”。
如果只是做一个书商的查重,那么到这一步就完了,如果还要继续进 行第二家电子图书商的采购,那么首先要将我们上面采购完的表“书商1 采购书目”做为新增图书馆馆藏导入表“图书馆”合并,再重复进行上面 的操作。这样操作的话,就不会出现重复采购的问题。
3.1.2针对本馆纸本图书馆藏的批查重
由于纸本图书馆藏都是符合ISOgMARC国际标准格式,我们可以利 用免费批查重软件如LIBINQUIRE(下载地址:http://www.1ibt001.com. cn/)进行MARC数据批查重,然后输出不重复的采购订单。 第一步,利用软件提供的功能将书商提供的电子图书定单转换成 MARC格式。
很多的书商交送的书目数据都是定长格式,而且多数为Excel格式。 在这个模块里可以方便的将Excel转换成Marc文件,从而方便的进行查 重。在转换之前一定要注意将Excel文件的第二行设置成为nmrc字段, 如表1其它的字段可以分别命名为900a,900b,依次到900w,因为这个字 段在这里意义不大,主要是方便转换时候的字段保留,在输出不重复订单 时,这些字段还会被还原成原来的名字。最后把含“题名”的第一行删除。
接下来,打开软件的功能菜单,如图2,选中Excel与Marc互转,在 “Excel文件”那里,“浏览”选择需要转换的Excel表,再选择“另存”的文 件名,“开始”进行转换得到.i80的文件.
第二步,选择LIBINQUIRE功能菜单“利用书商完整Marc”,输入需 要的“查重字段”,如200a,010a,010d,215d。可以选择几个字段匹配即认 为是重复记录,这样就能完全达到筛除重复的图书。还可以选择“只选分 类”,比如我如果只买经济类和计算机类,那我就写上F,T。“输出字段” 这里就写书商提供的电子图书订单的所有字段,因为书商一般要根据这 个订单上的字段来配送电子图书。缺少一个字段,可能都配送不了电子 图书,这一点是我们应该注意的。“输出文件”选择存放查重后的订单的 位置和名字。点击“开始”,即可完成此次查重工作,得到电子图书的订购 单。
3.2与流通率大的纸本图书同名电子图书批查重
需要采购的电子图书有—个特点:它们的纸本图书流通率大,读者借阅的多,供不应求。采购电子图书可以大大缓解图书馆与读者之间供需 紧张的矛盾和节约图书馆采购经费。
首先,要从图书馆自动化管理系统中按照流通率的高低将这一部分 图书输出,图书馆可以根据本馆的财力要求,按月流通次数的多少,比如 按月流通20次为最低购买标准,或者按月流通次数排名取前多少种,比 如取流通率前100(30名的图书。将输出的流通率大的图书转换成Access 格式,取名“读者喜欢看的书”,将书商的电子图书目录也转换成Access 格式,取名“电子图书”,两个表存储在同一个库中。
然后,在Access中,“新建”一个查询,选择“设计视图”,分别选择“读 者喜欢看的书”和“电子图书”,点击“添加”,按照本馆的要求,选择拖动 “书名”、“ISBN”和“作者”分别进行连接,如图4。然后再运行,就得到一 个两个表中按照条件重复的查询,再导出为Excel表,即为读者喜欢看的 电子图书目录。当然,可能有的书商提供的目录中不包含这类流通率大 的图书,可以从其它书商提供的订单中进行匹配。
另外,如果图书馆同时从几个书商那里购买电子图书,那么书商之间 的数据很难避免重复,那么必须把重复的数据挑选出来,从订单中剔除, 这样做可以提高工作效率。在完成电子图书安装使用之后,图书馆进行 电子图书的验收,那么就要使用此方法来检验书商安装的是不是图书馆 订购的图书。即把订单和到货单进行对比,查询结果图书应该是100%匹 配,这样可以防止书商有意在书单中搭配没有采购的电子图书或少采购 电子图书。
3.3同一订单中的批查重
此外,在笔者的实际工作中,发现有的电子图书供应商为了增加可以 出售的电子图书的数量有意混淆视线,将一些记录进行个别字段如ISBN 的修改后,增加到选书的目录中提供给图书馆,或者有的书商干脆就是各 个字段重复的图书。因为是针对别的表进行批查重,而没有查自己,实际 上批查重是查不出这些重复记录的。当图书卖到你图书馆之后,负责采 购的工作人员一般也很难检查出来,当然读者在阅读的时候会检查出来, 不过很少碰到跟图书馆员反映的。所以必须在采购的时候进行去重处 理。
针对这个情况,笔者的方法就是把书商提供的目录放在一个EXCEL 表中,进行批查重,删除相同的数据。
第一步,新增加一列假设为B列,ISBN为c列,将B列标题行命名 为“重复”,然后在B3插入一个公式:=IF(c3=(22,“重复”,);第二步,这 个单元格的公式用鼠标扩展这个表的末尾,如果ISBN有重复的,就在B 列单元格式返回—个值“重复”;第三步,把这个表复制到另一个新表,右 键选择“选择性粘贴”,在弹出的对话框中选择“数值”,再将新表按B列 进行排序,将含有“重复”的项删除就得到没有重复键值的表。也可以根 据需要对题名,作者等进行去重。当然也可以使用ACCESS来实现这个 目的。
首先复制包含重复记录的表的结构,生成包含重复记录的所有字段 的主键;然后创建并运行从原始表到新表的追加查询。由于主键字段不 能包含重复记录,因此这一过程将生成不含重复记录的表。一般的,这样 的重复记录在5%以上。
4电子图书采购批查重后期工作
经过图书馆工作人员批查重完的图书目录,如果按照正常的程 序一本一本选购,效率较低,可以利用EXCEL表里的筛选来进行该 类图书的批处理工作。利用EXCEL“筛选”中的“自定义…”命令,可 以将本馆不需要的“建筑”和“电力”类别都筛选掉。可以重复使用, 多次筛选,从而达到快速选购的目的。至此,电子图书采购订单完 成.

相关文章:计算机编目查重问题研究