2024年2月19日发(作者:允嘉言)
信息检索(实验报告)
徐州工程学院
管理学院实验报告
实验课程名称 :
信息存储与检索
实验地点:
经济管理实验教学中心
2012 年 月至 2012 年 12 月
专 业 信息管理与信息系统
班 级 10信管
学生姓名 xx
学 号 2
指导老师 xxx
实验报告
1
实验项目:信息获取技术
实验学时:2
实验日期:2012-11-1
实验要求:
(1)熟悉扫描仪、智能手机、数字摄录、条形码、触摸屏、手写技术、音频处理、网络信息采集等各种常用信息获取技术的有关知识及应用技能。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
1、使用任一款扫描仪设备扫描任一书籍、报刊、票据等,并用扫描仪配备的OCR软件进行文字识别及图像编辑,最终将所选定的信息资料转化成硬盘中的电子文档。(确无设备的,可查阅相关资料,将简要的文字叙述及软件窗口粘到报告中。)
中晶扫描仪的尚书OCR7.5文字识别软件使用
①图像的输入:打开尚书OCR软件,从“文件”菜单中,我们能够看到有两种选择,就是“打开图像”和“扫描”两种方式。一般用户的图像是通过扫描得到。在扫描之前,如果用户是第一次使用,建议用户进入
2
“选择扫描仪”的项目;
识别与校对
对于简单的文稿,直接用“识别”菜单下的“开始识别”。
识别完成后,画面会进入文字校对的画面。
如果需要,用户可以在这里,做一个字一个字的校对。通过对比,修改识别结果。在校对的时候,可以看到尚书软件已经提供了此行的行图像在文字的上方,用户可以比较方便的做原图像与识别后结果的核对工作。遇到有些字,可能识别错误,软件提供了类似字型的参考字备选。
输出结果
需要用菜单上的“输出”到“指定格式文件”的功能。
默认保存的路径是:尚书软件下的OUTPUT目录。
保存TXT格式
3
2、使用数字照相机(或具有近似功能的设备,如摄像功能手机)获取本人实验用的计算机显示器上显示的任一屏幕图像,保存成JPG格式图片,粘贴到实验报告上。并用文字简要叙述你所使用设备的工作原理。(实验目的不同,请不要用计算机本身的屏幕抓图功能)
数字照相机的工作原理:
数码相机是集光学、机械、电子、电功一体化的产品。它集成了影像信息的转换、存储和传输等部件,具有数字化存取模式,与电脑交互处理和实时拍摄等特点。光线通过镜头或者镜头组进入相机,通过成像元件转化为数字信号,数字信号通过影像运算芯片储存在存储设备中。数码相机的成像元件是CCD或者COMS,该成像元件的特点是光线通过时,能根据光线的不同转化为电子信号。
佳能数码照像机
3、够读取条形码的设备有哪些?任意选取一种,并将其图片粘贴到实验报告中,并在图片下方给出设备名称信息。
4
读取条形码的设备:光笔、条码卡槽、扫描枪、激光全向扫描台、扫描仪、扫描器
条形码扫描设备:
手持式激光条码扫描器 LS2208(摩托罗拉)
4、叙述一下本人触摸屏手机(没有的可以借用同学的)的触摸屏类型(电容式、电阻式…)及其工作原理。并用图片说明。
手机信息:步步高vivio S3, Android OS 2.3系统,电容屏。
5、叙述一下本人手写板手机(没有的可以借用同学的)的手写板类型及其工作原理。并用图片说明。
手机信息:三星Galaxy Tab P1000,7.0英寸超大电容触摸屏
5
工作原理:数位电磁板和压感式电磁板的工作原理都是采用了电磁感应技术。它由手写笔发射出电磁波,由写字板上排列整齐的传感器感应到后,计算出笔的位置后报告给计算机,然后由计算机做出移动光标或其它的相应动作。压感电磁板中又加入了压力感应技术:笔尖可以随着用力的大小微微的伸缩,一个附加的传感器能感应到你在笔尖上所施加的压力,并将压力值传给计算机,计算机则在屏幕上放映出该值笔迹的粗细。
6、将本人任意一句话进行话音获取及处理,生成音频格式的文件保存在硬盘上。并用几张图片对采样、量101
化、编码等过程进行示意说明。
模拟信号的数字化过程
采样是每隔一个时间间隔在模拟声音的波形上取一个幅度值。
量化是对声波波形幅度的数字化。
编码是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于
6
纠错、同步和控制的数据。
7、选取任一种互联网信息采集软件,叙述其工作原理。
网络掘金者信息采集软件(Webminer)1.0
网络掘金者是一款用于网络信息定向采集与垂直搜索引擎建设的系统。它可以从互联网上采集任意网页上的信息,并根据设定的规则从网页中分析提取出特定信息并整理存放在你指定的数据库中。本款软件适用于任何行业、任何部门,因为每一个组织都有自己所需要的信息。你可以用《网络掘金者》从互联网上抓取一系列的网页,只要输入起始网址和要抓取的Url地址标识,并定义元数据在网页中大概存放的位置,其余的工作《网络掘金者》会帮助你自动完成。本软件立足于快速的信息采集,实时在线的信息监测,为企业网络情报信息采集决策, 网站建设, 新闻系统建设等提供快速完整的方案。
8、利用我校图书馆网站提供的“书目检索”功能,查
7
找书名中含“信息检索”的图书,点击检索结果中任一书名,注意新页面右侧“手机二维码”的相关信息。要求:用手机摄像头读取该二维码(需要的软件请自行下载,或直接利用微信、UC浏览器、QQ浏览器中的功能)。在实验报告中将该二维码图片粘贴到报告中,并把读取出的二维码信息中的书名附在图片下方。
信息检索 张德文主编
8
9
实验项目:信息存储技术实验
实验学时:2
实验日期:2012-11-8
实验要求:
(1)熟悉信息的印制存储、缩微存储、磁介质存储、激光存储、电子纸电子书、等各种信息存储技术以及计算机信息的存储结构、存储系统相关知识。掌握一定的信息存储技能。通过搜集资料了解NAS、SAN等的基本知识。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
(1)TP印刷技术的四种含义(即包含的具体四种印刷技术)? 并且请分别找到计算机直接制版机与数字打样机的任意图片各一张粘贴到实习报告中。
CTP包含四种含义:
1)Computertoplate:从计算机直接到印版,即“脱机直接制版”。最早由照相直接制版发展而来,所有采用计算机控制的激光扫描成像,然后通过显影、定影等工序印版。这一技术免去了胶片这一中间媒介,使文
10
字、图像直接转变成数字,减少了中间过程的质量损
数字打样机
(2)缩微胶片主要有哪几种?分别任选一幅缩微胶片及缩微阅读机的图片粘贴到实习报告中。
1)卷片缩微品是卷线在片盘或片盒内进行管理和使用的缩微品;
2)按胶片宽度分类
16mm卷式缩微品;35mm卷式缩微品;70mm卷式缩微品;105mm卷式缩微品。
3)按装片方式分类
4)片盘式缩微品;单轴盒式缩微品;双轴盒式缩微品;片夹式缩微品。
5)片式缩微品是指以单张胶片为单位进行管理和使用的散页式缩微品。
条片;封套片;开窗缩微卡片;缩微平片。
缩微胶片 缩微阅读机
11
(3)选择自己认为比较有学习价值的移动硬盘内部结构图及磁带机结构图粘贴到实习报告中。
移动硬盘内部结构图
磁带机结构图
(4)搜集至少10个含“RAM”并且含义与“随机存储器”相关的缩略词(如DRAM),并选择任一种的实物图片粘贴到报告中。
SRAM(Static RAM/静态存储器)和DRAM(Dynamic
RAM/动态存储器)
12
SDRAM同步动态存储器、DRAM分为很多种,常见的主要有FPRAM/FastPage、EDORAM、SDRAM、DDR RAM、RDRAM、SGRAM以及WRAM等
(5)通过网络了解“全息光存储”的相关知识。选择一幅有关“全息光存储”技术的图片粘贴到实习报告中。
全息光存储实际上还是一种光盘存储技术,采用复用技术,可大幅度地提高 存储容量和系统性能。在各种未来高密度光存储技术中,全息光存储以其所具有的高存储容量、高存储密度、高信息存储冗余度和超快存取速度等优点一直为人们所重视。
存储中的复用技术是全息光存储所特有的技术特征,采用合理的复用技术可以有效地增加系统的存储容量,提高存储系统的性能。全息光存储中的复用技术主要包括空间复用、体积复用和混合复用三大类。
全息光存储的目标是要实现超大存储容量、超高存储密度和超快存取速度的数字信息存储,然而如果不采取有效的信号处理方法来抑制其记录通道中存在的各种各样噪声,将导致读出数据的误码率上升,系统的存储容量下降。
13
(6)通过网络了解“电子纸”和“电子书”的最新技术进展。选择一幅“电子纸”的图片粘贴到实习报告中。
电子纸的最新技术进展:旋转球电子纸技术、电泳显示器 ( electrophoretic
display)/电子墨水【电泳微粒(electrophoretic particles),悬浮液、染料、CCA和稳定剂,微胶囊化,塑料晶体管】。
电子书的最新技术进展:电子书产业链应由内容原创、编辑加工、数字转换、芯片植入、平台投送、设备生产、市场销售和进出口贸易等环节构成。
(7)绘制或复制计算机硬盘的逻辑结构图到实习报告中。
14
(8)用一幅图来表示计算机存储系统的多层次存储体系。
15
实验项目:文本、多媒体信息编码压缩实验
实验学时:2
实验日期:2012-11-15
实验要求:
(1)熟悉字符编码、汉字编码的各种常用编码方案。了解霍夫曼编码方法。
(2)熟悉图书、期刊等信息源的机读目录(MARC)格式。
(3)熟悉及掌握常用的文本压缩技术、音频、视频压缩技术。
实验内容:
(1) 常见的字符编码除了7位ASCII编码,还有哪几种?
GB18030、Unicode、UTF-8
(2)常用的汉字编码除了GB2312外还有哪些?“信”、“管”两字的区位码各是多少?
GBK、GB12345-90
“信”:4837,“管”:2560
(3)选择自己比较熟悉的两种汉字输入/输出编码,分别给出“信”、“管”两字的输入编码。(例如“检”字的全拼编码是jian,五笔编码是swgi)。
“信管”:
全拼编码:xin guan 五笔编码:wy tpn
16
(4)自举任意一个霍夫曼(Huffman)编码的小例子,
106 __ |a r
200 1_ |a 信息检索与利用 |A Xin Xi Jian Suo Yu Li
Yong |f 编著曹丽娟, 白首晏
(6)从以下四种文本信息压缩技术中任选两种技术并各举一例来说明:
①空格压缩技术
②位图压缩技术
③游程编码技术
④前端/后端压缩编码技术
空格压缩技术:空格压缩是将一串空格用一个压缩码代替,压缩码后面的数值代表空格的个数。
游程编码技术:游程编码又称“运行长度编码”或“行程编码”,是一种统计编码,该编码属于无损压缩编码。对于二值图有效。
行程编码的基本原理:用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”),使符号长度少于原始数据的长度。
例如:5555557777733322221111111
行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7)。可见,行程编码的位数远远少于原始字符串的位数。
在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些
17
连续符号,可大幅度减少数据量。
(8)列举出至少三种音频信息的压缩技术。
时域压缩或称为波形编码技术、子带压缩技术、变换压缩技术
(9)比较WinRAR与WinZip最新版本的优劣势(不写在报告上)。总结提高WinRAR压缩率的一些技巧。
1、选中并右击要压缩的文件,选择“添加到压缩文件”,在“常规”标志符下选择“创建固实压缩文件”(选择“锁定压缩文件”可使其不能修改其压缩的内容),并在“压缩方式”下选择“最好”。 2、点击“高级”标签下的“压缩”按钮,这时会打开“高级压缩参数”窗口。进行如下操作: (1)一般程序或文档 将“文本压缩”下的“预测顺序”设置为“30”,“内存使用”,“MB”设置为“30”,这两项值越高,压缩率越高。 (2)未压缩过的音频文件 比如WAV文件,将“音频压缩”下的“声道”设置为“4”(0为自动)。
(3)未压缩过的图片文件 比如BMP、TIF等,可将“真彩压缩”下设置为“强制”。有可能会压缩得比JPG文件还小。 3、从“常规压缩”下的“字典大小KB”下拉菜单中选择“4096”项(如果内存高于64MB的话)。最后点击“确定”开始压缩。 4、将一个任意较小的文本文件,与压缩后的压缩包重新压缩,具体方法请参照1~3步,只是在设置“字典大小KB”时,选择“2048”即可。 (提示:如果是JPG、
18
MP3、EXE等已经压缩过的文件,上述方法就不会提
19
实验项目:文本、多媒体、Web信息检索技术实验
实验学时:2
实验日期:2012-11-22
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC元数据等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相关文献或数据信息。熟练使用中外文著名搜索引擎检索Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
(1)访问“中国期刊全文数据库”,利用其“高级检索”功能,试检索2007年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“信息存储与检索”的文章有多少篇,要求匹配方式为“精确”。请将屏幕中自检索项设置界面向下至检索结果的前两条记录这部分内容截图粘贴到实验报告中。
(2)任意选择(1)中的一条记录打开阅读全文,复
20
制全文中的任意连续语句(不少于100汉字)到实验报告中,并注明该篇文章的篇名、刊名、年(卷)期、
(3)利用“维普中文科技期刊全文数据库”的“高级检索”功能,在页面下半部分采用“直接输入检索式”方式,试检索2006年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“实验”的文章有多少篇。要求将检索结果界面中自“检索结果 **篇;您的检索式…”至第一条结果相关信息这部分内容截图粘贴到实验报告中。
(4)访问“中文社会科学引文索引(CSSCI)”数据库,点“包库用户入口”进入。1998――2012年全部选中,点击“被引文献”进入被引文献检索界面。在“被引文献期刊”后输入“徐州工程学院学报”,“排除自引”复选框选中,点击“检索”。试查找1998――2012年《徐州工程学院学报》中文献被其它期刊文献引用的有几篇?选择所有,显示,选择任意一对“被引文献”与“来源文献”,将两者的篇名、作者、刊载期刊名、卷期号、起讫页码等信息粘贴到实验报告中。
29篇
被引文献:
21
李军.
试论电视广告的语言美.徐州工程学院学报.2005,(2)
22
实验项目:文本、多媒体、Web信息检索技术实验
实验学时:2
实验日期:2012-11-29
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC元数据等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相关文献或数据信息。熟练使用中外文著名搜索引擎检索Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
(1)使用谷歌()检索“信息管理与信息系统”相关的信息,要求将“信息管理与信息系统”作为固定词组进行完全匹配,并且搜索到的结果均为PDF文件格式,并且限定在.edu类型网站中检索。请将标准搜索界面(默认首页)中输入的检索式通过截图粘贴到实验报告中。
(2)使用谷歌,从本地或网络上任选一幅有水印或尺
23
(3)使用百度识图()完成“(6)”中任务(要求用与“(6)”中相同的图片进行检索,若检索结果为零也须将实际情况写在报告中)。
百度图片:
(4)列举出反向图片搜索引擎Tineye()在日常工作生活中的至少三种用途写在实验报告中。试用Tineye完成类似“(6)”中的任务(不写在报告中)。
TinEye是一个利用已有图片搜索与此类似图片的反向图片搜索引擎。Tineye是一个用图片搜索图片的技术。它的功能就是允许你通过某张图片的一部分或者全部来搜索这张图片的完整版或者高清版等相似图片。
日常功能:
24
1)你拿到一张图片但是分辨率很低,那么你可以使
实验项目:信息检索系统设计实验
实验学时:2
实验日期:2012-12-6
实验要求:
通过设计与开发一个微型的检索系统,能够做到对信息检索系统的物理构成与逻辑构成、检索系统提供的检索功能、使用的检索技术等有更加充分的认识和深刻的体验。为学生今后毕业设计及工作后进行信息管理系统的开发打下良好基础。
实验内容:
自行设计实验方案,任选熟悉的编程语言及数据库管理系统,进行微型检索系统的设计与开发。
见电子稿
25
实验项目:信息检索系统应用实验
本人所属Pathfinder团队共4名成员:06何青、09李岩岩、13杨丽萍、15余秀
实验学时:4
实验日期:2012-12-13,2012-12-20
实验要求:
(1)本实验属于综合性实验。要求同学们自由组合成小组,每组3-5人(也可以适当放宽,但不超过8人)。每组同学以团队形式共同完成一个Pathfinder综合练习:结合自己的专业兴趣,自行选择与信息管理或信息系统相关的内容作为一个专题,充分利用我校图书馆提供的各类信息检索系统及因特网资源,检索出与所选专题紧密相关的信息。通过完成本实验项目,使学生充分掌握并巩固课程中相关几章中关于信息资源分布、联机检索系统、数字图书馆、因特网检索等多个重要知识点和技能要点,使学生能够对之前所学的知识融会贯通,锻炼和提高自己的信息检索能力。
(2)为方便同学实验,信息资源的范围以各类电子资源为主,如能在检索报告中加入使用纸本文献资源进行检索的内容则更好。报告中可以有文本、截图、超链接等多种格式,涵盖的检索系统(此处因特网也可算作一种检索系统)至少3种,其中至少1种为英文。
26
(3)检索报告一般须包含的内容:①简介:是给教师
信管专业综合性人才如何彰显社会价值
目录
一、前言
1.1编制目的
1.2适用范围
1.3收录范围
1.4主题
二、“引路者”
1.1引言
1.2适用对象
1.3使用的信息检索数据库
三、简介
1.1摘要
1.2关键词
1.3材料收集范围
四、正文详解
1.1信管专业与社会的“碰撞”
1.2信管专业的知识结构
1.3信管专业突出能力
1.4创新能力
1.5总结
五、检索策略及检索式
六、检索体会
27
一、前言
1.1编制目的
信息管理与信息系统专业是一个综合性较强的学科,它的产生是社会的必然。在人类迈入信息社会的过程中,信息管理专业人才将是最急需的专门人才之一。世界经济的全球化网络化信息化以及现代科学技术的逐步发展,信息技术革命与信息化建设已经成为推动现代经济发展的源动力,这就促进了对计算机技术信息管理等信息类人才的大量需求知识经济信息网络和经济全球化的发展给我国高校信息管理教育提出了迫切的要求,如何培养信息管理与信息系统专业创新人才,如何提高学生的创新能力成为我们亟需解决的问题。
通过这次编制,能让读者认识信息管理与信息系统专业重要性的同时,进一步了解为适应社会的信息化的发展和企业的需要,信息管理与信息系统专业学生该把自己培养成具有创新综合性人才才能满足社会和企业的需要,使实现自己的价值。
1.2适用范围
本次编制的报告主要面向在校学生、教师、职工以及能够自由上网查询信息的普通大众。
1.3收录范围
《信息管理与信息系统专业本科生创新能力培养
28
模式研究》邱均平 瞿辉 2011年第3期/总第141
2.维普中文科技期刊全文数据库
3.万方数据资源
29
三、简介
1.1摘要
随着计算机信息科学不断发展、信息社会逐渐成熟,信息管理与信息系统专业受到了极大挑战:课程设置宽泛多样,但学生实践与创新能力不足。本文结合信管专业现状、知识结构及特征分析阐述了为适应社会的信息化的发展和企业的需要,信息管理与信息系统专业学生如何把自己培养成综合性人才并为自己在社会上定位以彰显自身价值。
1.2关键词
信息管理与信息系统;创新能力;综合性人才;社会价值
1.3材料收集范围
1.百度文库
2.徐州工程学院图书馆
四、正文详解
1.1信管专业与社会的“碰撞”
(一)信管专业面临的挑战
30
1998—2011年,恰逢我国信息社会逐渐成型并走
(一)知识结构
信管专业课程设置随着该专业归属学院不同而存在差异。通过对我国北京大学、清华大学、武汉大学、东北大学、哈尔滨工业大学、四川大学、中国石油大学、西南石油大学等30所高校进行调研,发现信管专业有3个发展方向。第一,归属于经济管理学院。此类信管专业经济管理类课程开设较多,毕业生在经济管理能力上偏强。第二,归属于信管学院(系)。此类图书情报专业衍变而来,课程设置偏向于信息管理、信息组织、数字图书馆等方面的内容,毕业生在信息组织及相关技术能力上偏强。第三,归属于计算机科学学院。此类信管专业计算机技术课程开设较多,学生系统开发能力偏强。
总的看来,信管专业知识结构主要有:
1.基础课
通识教育:思想教育、人文社科、外语、军事、计算机、体育
2.专业基础课
经济管理基础、信息管理基础和计算机信息技术基础
3.专业方向课
经济管理基础包括企业资源计划、供应链与电子商务、竞争情报及商业决策、信息系统分析设计、ERP
31
原理与应用、企业信息化建设、网络经济;
(三)积极参与专业基本功大赛和学科类竞赛
信息管理与信息系统专业要多举办一些专业基本功大赛,比如网页设计大赛及一些需要使用计算机和各类软件实际操作的比赛,在比赛中实际去运用软件和设计一些东西,让同学们借此机会实实在在的做出一些东西来,网站或是小型的系统,不仅让学习扎实的同学有一个检验实力的地方,也让不太了解制作网站或者系统的同学有机会熟悉并运用起来,真实的做出一个网站或是系统,并且让它可以运行起来展示在大家面前,也让同学们提起对专业知识学习的兴趣和对技术钻研的动力。在参赛的过程中遇到的一些技术性的问题,整个过程中,参赛的同学们都会学到不少关于专业方面的知识,更会培养出整个专业班级良好的学习氛围和风气,促进整体水平的提高。
(四)注重实践
都说读万卷书不如行万里路。不管是管理,还是计算机技术,都需要在实践中学习和提升,在实践中领悟其中的真实原理;没有实践,只是学习书本理论知识并不能让信息管理与信息系统专业学子学到十分扎实的知识,在实践中培养学生们的团队合作意识,竞争激励意识和与人沟通交流的能力,以及组织策划才能;全面培养学生的综合能力。实践可以有以下方式。
32
1.第二课堂实践。大学里除了跟随老师学习课本
33
34
实验总结
通过对信息检索的学习,不仅让我真正懂得了信息检索的深刻涵义,更了解到怎样选择正确的检索词来构成检索策略进行检索。通过使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选的精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。
我也了解了很多的中文检索工具,如中国知网、万方数据资源系统、维普中文科技期刊全文数据库等,通过使用这些数据库,检索式的使用,可以很方便的搜索出自己需要的文献,这在以后的生活中,我能通过信息检索查到我想要的资料,这门课程真的让我受益匪浅。
35
2024年2月19日发(作者:允嘉言)
信息检索(实验报告)
徐州工程学院
管理学院实验报告
实验课程名称 :
信息存储与检索
实验地点:
经济管理实验教学中心
2012 年 月至 2012 年 12 月
专 业 信息管理与信息系统
班 级 10信管
学生姓名 xx
学 号 2
指导老师 xxx
实验报告
1
实验项目:信息获取技术
实验学时:2
实验日期:2012-11-1
实验要求:
(1)熟悉扫描仪、智能手机、数字摄录、条形码、触摸屏、手写技术、音频处理、网络信息采集等各种常用信息获取技术的有关知识及应用技能。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
1、使用任一款扫描仪设备扫描任一书籍、报刊、票据等,并用扫描仪配备的OCR软件进行文字识别及图像编辑,最终将所选定的信息资料转化成硬盘中的电子文档。(确无设备的,可查阅相关资料,将简要的文字叙述及软件窗口粘到报告中。)
中晶扫描仪的尚书OCR7.5文字识别软件使用
①图像的输入:打开尚书OCR软件,从“文件”菜单中,我们能够看到有两种选择,就是“打开图像”和“扫描”两种方式。一般用户的图像是通过扫描得到。在扫描之前,如果用户是第一次使用,建议用户进入
2
“选择扫描仪”的项目;
识别与校对
对于简单的文稿,直接用“识别”菜单下的“开始识别”。
识别完成后,画面会进入文字校对的画面。
如果需要,用户可以在这里,做一个字一个字的校对。通过对比,修改识别结果。在校对的时候,可以看到尚书软件已经提供了此行的行图像在文字的上方,用户可以比较方便的做原图像与识别后结果的核对工作。遇到有些字,可能识别错误,软件提供了类似字型的参考字备选。
输出结果
需要用菜单上的“输出”到“指定格式文件”的功能。
默认保存的路径是:尚书软件下的OUTPUT目录。
保存TXT格式
3
2、使用数字照相机(或具有近似功能的设备,如摄像功能手机)获取本人实验用的计算机显示器上显示的任一屏幕图像,保存成JPG格式图片,粘贴到实验报告上。并用文字简要叙述你所使用设备的工作原理。(实验目的不同,请不要用计算机本身的屏幕抓图功能)
数字照相机的工作原理:
数码相机是集光学、机械、电子、电功一体化的产品。它集成了影像信息的转换、存储和传输等部件,具有数字化存取模式,与电脑交互处理和实时拍摄等特点。光线通过镜头或者镜头组进入相机,通过成像元件转化为数字信号,数字信号通过影像运算芯片储存在存储设备中。数码相机的成像元件是CCD或者COMS,该成像元件的特点是光线通过时,能根据光线的不同转化为电子信号。
佳能数码照像机
3、够读取条形码的设备有哪些?任意选取一种,并将其图片粘贴到实验报告中,并在图片下方给出设备名称信息。
4
读取条形码的设备:光笔、条码卡槽、扫描枪、激光全向扫描台、扫描仪、扫描器
条形码扫描设备:
手持式激光条码扫描器 LS2208(摩托罗拉)
4、叙述一下本人触摸屏手机(没有的可以借用同学的)的触摸屏类型(电容式、电阻式…)及其工作原理。并用图片说明。
手机信息:步步高vivio S3, Android OS 2.3系统,电容屏。
5、叙述一下本人手写板手机(没有的可以借用同学的)的手写板类型及其工作原理。并用图片说明。
手机信息:三星Galaxy Tab P1000,7.0英寸超大电容触摸屏
5
工作原理:数位电磁板和压感式电磁板的工作原理都是采用了电磁感应技术。它由手写笔发射出电磁波,由写字板上排列整齐的传感器感应到后,计算出笔的位置后报告给计算机,然后由计算机做出移动光标或其它的相应动作。压感电磁板中又加入了压力感应技术:笔尖可以随着用力的大小微微的伸缩,一个附加的传感器能感应到你在笔尖上所施加的压力,并将压力值传给计算机,计算机则在屏幕上放映出该值笔迹的粗细。
6、将本人任意一句话进行话音获取及处理,生成音频格式的文件保存在硬盘上。并用几张图片对采样、量101
化、编码等过程进行示意说明。
模拟信号的数字化过程
采样是每隔一个时间间隔在模拟声音的波形上取一个幅度值。
量化是对声波波形幅度的数字化。
编码是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于
6
纠错、同步和控制的数据。
7、选取任一种互联网信息采集软件,叙述其工作原理。
网络掘金者信息采集软件(Webminer)1.0
网络掘金者是一款用于网络信息定向采集与垂直搜索引擎建设的系统。它可以从互联网上采集任意网页上的信息,并根据设定的规则从网页中分析提取出特定信息并整理存放在你指定的数据库中。本款软件适用于任何行业、任何部门,因为每一个组织都有自己所需要的信息。你可以用《网络掘金者》从互联网上抓取一系列的网页,只要输入起始网址和要抓取的Url地址标识,并定义元数据在网页中大概存放的位置,其余的工作《网络掘金者》会帮助你自动完成。本软件立足于快速的信息采集,实时在线的信息监测,为企业网络情报信息采集决策, 网站建设, 新闻系统建设等提供快速完整的方案。
8、利用我校图书馆网站提供的“书目检索”功能,查
7
找书名中含“信息检索”的图书,点击检索结果中任一书名,注意新页面右侧“手机二维码”的相关信息。要求:用手机摄像头读取该二维码(需要的软件请自行下载,或直接利用微信、UC浏览器、QQ浏览器中的功能)。在实验报告中将该二维码图片粘贴到报告中,并把读取出的二维码信息中的书名附在图片下方。
信息检索 张德文主编
8
9
实验项目:信息存储技术实验
实验学时:2
实验日期:2012-11-8
实验要求:
(1)熟悉信息的印制存储、缩微存储、磁介质存储、激光存储、电子纸电子书、等各种信息存储技术以及计算机信息的存储结构、存储系统相关知识。掌握一定的信息存储技能。通过搜集资料了解NAS、SAN等的基本知识。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
(1)TP印刷技术的四种含义(即包含的具体四种印刷技术)? 并且请分别找到计算机直接制版机与数字打样机的任意图片各一张粘贴到实习报告中。
CTP包含四种含义:
1)Computertoplate:从计算机直接到印版,即“脱机直接制版”。最早由照相直接制版发展而来,所有采用计算机控制的激光扫描成像,然后通过显影、定影等工序印版。这一技术免去了胶片这一中间媒介,使文
10
字、图像直接转变成数字,减少了中间过程的质量损
数字打样机
(2)缩微胶片主要有哪几种?分别任选一幅缩微胶片及缩微阅读机的图片粘贴到实习报告中。
1)卷片缩微品是卷线在片盘或片盒内进行管理和使用的缩微品;
2)按胶片宽度分类
16mm卷式缩微品;35mm卷式缩微品;70mm卷式缩微品;105mm卷式缩微品。
3)按装片方式分类
4)片盘式缩微品;单轴盒式缩微品;双轴盒式缩微品;片夹式缩微品。
5)片式缩微品是指以单张胶片为单位进行管理和使用的散页式缩微品。
条片;封套片;开窗缩微卡片;缩微平片。
缩微胶片 缩微阅读机
11
(3)选择自己认为比较有学习价值的移动硬盘内部结构图及磁带机结构图粘贴到实习报告中。
移动硬盘内部结构图
磁带机结构图
(4)搜集至少10个含“RAM”并且含义与“随机存储器”相关的缩略词(如DRAM),并选择任一种的实物图片粘贴到报告中。
SRAM(Static RAM/静态存储器)和DRAM(Dynamic
RAM/动态存储器)
12
SDRAM同步动态存储器、DRAM分为很多种,常见的主要有FPRAM/FastPage、EDORAM、SDRAM、DDR RAM、RDRAM、SGRAM以及WRAM等
(5)通过网络了解“全息光存储”的相关知识。选择一幅有关“全息光存储”技术的图片粘贴到实习报告中。
全息光存储实际上还是一种光盘存储技术,采用复用技术,可大幅度地提高 存储容量和系统性能。在各种未来高密度光存储技术中,全息光存储以其所具有的高存储容量、高存储密度、高信息存储冗余度和超快存取速度等优点一直为人们所重视。
存储中的复用技术是全息光存储所特有的技术特征,采用合理的复用技术可以有效地增加系统的存储容量,提高存储系统的性能。全息光存储中的复用技术主要包括空间复用、体积复用和混合复用三大类。
全息光存储的目标是要实现超大存储容量、超高存储密度和超快存取速度的数字信息存储,然而如果不采取有效的信号处理方法来抑制其记录通道中存在的各种各样噪声,将导致读出数据的误码率上升,系统的存储容量下降。
13
(6)通过网络了解“电子纸”和“电子书”的最新技术进展。选择一幅“电子纸”的图片粘贴到实习报告中。
电子纸的最新技术进展:旋转球电子纸技术、电泳显示器 ( electrophoretic
display)/电子墨水【电泳微粒(electrophoretic particles),悬浮液、染料、CCA和稳定剂,微胶囊化,塑料晶体管】。
电子书的最新技术进展:电子书产业链应由内容原创、编辑加工、数字转换、芯片植入、平台投送、设备生产、市场销售和进出口贸易等环节构成。
(7)绘制或复制计算机硬盘的逻辑结构图到实习报告中。
14
(8)用一幅图来表示计算机存储系统的多层次存储体系。
15
实验项目:文本、多媒体信息编码压缩实验
实验学时:2
实验日期:2012-11-15
实验要求:
(1)熟悉字符编码、汉字编码的各种常用编码方案。了解霍夫曼编码方法。
(2)熟悉图书、期刊等信息源的机读目录(MARC)格式。
(3)熟悉及掌握常用的文本压缩技术、音频、视频压缩技术。
实验内容:
(1) 常见的字符编码除了7位ASCII编码,还有哪几种?
GB18030、Unicode、UTF-8
(2)常用的汉字编码除了GB2312外还有哪些?“信”、“管”两字的区位码各是多少?
GBK、GB12345-90
“信”:4837,“管”:2560
(3)选择自己比较熟悉的两种汉字输入/输出编码,分别给出“信”、“管”两字的输入编码。(例如“检”字的全拼编码是jian,五笔编码是swgi)。
“信管”:
全拼编码:xin guan 五笔编码:wy tpn
16
(4)自举任意一个霍夫曼(Huffman)编码的小例子,
106 __ |a r
200 1_ |a 信息检索与利用 |A Xin Xi Jian Suo Yu Li
Yong |f 编著曹丽娟, 白首晏
(6)从以下四种文本信息压缩技术中任选两种技术并各举一例来说明:
①空格压缩技术
②位图压缩技术
③游程编码技术
④前端/后端压缩编码技术
空格压缩技术:空格压缩是将一串空格用一个压缩码代替,压缩码后面的数值代表空格的个数。
游程编码技术:游程编码又称“运行长度编码”或“行程编码”,是一种统计编码,该编码属于无损压缩编码。对于二值图有效。
行程编码的基本原理:用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”),使符号长度少于原始数据的长度。
例如:5555557777733322221111111
行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7)。可见,行程编码的位数远远少于原始字符串的位数。
在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些
17
连续符号,可大幅度减少数据量。
(8)列举出至少三种音频信息的压缩技术。
时域压缩或称为波形编码技术、子带压缩技术、变换压缩技术
(9)比较WinRAR与WinZip最新版本的优劣势(不写在报告上)。总结提高WinRAR压缩率的一些技巧。
1、选中并右击要压缩的文件,选择“添加到压缩文件”,在“常规”标志符下选择“创建固实压缩文件”(选择“锁定压缩文件”可使其不能修改其压缩的内容),并在“压缩方式”下选择“最好”。 2、点击“高级”标签下的“压缩”按钮,这时会打开“高级压缩参数”窗口。进行如下操作: (1)一般程序或文档 将“文本压缩”下的“预测顺序”设置为“30”,“内存使用”,“MB”设置为“30”,这两项值越高,压缩率越高。 (2)未压缩过的音频文件 比如WAV文件,将“音频压缩”下的“声道”设置为“4”(0为自动)。
(3)未压缩过的图片文件 比如BMP、TIF等,可将“真彩压缩”下设置为“强制”。有可能会压缩得比JPG文件还小。 3、从“常规压缩”下的“字典大小KB”下拉菜单中选择“4096”项(如果内存高于64MB的话)。最后点击“确定”开始压缩。 4、将一个任意较小的文本文件,与压缩后的压缩包重新压缩,具体方法请参照1~3步,只是在设置“字典大小KB”时,选择“2048”即可。 (提示:如果是JPG、
18
MP3、EXE等已经压缩过的文件,上述方法就不会提
19
实验项目:文本、多媒体、Web信息检索技术实验
实验学时:2
实验日期:2012-11-22
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC元数据等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相关文献或数据信息。熟练使用中外文著名搜索引擎检索Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
(1)访问“中国期刊全文数据库”,利用其“高级检索”功能,试检索2007年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“信息存储与检索”的文章有多少篇,要求匹配方式为“精确”。请将屏幕中自检索项设置界面向下至检索结果的前两条记录这部分内容截图粘贴到实验报告中。
(2)任意选择(1)中的一条记录打开阅读全文,复
20
制全文中的任意连续语句(不少于100汉字)到实验报告中,并注明该篇文章的篇名、刊名、年(卷)期、
(3)利用“维普中文科技期刊全文数据库”的“高级检索”功能,在页面下半部分采用“直接输入检索式”方式,试检索2006年以来,篇名中含“信息管理与信息系统”或者“信管”,并且全文中含“实验”的文章有多少篇。要求将检索结果界面中自“检索结果 **篇;您的检索式…”至第一条结果相关信息这部分内容截图粘贴到实验报告中。
(4)访问“中文社会科学引文索引(CSSCI)”数据库,点“包库用户入口”进入。1998――2012年全部选中,点击“被引文献”进入被引文献检索界面。在“被引文献期刊”后输入“徐州工程学院学报”,“排除自引”复选框选中,点击“检索”。试查找1998――2012年《徐州工程学院学报》中文献被其它期刊文献引用的有几篇?选择所有,显示,选择任意一对“被引文献”与“来源文献”,将两者的篇名、作者、刊载期刊名、卷期号、起讫页码等信息粘贴到实验报告中。
29篇
被引文献:
21
李军.
试论电视广告的语言美.徐州工程学院学报.2005,(2)
22
实验项目:文本、多媒体、Web信息检索技术实验
实验学时:2
实验日期:2012-11-29
实验要求:
(1)熟悉并巩固布尔、加权、截词、限定性、多媒体、标记语言、DC元数据等相关知识。
(2)能够利用相关知识和技能,访问我校的各类数字资源库,按需求检索出相关文献或数据信息。熟练使用中外文著名搜索引擎检索Web信息。
(3)初步应用并掌握图像、音频等多媒体信息的检索技术。
实验内容:
(1)使用谷歌()检索“信息管理与信息系统”相关的信息,要求将“信息管理与信息系统”作为固定词组进行完全匹配,并且搜索到的结果均为PDF文件格式,并且限定在.edu类型网站中检索。请将标准搜索界面(默认首页)中输入的检索式通过截图粘贴到实验报告中。
(2)使用谷歌,从本地或网络上任选一幅有水印或尺
23
(3)使用百度识图()完成“(6)”中任务(要求用与“(6)”中相同的图片进行检索,若检索结果为零也须将实际情况写在报告中)。
百度图片:
(4)列举出反向图片搜索引擎Tineye()在日常工作生活中的至少三种用途写在实验报告中。试用Tineye完成类似“(6)”中的任务(不写在报告中)。
TinEye是一个利用已有图片搜索与此类似图片的反向图片搜索引擎。Tineye是一个用图片搜索图片的技术。它的功能就是允许你通过某张图片的一部分或者全部来搜索这张图片的完整版或者高清版等相似图片。
日常功能:
24
1)你拿到一张图片但是分辨率很低,那么你可以使
实验项目:信息检索系统设计实验
实验学时:2
实验日期:2012-12-6
实验要求:
通过设计与开发一个微型的检索系统,能够做到对信息检索系统的物理构成与逻辑构成、检索系统提供的检索功能、使用的检索技术等有更加充分的认识和深刻的体验。为学生今后毕业设计及工作后进行信息管理系统的开发打下良好基础。
实验内容:
自行设计实验方案,任选熟悉的编程语言及数据库管理系统,进行微型检索系统的设计与开发。
见电子稿
25
实验项目:信息检索系统应用实验
本人所属Pathfinder团队共4名成员:06何青、09李岩岩、13杨丽萍、15余秀
实验学时:4
实验日期:2012-12-13,2012-12-20
实验要求:
(1)本实验属于综合性实验。要求同学们自由组合成小组,每组3-5人(也可以适当放宽,但不超过8人)。每组同学以团队形式共同完成一个Pathfinder综合练习:结合自己的专业兴趣,自行选择与信息管理或信息系统相关的内容作为一个专题,充分利用我校图书馆提供的各类信息检索系统及因特网资源,检索出与所选专题紧密相关的信息。通过完成本实验项目,使学生充分掌握并巩固课程中相关几章中关于信息资源分布、联机检索系统、数字图书馆、因特网检索等多个重要知识点和技能要点,使学生能够对之前所学的知识融会贯通,锻炼和提高自己的信息检索能力。
(2)为方便同学实验,信息资源的范围以各类电子资源为主,如能在检索报告中加入使用纸本文献资源进行检索的内容则更好。报告中可以有文本、截图、超链接等多种格式,涵盖的检索系统(此处因特网也可算作一种检索系统)至少3种,其中至少1种为英文。
26
(3)检索报告一般须包含的内容:①简介:是给教师
信管专业综合性人才如何彰显社会价值
目录
一、前言
1.1编制目的
1.2适用范围
1.3收录范围
1.4主题
二、“引路者”
1.1引言
1.2适用对象
1.3使用的信息检索数据库
三、简介
1.1摘要
1.2关键词
1.3材料收集范围
四、正文详解
1.1信管专业与社会的“碰撞”
1.2信管专业的知识结构
1.3信管专业突出能力
1.4创新能力
1.5总结
五、检索策略及检索式
六、检索体会
27
一、前言
1.1编制目的
信息管理与信息系统专业是一个综合性较强的学科,它的产生是社会的必然。在人类迈入信息社会的过程中,信息管理专业人才将是最急需的专门人才之一。世界经济的全球化网络化信息化以及现代科学技术的逐步发展,信息技术革命与信息化建设已经成为推动现代经济发展的源动力,这就促进了对计算机技术信息管理等信息类人才的大量需求知识经济信息网络和经济全球化的发展给我国高校信息管理教育提出了迫切的要求,如何培养信息管理与信息系统专业创新人才,如何提高学生的创新能力成为我们亟需解决的问题。
通过这次编制,能让读者认识信息管理与信息系统专业重要性的同时,进一步了解为适应社会的信息化的发展和企业的需要,信息管理与信息系统专业学生该把自己培养成具有创新综合性人才才能满足社会和企业的需要,使实现自己的价值。
1.2适用范围
本次编制的报告主要面向在校学生、教师、职工以及能够自由上网查询信息的普通大众。
1.3收录范围
《信息管理与信息系统专业本科生创新能力培养
28
模式研究》邱均平 瞿辉 2011年第3期/总第141
2.维普中文科技期刊全文数据库
3.万方数据资源
29
三、简介
1.1摘要
随着计算机信息科学不断发展、信息社会逐渐成熟,信息管理与信息系统专业受到了极大挑战:课程设置宽泛多样,但学生实践与创新能力不足。本文结合信管专业现状、知识结构及特征分析阐述了为适应社会的信息化的发展和企业的需要,信息管理与信息系统专业学生如何把自己培养成综合性人才并为自己在社会上定位以彰显自身价值。
1.2关键词
信息管理与信息系统;创新能力;综合性人才;社会价值
1.3材料收集范围
1.百度文库
2.徐州工程学院图书馆
四、正文详解
1.1信管专业与社会的“碰撞”
(一)信管专业面临的挑战
30
1998—2011年,恰逢我国信息社会逐渐成型并走
(一)知识结构
信管专业课程设置随着该专业归属学院不同而存在差异。通过对我国北京大学、清华大学、武汉大学、东北大学、哈尔滨工业大学、四川大学、中国石油大学、西南石油大学等30所高校进行调研,发现信管专业有3个发展方向。第一,归属于经济管理学院。此类信管专业经济管理类课程开设较多,毕业生在经济管理能力上偏强。第二,归属于信管学院(系)。此类图书情报专业衍变而来,课程设置偏向于信息管理、信息组织、数字图书馆等方面的内容,毕业生在信息组织及相关技术能力上偏强。第三,归属于计算机科学学院。此类信管专业计算机技术课程开设较多,学生系统开发能力偏强。
总的看来,信管专业知识结构主要有:
1.基础课
通识教育:思想教育、人文社科、外语、军事、计算机、体育
2.专业基础课
经济管理基础、信息管理基础和计算机信息技术基础
3.专业方向课
经济管理基础包括企业资源计划、供应链与电子商务、竞争情报及商业决策、信息系统分析设计、ERP
31
原理与应用、企业信息化建设、网络经济;
(三)积极参与专业基本功大赛和学科类竞赛
信息管理与信息系统专业要多举办一些专业基本功大赛,比如网页设计大赛及一些需要使用计算机和各类软件实际操作的比赛,在比赛中实际去运用软件和设计一些东西,让同学们借此机会实实在在的做出一些东西来,网站或是小型的系统,不仅让学习扎实的同学有一个检验实力的地方,也让不太了解制作网站或者系统的同学有机会熟悉并运用起来,真实的做出一个网站或是系统,并且让它可以运行起来展示在大家面前,也让同学们提起对专业知识学习的兴趣和对技术钻研的动力。在参赛的过程中遇到的一些技术性的问题,整个过程中,参赛的同学们都会学到不少关于专业方面的知识,更会培养出整个专业班级良好的学习氛围和风气,促进整体水平的提高。
(四)注重实践
都说读万卷书不如行万里路。不管是管理,还是计算机技术,都需要在实践中学习和提升,在实践中领悟其中的真实原理;没有实践,只是学习书本理论知识并不能让信息管理与信息系统专业学子学到十分扎实的知识,在实践中培养学生们的团队合作意识,竞争激励意识和与人沟通交流的能力,以及组织策划才能;全面培养学生的综合能力。实践可以有以下方式。
32
1.第二课堂实践。大学里除了跟随老师学习课本
33
34
实验总结
通过对信息检索的学习,不仅让我真正懂得了信息检索的深刻涵义,更了解到怎样选择正确的检索词来构成检索策略进行检索。通过使用多个检索词构成检索策略,以满足由多概念组配而成的较为复杂课题的要求。对于文献信息检索的方法,最重要的是关键词的选择,即检索词和检索策略的选择。检索词选的精确,不仅可以节省时间,提高检索速度,而且可以大大提高检索结果的质量,更容易找到自己所需数据或文献资料。
我也了解了很多的中文检索工具,如中国知网、万方数据资源系统、维普中文科技期刊全文数据库等,通过使用这些数据库,检索式的使用,可以很方便的搜索出自己需要的文献,这在以后的生活中,我能通过信息检索查到我想要的资料,这门课程真的让我受益匪浅。
35