最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

用数码相机将纸质书转换成电子文档的实用方法

IT圈 admin 66浏览 0评论

2024年8月16日发(作者:家梦山)

2011车2月 电 脑 学 习 第1期 

用数码相机将纸质书转换成电子文档的实用方法 

万贤珍’ 王俊 

摘 要:本文介绍了如何简便且较好地使用数码相机将纸质书的文字内容拍摄下来的实用方法.接着简要描述了使用软件汉王 

OCR6.0将拍摄的数码照片中的文字内容识别出来并存为电子文档的主要过程。 

关键词:数码相机:纸质书:电子文档 

中图分类号:G202 文献标识码:B 文章编号:1002—2422(2011)01-0062-02 

The Practieal Method of Turning the Book into Electronic Document 

Wan Xianzhen Wang Jun 

Abstract:The paper illustrates how to Shoot the written content on paper you need rapidly and pedectly with a digital cBIl 

r'a.Subsequently the’article introduces the main procedure to recognize these characters accurately by using the s0f- 

tware HANWANG ORC6.0.After conserve them,you get the electonirc document. 

Key words:Digital Camera;Written Words Oil Paper;,Electronic Document 

近期接到一个任务,要把一本书的文字内容录入成 

Word文档预备他用,全书95页,少说也有3万5千字,且 

实用的方法。 

使用数码相机拍摄纸质书时,为保证拍摄的图像能被 

大部分为英文,对于录入速度不快的人来说,单靠键盘完成 

将会耗费很长的时间。要想快速完成此项工作,通常会想到 

使用扫描仪,将每~页扫描下来,后利用转换软件将扫描图 

像中的文字识别出来保存为电子文本。不过,大部分人家中 

软件迅速识别其内容并能较准确地攫取书中信息,需要在 

拍摄时注意一些细节。由于多数人手中不具备用于翻拍的 

辅助工具,如支架,灯光,近摄圈,线控或遥控器等,因此拍 

摄中要尽量利用常见的可行性条件,如选择光线好的天气, 

是没有扫描仪的,而目前人们多数拥有的是数码相机,因此 

使用数码相机代替扫描仪来实现上述工作将会是一种较为 

C v^ ^y ^ v^ v^y・v w 、 

利用叠加书籍平放稳定好相机等。以下是实际拍摄的过程 

及要点描述,使用的是Canon PowerShot S2 IS数码相机。 

‘ ● ● ,^ ^ y^ ^ y^ ^ ^ : 

DELAY:MOV R2,舵0 

LOOP:MOV R3.舵48 ‘ 

P1---OxOf; 反转,判行号的过程与判列号过程对称 

sd2=Pl&0xOf; 

DJNZ R3,S 

DJNZ R2,LOOP 

RET 

switch(sd2) 

fea.qe OxOe:r=-O ̄break: 

CaSe OxOd:r=l;break; 

case OxOb:r=2;break: 

说明:fosc=12MHZ时,子程序延时时间为1"1+20"I+ 

20*248*2+20 2+l 2-9983us。 

ease Ox07:r=3:break:} 

3 C51程序 

∥函数lsscan,若无键按下,函数返回值为0xff,否则返回键盘按键值 

unsined char lgsscan0 

f unsigned char sd1,sd2, ,r,Val; 

P1--OxfO: 

sdl=Pl&OxfO: 

val_4 件c{ 出键值l】 

erturn val; 无键按下返同键值0xff,有键按下返回求出的键值l 

void delayXms(unsined char ig fese=12MHZ时,延时时问为i ms. 

ffor(;i>O;i--) 

(unsined char j=164;g 

while 0一);ll 

val=0xff;∥若无键按下 定义函数返回值为0xff 

if fsdl!=o)(∞ 判有无键按下,如有键按下,延时后再判断 

( 

delayXms f10)://J ̄时10ms 

sdl=Pl&OxfO; 

4结束语 

采用线反转法,在对按键的识别上,不需要扫描,可以大 

大提高键盘响应速度。 

参考文献 

【1】徐爱钧,彭秀华.Keil Cx51 V7.0单片机高级语言编程与N.Vi 

sion2应用实践(第二版)[M】.北京:电子工业出版社,2008. 

if(saLT=O,AOy, ̄实有键按下,再判别是哪一列的键 

{switch(sd1) 

fease OxeO:c=O;break; 【日为第0列,保存列号0 

case OxdO:c=l:break:砌为第l列,保存列号1 

【2]丁明亮.51单片机应用设计与仿真fM】.北京:北京航空航天大 

学出版社,2009. 

【3】侯玉宝,陈忠平,李成群,等.基于Proteus的5l系列单片机设计 

与仿真fM】.北京:电子工业出版社,2008. 

c8=se OxbO:c=2;break;细为第2列,保存列号2 

ease Ox70:e=3;break:砌为第3列,保存列号3】 

收稿日期:2011-Ol一14 

%万贤珍,王俊江西环境工程职业学院讲师,副教授(江西,赣州341002)。 

・ 

62 ・ 

(1)将被拍摄的书摆放平整。平整被拍书本时通常会 

采用两种方法:水平和垂直摆放。书本如果水平放置则相机 

要竖直拍摄,一般人没有固定相机垂直向下拍摄的支架,若 

仅仅靠人手持相机站着向下拍摄,时常要微调焦距和控制 

拍摄范围,较费时。故在此采用悬吊方法用夹子夹住书的一 

侧,让书自然垂放平整,将数码相机用书本垫高后正对页面 

进行水平拍摄,这样的准备工作既方便又快捷。 

(2)为便于软件的文字识别,应该使数码成像黑白分 

明。为此需要选择较好的晴天,在较硬的光线条件下拍摄。 

图2 

另外,拍摄时在原测光基础上增加1EV曝光量(1挡),让 

白底黑字主题能够得到明确表现,这样也易于消除反面字 

迹印透的影响,提高软件识别字迹率。 

(3)校准白平衡。这里采用手动白平衡设置,将书本的 

白底做为标准自来设定。 

(4)准确聚焦。Canon PowerShot S2 IS具备手动数字 

对焦,但因为此时拍摄的文字小,聚焦判断不是很准确,可 

以先采用自动对焦,然后手动微调就行。 

(5)分辨率设定为中或高,不必最高。分辨率太高不仅 

图3 

识别时间延长而且如果拍摄效果没有把握好的话造成误读 

的可能性也会增加。对于普通拍摄人员来说,把握不好的几 

率较大。 

(6)在白平衡,聚焦,和变焦定好取景范围后,最后可 

以请一个人帮忙翻页,先拍奇数页,到页尾结束后再拍偶数 

页,这样大大提高效率。 

拍摄完成后,便去网上搜索一款较实用的文字识别软 

件。选用国产软件汉王OCR6.0作为图像文字识别会方便 

易用。将PC机与DC连接,打开汉王OCR6.0菜单栏中的文 

图4 

件,选择系统设置选项,跳出如图1所示窗口,因为下面要 

个整块,因为该软件识别后的内容会依据分块情况重新组 

转换的页面是全英文,故在此选择了纯英文档。 

合,这样产生的最终识别结果可能会打乱文章的段落次序。 

在识别结果窗口中可以看到若干红色字符(如果图片拍摄 

不好,将出现大量的红色不确定识别字符),红色通常表示 

识别可能有误或无法识别,接下来查修错误,主要是检查红 

色字符是否有误,有误则修改。实践过程中发现B和l的识 

别率较低,B常被认成数字13,l常被认成数字1,有时i会 

认作i,Y会读成v,无法识别的通常用 表示,如图4中的 

AT&T中的&没有认出就用了 代替。修改完成后(有些红 

色字符如果是正确的,可以不要改),直接在识别结果窗中 

全选定,后复制到记事本中,最后再复制到word中。实际应 

图1 

用中发现,如果直接复制到word,没有修改的红色字母将会 

确定后点击工具栏的打开图标,选择要识别的图片点 

出现乱码符号,故中间借用一下记事本过渡,省去修改红色 

击确定打开,如图2所示。 

标记的时间。最后,在word中将拷贝过来的电子文档按书 

接着进行9O。旋转,如图3所示。 

中的页码分页设置并保存好。 

然后在菜单栏点击开始自动识别(或按F8),出现如图 

由于充分利用常见条件,采取了简单实用方法,两天就 

4所示识别窗口。 

将一本纸质书转换成电子文档的工作完成了。 

识别后可以对照下面的原照片窗口进行校对。原照片 

参考文献 

窗口中出现的红色框有标号,表明将图片中的内容进行了 

I1]http'/Acww.canon.corn.cn/products/dczhinan/2—01.htm1. 

分块识别。对于文字页面,最好将红色识别框手动修改为一 

【2】http'//web.cjcn.edu.tw/'jyewang/new_pag ̄_2-1 1-0.him. 

【3】http.//www.hw99.com ̄roducVocr_yishi.htm. 

2024年8月16日发(作者:家梦山)

2011车2月 电 脑 学 习 第1期 

用数码相机将纸质书转换成电子文档的实用方法 

万贤珍’ 王俊 

摘 要:本文介绍了如何简便且较好地使用数码相机将纸质书的文字内容拍摄下来的实用方法.接着简要描述了使用软件汉王 

OCR6.0将拍摄的数码照片中的文字内容识别出来并存为电子文档的主要过程。 

关键词:数码相机:纸质书:电子文档 

中图分类号:G202 文献标识码:B 文章编号:1002—2422(2011)01-0062-02 

The Practieal Method of Turning the Book into Electronic Document 

Wan Xianzhen Wang Jun 

Abstract:The paper illustrates how to Shoot the written content on paper you need rapidly and pedectly with a digital cBIl 

r'a.Subsequently the’article introduces the main procedure to recognize these characters accurately by using the s0f- 

tware HANWANG ORC6.0.After conserve them,you get the electonirc document. 

Key words:Digital Camera;Written Words Oil Paper;,Electronic Document 

近期接到一个任务,要把一本书的文字内容录入成 

Word文档预备他用,全书95页,少说也有3万5千字,且 

实用的方法。 

使用数码相机拍摄纸质书时,为保证拍摄的图像能被 

大部分为英文,对于录入速度不快的人来说,单靠键盘完成 

将会耗费很长的时间。要想快速完成此项工作,通常会想到 

使用扫描仪,将每~页扫描下来,后利用转换软件将扫描图 

像中的文字识别出来保存为电子文本。不过,大部分人家中 

软件迅速识别其内容并能较准确地攫取书中信息,需要在 

拍摄时注意一些细节。由于多数人手中不具备用于翻拍的 

辅助工具,如支架,灯光,近摄圈,线控或遥控器等,因此拍 

摄中要尽量利用常见的可行性条件,如选择光线好的天气, 

是没有扫描仪的,而目前人们多数拥有的是数码相机,因此 

使用数码相机代替扫描仪来实现上述工作将会是一种较为 

C v^ ^y ^ v^ v^y・v w 、 

利用叠加书籍平放稳定好相机等。以下是实际拍摄的过程 

及要点描述,使用的是Canon PowerShot S2 IS数码相机。 

‘ ● ● ,^ ^ y^ ^ y^ ^ ^ : 

DELAY:MOV R2,舵0 

LOOP:MOV R3.舵48 ‘ 

P1---OxOf; 反转,判行号的过程与判列号过程对称 

sd2=Pl&0xOf; 

DJNZ R3,S 

DJNZ R2,LOOP 

RET 

switch(sd2) 

fea.qe OxOe:r=-O ̄break: 

CaSe OxOd:r=l;break; 

case OxOb:r=2;break: 

说明:fosc=12MHZ时,子程序延时时间为1"1+20"I+ 

20*248*2+20 2+l 2-9983us。 

ease Ox07:r=3:break:} 

3 C51程序 

∥函数lsscan,若无键按下,函数返回值为0xff,否则返回键盘按键值 

unsined char lgsscan0 

f unsigned char sd1,sd2, ,r,Val; 

P1--OxfO: 

sdl=Pl&OxfO: 

val_4 件c{ 出键值l】 

erturn val; 无键按下返同键值0xff,有键按下返回求出的键值l 

void delayXms(unsined char ig fese=12MHZ时,延时时问为i ms. 

ffor(;i>O;i--) 

(unsined char j=164;g 

while 0一);ll 

val=0xff;∥若无键按下 定义函数返回值为0xff 

if fsdl!=o)(∞ 判有无键按下,如有键按下,延时后再判断 

( 

delayXms f10)://J ̄时10ms 

sdl=Pl&OxfO; 

4结束语 

采用线反转法,在对按键的识别上,不需要扫描,可以大 

大提高键盘响应速度。 

参考文献 

【1】徐爱钧,彭秀华.Keil Cx51 V7.0单片机高级语言编程与N.Vi 

sion2应用实践(第二版)[M】.北京:电子工业出版社,2008. 

if(saLT=O,AOy, ̄实有键按下,再判别是哪一列的键 

{switch(sd1) 

fease OxeO:c=O;break; 【日为第0列,保存列号0 

case OxdO:c=l:break:砌为第l列,保存列号1 

【2]丁明亮.51单片机应用设计与仿真fM】.北京:北京航空航天大 

学出版社,2009. 

【3】侯玉宝,陈忠平,李成群,等.基于Proteus的5l系列单片机设计 

与仿真fM】.北京:电子工业出版社,2008. 

c8=se OxbO:c=2;break;细为第2列,保存列号2 

ease Ox70:e=3;break:砌为第3列,保存列号3】 

收稿日期:2011-Ol一14 

%万贤珍,王俊江西环境工程职业学院讲师,副教授(江西,赣州341002)。 

・ 

62 ・ 

(1)将被拍摄的书摆放平整。平整被拍书本时通常会 

采用两种方法:水平和垂直摆放。书本如果水平放置则相机 

要竖直拍摄,一般人没有固定相机垂直向下拍摄的支架,若 

仅仅靠人手持相机站着向下拍摄,时常要微调焦距和控制 

拍摄范围,较费时。故在此采用悬吊方法用夹子夹住书的一 

侧,让书自然垂放平整,将数码相机用书本垫高后正对页面 

进行水平拍摄,这样的准备工作既方便又快捷。 

(2)为便于软件的文字识别,应该使数码成像黑白分 

明。为此需要选择较好的晴天,在较硬的光线条件下拍摄。 

图2 

另外,拍摄时在原测光基础上增加1EV曝光量(1挡),让 

白底黑字主题能够得到明确表现,这样也易于消除反面字 

迹印透的影响,提高软件识别字迹率。 

(3)校准白平衡。这里采用手动白平衡设置,将书本的 

白底做为标准自来设定。 

(4)准确聚焦。Canon PowerShot S2 IS具备手动数字 

对焦,但因为此时拍摄的文字小,聚焦判断不是很准确,可 

以先采用自动对焦,然后手动微调就行。 

(5)分辨率设定为中或高,不必最高。分辨率太高不仅 

图3 

识别时间延长而且如果拍摄效果没有把握好的话造成误读 

的可能性也会增加。对于普通拍摄人员来说,把握不好的几 

率较大。 

(6)在白平衡,聚焦,和变焦定好取景范围后,最后可 

以请一个人帮忙翻页,先拍奇数页,到页尾结束后再拍偶数 

页,这样大大提高效率。 

拍摄完成后,便去网上搜索一款较实用的文字识别软 

件。选用国产软件汉王OCR6.0作为图像文字识别会方便 

易用。将PC机与DC连接,打开汉王OCR6.0菜单栏中的文 

图4 

件,选择系统设置选项,跳出如图1所示窗口,因为下面要 

个整块,因为该软件识别后的内容会依据分块情况重新组 

转换的页面是全英文,故在此选择了纯英文档。 

合,这样产生的最终识别结果可能会打乱文章的段落次序。 

在识别结果窗口中可以看到若干红色字符(如果图片拍摄 

不好,将出现大量的红色不确定识别字符),红色通常表示 

识别可能有误或无法识别,接下来查修错误,主要是检查红 

色字符是否有误,有误则修改。实践过程中发现B和l的识 

别率较低,B常被认成数字13,l常被认成数字1,有时i会 

认作i,Y会读成v,无法识别的通常用 表示,如图4中的 

AT&T中的&没有认出就用了 代替。修改完成后(有些红 

色字符如果是正确的,可以不要改),直接在识别结果窗中 

全选定,后复制到记事本中,最后再复制到word中。实际应 

图1 

用中发现,如果直接复制到word,没有修改的红色字母将会 

确定后点击工具栏的打开图标,选择要识别的图片点 

出现乱码符号,故中间借用一下记事本过渡,省去修改红色 

击确定打开,如图2所示。 

标记的时间。最后,在word中将拷贝过来的电子文档按书 

接着进行9O。旋转,如图3所示。 

中的页码分页设置并保存好。 

然后在菜单栏点击开始自动识别(或按F8),出现如图 

由于充分利用常见条件,采取了简单实用方法,两天就 

4所示识别窗口。 

将一本纸质书转换成电子文档的工作完成了。 

识别后可以对照下面的原照片窗口进行校对。原照片 

参考文献 

窗口中出现的红色框有标号,表明将图片中的内容进行了 

I1]http'/Acww.canon.corn.cn/products/dczhinan/2—01.htm1. 

分块识别。对于文字页面,最好将红色识别框手动修改为一 

【2】http'//web.cjcn.edu.tw/'jyewang/new_pag ̄_2-1 1-0.him. 

【3】http.//www.hw99.com ̄roducVocr_yishi.htm. 

发布评论

评论列表 (0)

  1. 暂无评论