2024年3月31日发(作者:焦幻露)
信息科技探索
基于图像识别与生成技术的人工智能应用
王雪淳
根据特征来模仿,生成图片的技术。这项技术
摘 要
图像识别与生成技术是计算机通过分析图片而提取图像特征,
目前已较广泛应用于手机解锁,司法鉴定,医学诊断,游戏娱乐等领域。图像识别与生成技术在人工智能领域已有多
方面的应用,且有极大的上升空间与发展潜力。
图像识别;图像生成
关键词
人工智能;
中图分类号
TP3
文献标识码
A
文章编号
1674-6708(2019)232-0153-02
2017年11月3日,苹果公司推出一款可以通
过人脸识别技术来解锁的手机iPhoneX,一时大受
追捧。这一技术不仅为广大用户提供便利,同时也
使大部分人愿意为这样一份新鲜感而买单。一些网
页程序,如近期比较热门的网页小游戏image-to-
image,可以将用户输入的简单几何形转化为猫,建
筑物等实物图像。本文将简要分析这些应用背后的
图像识别与生成技术。
1 人工智能概述
人工智能,是一门研究、开发用于扩展人类智
能的理论、方法、技术及应用系统的科学技术
[1]
。
它起源于20世纪50年代,至今已经过了多个瓶颈
期和突破期,其中最新的一个突破源于近五年计算
机数据科学的蓬勃发展所带来的大数据技术。人工
智能是计算机科学的一个分支,主要以能做出与人
类相似的反应,并胜任一些需要人工智能才能完成
的复杂工作为目标,具体研究领域包括机器人,语
言识别,图像识别,自然语言处理和专家系统等领
域。其中主要分为具备自我思考、自我推理及解决
问题能力的强人工智能,及不具备此类能力的弱人
工智能
[2]
。
2.1 图像识别技术原理
图像识别技术,是一种计算机通过提取图像关
键性重要特征以识别各种不同模式的目标和对象的
技术。这一技术已经得到了深入的研究和广泛的发
展,是计算机学科领域非常重要的研究方向之一
[3]
。
2.2 人工智能图像识别应用
人工智能图像识别广泛应用与多个领域,如司
法、娱乐等,同时还与医学等学科有交叉。
1)识别笔迹。其在司法笔迹鉴定中的应用也
较为成熟,能分析且提取笔迹形态上的特征,如长
作者简介:王雪淳,江苏省常州高级中学。
2 图像识别技术及其在人工智能中的应用
宽比,字间距,笔画粗细,折笔角度等关系,实现
笔迹鉴定。但同时也存在一些如对于摹仿签名笔迹
的有效识别率较低等问题
[4]
。对笔迹的识别研究是
法务判断的重要参考。在经济领域,涉及合同签名
等问题中,笔记鉴定显得尤为重要。除此,笔记识
别还可鉴定收藏品中的名家笔墨,是真品还是赝品,
抵制贩卖假货的行为,保护公民个人财产。
2)识别绘画图像。一些小程序游戏可成为开
发者前期训练人工智能的绝佳场所。“猜画小歌”
就是这样是一款谷歌推出的微信游戏小程序,其
主要内容是人工智能识别玩家的简笔画。游戏的
玩法类似“你画我猜”,但游戏的参与者不全是
真人玩家。在玩家画画的同时,人工智能可以不
断地提供猜测的答案并显示在手机屏幕上,直到
猜对正确答案或游戏时间(每轮20秒)结束为
止。“猜画小歌”可以通过预先分析上万张手绘简
笔画,提取其中不同物体的关键特征,掌握群众
绘图时的基本思路。然后当用户们只画下简单的
线条,甚至是人类也看不出所画何物时,“猜画小
歌”可以迅速将线条与数据库匹配,继而给出答
案
[5]
。由于小程序游戏的广泛传播与极易上手,越
来越多的用户为“猜画小歌”的数据库提供素材,
从而促进人工智能领悟人类绘画时的思维习惯,不
仅降低前期训练人工智能成本,也大大提高训练
效率。
3)识别实物图像。人工智能的图像识别技术
还可识别人脸和植物等实物。
人脸识别是基于人的脸部特征信息进行身份识
别的一种生物识别技术。人脸可受发型,胡子,妆容,
光源等影响,故此人脸识别需要先分割人脸,才能
提取人脸特征,如五官大小,分布间的参数比例等,
建立三维人脸模型,再匹配和识别人脸。此项技术
极广泛的应用于日常生活,如人脸识别解锁手机,
超市中识别人脸后即可用相应账户付钱
[6]
。随其安
153
2019·4(上)
《科技传播》
信息科技探索
全性仍饱受争议,但不可否认人脸识别技术的发展
也为社会带来极大的便捷。
“花伴侣”App是一款植物智能识别App,由于
花卉种类繁多,分布广泛,特性相异,光建立数据
库就已是一项庞大的工程。制作团队选取众多花的
照片,进行分析鉴定,现已实现五千多种中常见植
物的智能识别
[7]
。这一大众化App使用户们每拍一
张照片,就可了解所见一些常见植物的相关知识,
更易满足人们求知欲,同时也为科学研究作出一定
贡献。
4)识别医学诊断。病理图像是疾病诊断的金
标准,医师通过分析图像中细胞属性来进行诊断决
策。数字病理切片是将整张载玻片进行全信息、全
方位快速扫描,使物质化的玻璃载玻片变成数字化
的病理切片
[8]
。计算机可识别组织中的肿瘤,并将
结果快速输出成病理报告,从而为医师减负,也大
大提高就诊效率与准确率。在中医领域,计算机也
可以识别不同植物的纹理,判断中药真假,甚至能
推测其作用部位。这些应用都降低医生工作难度,
也降低误诊率,为人类社会提供更好的就医体验。
3 图像生成技术及其在人工智能中的应用
图像生成技术有助于人工智能的机器学习等系
统,促进其将接收到的信息转化为系统可以理解与
处理的信息,使自我知识体系不断完善,逐渐降低
对人类专家依赖程度,从而使性能提高。
3.1 图像生成技术原理
图像生成技术指系统通过计算机视觉尝试分析
一副或多副二维图像,感知几何信息,提取其中特
点,而用能力模仿特征生成相关图像。
3.2 人工智能图像生成应用
基于图像生成技术,人工智能可模仿人类书写
效果或名画家绘画风格,可将实物与绘图相互转换。
同时,图像生成技术对于虚拟现实、人机交互、网
络辅助教学等都有广泛应用。
1)生成笔迹。笔记生成技术主要是计算机对
人类的真实书写进行分析,从而能模仿出其书写风
格。但由于在电子产品上书写时,没有压感,机器
必须先分析真实毛笔的笔刷形态,笔锋等进行分析,
建立相关笔刷模型,在分析人类书写时的速度,从
而调整笔画粗细与笔锋,生成能具体体现书写者书
法效果的字体
[9]
。然后人类在电子产品中写下的字
体就更美观也更真实,促进无纸化办公发展。
2)生成绘画图像。生成绘画图像指计算机先
将原图生成灰度图像,在进行平滑、锐化等加工,
继而进行边界提取,最后生成简笔图像。这项技术
使更多实物图像转化为适用于插画、装饰等作用的
简笔画,省去大量人工作画时间
[10]
。
3)生成实物图像。计算机也可以在用户勾勒
2019·4(上)
154
简单线条,或放置一些纯色矩形,电脑既可分别生
成实物猫或鞋子、建筑物等实物图片。引言中提及
的网站“image-to-image”就有此类功能,且受大
量网络用户追捧和试玩。也有软件可以将输入图片
按像素分类,进行渲染,并通过加入GAN判别器使
图像更清晰。如图1所示,这一设计使人们可以任
自己所想绘制简单的几何形,系统会自动生成相应
实物,满足用户们的设计兴趣。
图1 把绘制的图像转换为实物图像
4 总结与展望
人工智能基于图像识别与生成技术的发展,现
已可以为人们带来更便捷的解锁方法,更准确的病
理诊断,更真实的电子书写体验,更有趣的绘图软
件,为当今社会带来更丰富的内容,普遍提高人类
生活质量。
此类技术虽已有较广泛的应用,但发展仍不成
熟。如果研究得以深入或辅以其他如神经网络等领
域技术,图像识别技术将能更加准确,如司法笔迹
鉴定,不拘泥于图像形态上的相似,也能注重笔画
走向等方式而图像生成技术也将更为生动,同时也
促使人工智能领悟人类思考方式,推动其发展。
参考文献
[1]本刊编辑部.人工智能概述[J].保密科学技术,2017
(11):8-9.
[2]邹蕾,张先锋.人工智能及其发展应用[J].信息网络安全,
2012(2):11-13.
[3]陈银萍.基于人工智能中的图像识别技术的分析[J].信息与
电脑(理论版),2019(1):165-166.
[4]梁曦璐. 基于改进神经网络的离线签名笔迹识别[D].北京:
中国政法大学,2017.
[5]陈玮文.从“猜画小歌”看人工智能在小程序游戏中的应用
[J].科学技术创新,2018(30):87-89.
[6]李武军,王崇骏,张炜,等.人脸识别研究综述[J].模式识
别与人工智能,2006,19(1):58-66.
[7]李敏.“花伴侣”:人工智能时代 知识服务的新媒介[J].出
版参考,2018(8):23-24.
[8]陈颖,魏培莲,潘军,周洁,董昌盛,于观贞.数字化全
玻片助力人工智能病理图像决策[J].第二军医大学学报,
2018,39(8):840-845.
[9]周双.浅析数字笔迹书法风格生成技术[J].才智,2014
(31):308.
[10]关雪梅.简笔画的自动生成方法研究[J].计算机工程与科
学,2010,32(5):136-139.
《科技传播》
2024年3月31日发(作者:焦幻露)
信息科技探索
基于图像识别与生成技术的人工智能应用
王雪淳
根据特征来模仿,生成图片的技术。这项技术
摘 要
图像识别与生成技术是计算机通过分析图片而提取图像特征,
目前已较广泛应用于手机解锁,司法鉴定,医学诊断,游戏娱乐等领域。图像识别与生成技术在人工智能领域已有多
方面的应用,且有极大的上升空间与发展潜力。
图像识别;图像生成
关键词
人工智能;
中图分类号
TP3
文献标识码
A
文章编号
1674-6708(2019)232-0153-02
2017年11月3日,苹果公司推出一款可以通
过人脸识别技术来解锁的手机iPhoneX,一时大受
追捧。这一技术不仅为广大用户提供便利,同时也
使大部分人愿意为这样一份新鲜感而买单。一些网
页程序,如近期比较热门的网页小游戏image-to-
image,可以将用户输入的简单几何形转化为猫,建
筑物等实物图像。本文将简要分析这些应用背后的
图像识别与生成技术。
1 人工智能概述
人工智能,是一门研究、开发用于扩展人类智
能的理论、方法、技术及应用系统的科学技术
[1]
。
它起源于20世纪50年代,至今已经过了多个瓶颈
期和突破期,其中最新的一个突破源于近五年计算
机数据科学的蓬勃发展所带来的大数据技术。人工
智能是计算机科学的一个分支,主要以能做出与人
类相似的反应,并胜任一些需要人工智能才能完成
的复杂工作为目标,具体研究领域包括机器人,语
言识别,图像识别,自然语言处理和专家系统等领
域。其中主要分为具备自我思考、自我推理及解决
问题能力的强人工智能,及不具备此类能力的弱人
工智能
[2]
。
2.1 图像识别技术原理
图像识别技术,是一种计算机通过提取图像关
键性重要特征以识别各种不同模式的目标和对象的
技术。这一技术已经得到了深入的研究和广泛的发
展,是计算机学科领域非常重要的研究方向之一
[3]
。
2.2 人工智能图像识别应用
人工智能图像识别广泛应用与多个领域,如司
法、娱乐等,同时还与医学等学科有交叉。
1)识别笔迹。其在司法笔迹鉴定中的应用也
较为成熟,能分析且提取笔迹形态上的特征,如长
作者简介:王雪淳,江苏省常州高级中学。
2 图像识别技术及其在人工智能中的应用
宽比,字间距,笔画粗细,折笔角度等关系,实现
笔迹鉴定。但同时也存在一些如对于摹仿签名笔迹
的有效识别率较低等问题
[4]
。对笔迹的识别研究是
法务判断的重要参考。在经济领域,涉及合同签名
等问题中,笔记鉴定显得尤为重要。除此,笔记识
别还可鉴定收藏品中的名家笔墨,是真品还是赝品,
抵制贩卖假货的行为,保护公民个人财产。
2)识别绘画图像。一些小程序游戏可成为开
发者前期训练人工智能的绝佳场所。“猜画小歌”
就是这样是一款谷歌推出的微信游戏小程序,其
主要内容是人工智能识别玩家的简笔画。游戏的
玩法类似“你画我猜”,但游戏的参与者不全是
真人玩家。在玩家画画的同时,人工智能可以不
断地提供猜测的答案并显示在手机屏幕上,直到
猜对正确答案或游戏时间(每轮20秒)结束为
止。“猜画小歌”可以通过预先分析上万张手绘简
笔画,提取其中不同物体的关键特征,掌握群众
绘图时的基本思路。然后当用户们只画下简单的
线条,甚至是人类也看不出所画何物时,“猜画小
歌”可以迅速将线条与数据库匹配,继而给出答
案
[5]
。由于小程序游戏的广泛传播与极易上手,越
来越多的用户为“猜画小歌”的数据库提供素材,
从而促进人工智能领悟人类绘画时的思维习惯,不
仅降低前期训练人工智能成本,也大大提高训练
效率。
3)识别实物图像。人工智能的图像识别技术
还可识别人脸和植物等实物。
人脸识别是基于人的脸部特征信息进行身份识
别的一种生物识别技术。人脸可受发型,胡子,妆容,
光源等影响,故此人脸识别需要先分割人脸,才能
提取人脸特征,如五官大小,分布间的参数比例等,
建立三维人脸模型,再匹配和识别人脸。此项技术
极广泛的应用于日常生活,如人脸识别解锁手机,
超市中识别人脸后即可用相应账户付钱
[6]
。随其安
153
2019·4(上)
《科技传播》
信息科技探索
全性仍饱受争议,但不可否认人脸识别技术的发展
也为社会带来极大的便捷。
“花伴侣”App是一款植物智能识别App,由于
花卉种类繁多,分布广泛,特性相异,光建立数据
库就已是一项庞大的工程。制作团队选取众多花的
照片,进行分析鉴定,现已实现五千多种中常见植
物的智能识别
[7]
。这一大众化App使用户们每拍一
张照片,就可了解所见一些常见植物的相关知识,
更易满足人们求知欲,同时也为科学研究作出一定
贡献。
4)识别医学诊断。病理图像是疾病诊断的金
标准,医师通过分析图像中细胞属性来进行诊断决
策。数字病理切片是将整张载玻片进行全信息、全
方位快速扫描,使物质化的玻璃载玻片变成数字化
的病理切片
[8]
。计算机可识别组织中的肿瘤,并将
结果快速输出成病理报告,从而为医师减负,也大
大提高就诊效率与准确率。在中医领域,计算机也
可以识别不同植物的纹理,判断中药真假,甚至能
推测其作用部位。这些应用都降低医生工作难度,
也降低误诊率,为人类社会提供更好的就医体验。
3 图像生成技术及其在人工智能中的应用
图像生成技术有助于人工智能的机器学习等系
统,促进其将接收到的信息转化为系统可以理解与
处理的信息,使自我知识体系不断完善,逐渐降低
对人类专家依赖程度,从而使性能提高。
3.1 图像生成技术原理
图像生成技术指系统通过计算机视觉尝试分析
一副或多副二维图像,感知几何信息,提取其中特
点,而用能力模仿特征生成相关图像。
3.2 人工智能图像生成应用
基于图像生成技术,人工智能可模仿人类书写
效果或名画家绘画风格,可将实物与绘图相互转换。
同时,图像生成技术对于虚拟现实、人机交互、网
络辅助教学等都有广泛应用。
1)生成笔迹。笔记生成技术主要是计算机对
人类的真实书写进行分析,从而能模仿出其书写风
格。但由于在电子产品上书写时,没有压感,机器
必须先分析真实毛笔的笔刷形态,笔锋等进行分析,
建立相关笔刷模型,在分析人类书写时的速度,从
而调整笔画粗细与笔锋,生成能具体体现书写者书
法效果的字体
[9]
。然后人类在电子产品中写下的字
体就更美观也更真实,促进无纸化办公发展。
2)生成绘画图像。生成绘画图像指计算机先
将原图生成灰度图像,在进行平滑、锐化等加工,
继而进行边界提取,最后生成简笔图像。这项技术
使更多实物图像转化为适用于插画、装饰等作用的
简笔画,省去大量人工作画时间
[10]
。
3)生成实物图像。计算机也可以在用户勾勒
2019·4(上)
154
简单线条,或放置一些纯色矩形,电脑既可分别生
成实物猫或鞋子、建筑物等实物图片。引言中提及
的网站“image-to-image”就有此类功能,且受大
量网络用户追捧和试玩。也有软件可以将输入图片
按像素分类,进行渲染,并通过加入GAN判别器使
图像更清晰。如图1所示,这一设计使人们可以任
自己所想绘制简单的几何形,系统会自动生成相应
实物,满足用户们的设计兴趣。
图1 把绘制的图像转换为实物图像
4 总结与展望
人工智能基于图像识别与生成技术的发展,现
已可以为人们带来更便捷的解锁方法,更准确的病
理诊断,更真实的电子书写体验,更有趣的绘图软
件,为当今社会带来更丰富的内容,普遍提高人类
生活质量。
此类技术虽已有较广泛的应用,但发展仍不成
熟。如果研究得以深入或辅以其他如神经网络等领
域技术,图像识别技术将能更加准确,如司法笔迹
鉴定,不拘泥于图像形态上的相似,也能注重笔画
走向等方式而图像生成技术也将更为生动,同时也
促使人工智能领悟人类思考方式,推动其发展。
参考文献
[1]本刊编辑部.人工智能概述[J].保密科学技术,2017
(11):8-9.
[2]邹蕾,张先锋.人工智能及其发展应用[J].信息网络安全,
2012(2):11-13.
[3]陈银萍.基于人工智能中的图像识别技术的分析[J].信息与
电脑(理论版),2019(1):165-166.
[4]梁曦璐. 基于改进神经网络的离线签名笔迹识别[D].北京:
中国政法大学,2017.
[5]陈玮文.从“猜画小歌”看人工智能在小程序游戏中的应用
[J].科学技术创新,2018(30):87-89.
[6]李武军,王崇骏,张炜,等.人脸识别研究综述[J].模式识
别与人工智能,2006,19(1):58-66.
[7]李敏.“花伴侣”:人工智能时代 知识服务的新媒介[J].出
版参考,2018(8):23-24.
[8]陈颖,魏培莲,潘军,周洁,董昌盛,于观贞.数字化全
玻片助力人工智能病理图像决策[J].第二军医大学学报,
2018,39(8):840-845.
[9]周双.浅析数字笔迹书法风格生成技术[J].才智,2014
(31):308.
[10]关雪梅.简笔画的自动生成方法研究[J].计算机工程与科
学,2010,32(5):136-139.
《科技传播》