最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

基于云与语音识别的手机智能通话系统——SkyTalk

IT圈 admin 80浏览 0评论

2024年1月21日发(作者:铁春桃)

基于云与语音识别的智能通话系统——SkyTalk

基于云与语音识别的智能通话系统SkyTalk

简介

本工程提出一种智能通话系统〔SkyTalk〕,可以方便人们在双方通话中简单、快捷、实时地通过语音获取信息、完成用户指定任务,从而防止大量复杂、耗时的操作。在拨出SkyTalk智能 时,中的基站编号、GPS坐标、挪动速度、通讯录等数据会上传至效劳器,并由效劳器建立智能通话。在通话的过程中,效劳器作为第三方通过语音识别和语音合成响应用户的语音恳求,可以发送通讯录中的号码、说出用户的详细位置、计算到达对方的时间、播送天气预报、进展实时语音翻译等。SkyTalk通过云计算提供反向地址解析、获取互联网信息,不仅简化了效劳器构架,还能为用户提供更多精彩应用。

挪动 拉近了人与人之间的间隔 。 的开展,从贝尔到摩托罗拉,再到今天的4G,技术不断革新,但人们的通话方式却始终没有改变。SkyTalk智能通话系统通过云资源、语音识别与合成,可以使用户在通话过程中,不必挂断、亲自编辑短信、查阅信息或翻开GPS定位,而只需说出问题,SkyTalk便可以用语音加以答复。总之,SkyTalk是信息化、智能化社会下人们通话方式的革新。

工程原理

根本构架

SkyTalk通话系统在 语音通道之外建立一条互联网智能通道。上的GPS位置、通讯录、个人偏好等信息通过这条通道传输到中间效劳器,在云的辅助下对之进展处理与交换。而中间效劳器通过语音识别〔SR〕和文本到语音转换〔TTS〕在 通道上与用户双方进展交互。这样,一方面可以利用互联网通道交换根本数据,另一方面又利用现有 通道进展语音传输,从而防止产生大量的语音数据包。更为详细的SkyTalk的构架〔如图1〕分为3个部分:客户端〔SkyTalklient〕、效劳器〔SkyTalkServer〕和云〔lud〕。

客户端〔SkyTalklient〕一方面取代原有 的拨号界面,另一方面通过平台的API获取的各类信息〔GPS、电子罗盘、通讯录等〕,并通过UI交互获取用户的定制偏好及信息。当用户拨打一个 时,客户端〔SkyTalklient〕向效劳器〔SkyTalkServer〕发送一个恳求,并附上原先获取的信息。

效劳器〔SkyTalkServer〕收到恳求后,建立对等和效劳器之间的三方通话〔Phne-Server-Phne〕。效劳器作为第三方根据语音识别引擎分析用户的语音命令,并结合用户的信息进展相应处理。

云端〔lud〕集成了用户可能需要的信息。这片云是现有的互联网效劳集合。

根本流程本文由论文联盟搜集整理

SkyTalk根本工作流程见图2。

本工程的客户端基于Qt〔ute〕开发。由于涉及访问系统,用Java平台实现是不适宜的。Java虽然提供了此方面的JSR开发包,但由于不同厂商支持的JSR不同,实现也不同,因此兼容性很差。于是,本工程采用效率更高、操作系统支持更强的Qt〔++〕实现。

功能实现

基于Skype的通话系统

一方面为了保障正常通话质量,另一方面为了使效劳器的语音介入成为可能。本工程〔SkyTalk〕采用Skype构建通话系统。Skype在inds平台上为开发者提供了接口。本工程利用接口与Skype进展通信。

音频数据定向传输语音管道

本工程通过虚拟硬件的驱动实现语音定向传输。

语音识别与合成

为了更好地实现语音功能,本工程基于微软SAPI5.4语音引擎构建。这一引擎在inds7和indsServer2022中内置。

已实现的几项详细功能

①在通话中查询当地天气。②在通话中查询当地时间。

③在通话中提供地理位置效劳〔包括通话者的位置,与另一方的间隔 和到达对方的时间〕。

④在通话中说出通讯录中某人的号码。

⑤在通话中发送通讯录中某人的号码。

⑥在通话中播放音乐。

⑦在通话中分享GgleReader。

⑧通话中的实时翻译。

创新点

本工程〔SkyTalk〕使用Skype进展语音传输功能的实现,从而可以利用现有挪动通讯网传输语音数据。这不仅大大减少了语音传输的网络消耗,也使得客户端可以对任何挪动、固定终端拨打智能 。

SkyTalk可以根据用户的需求在 语音通话中提供实时

的语音信息效劳。这使得用户在通话的过程中可以获取互联网资讯、交换信息、解析地理位置、分享各类数据,而不需要事先准备或挂断 后进展操作。因此用户的交谈、讨论得到大大的简化。

通话的过程中进展其他操作〔如翻阅通讯录、用计算机上网查找信息〕并不实际。SkyTalk利用语音技术解决这一问题。语音识别技术识别用户的命令恳求,而语音合成返回效劳器的响应。

通过互联网上的云资源,SkyTalkServer可以获取各类计算功能和各类信息,如反向地址解析与天气资讯。云资源大大拓展了SkyTalkServer的才能,使其可以提供各类通话中的语音效劳。

SkyTalk可以通过利用用户的个人标志进展个性化智能效劳。这样做有3个优点:①可以加载相应的语音识别配置文件,到达更高的识别准确率。②可以访问用户的互联网或私有云的数据,从而能在通话中利用这些信息。③解析用户的个人偏好语言。

SkyTalk对用户通讯录、用户地理位置信息的存储和传输进展了加密,以保障用户隐私及平安。

展望

SkyTalk在功能上和性能上都有很多可以改进的地方。通过改进与扩展,本工程将可以实现更多的应用,到达更好的性能和用户体验。这些改进与扩展包括:

更强的兼容性。目前客户端〔SkyTalklient〕基于诺基亚平台实现。将来,可以为不同的平台实现其客户端,增加SkyTalk系统的应用范围。

更高的质量与性能。在实验中,本工程有多处可以改进之处。通过整合效劳器资源,SkyTalk可以减少拨出 时间、减少延迟。通过优化效劳器框架、选择更好的云资源,SkyTalk可以进步响应速度。通过采用更好的语音识别算法,SkyTalk可以增强识别率。通过这些改进,SkyTalk可以到达更高的性能。

更平安的个人标志。尽管SkyTalk已经通过较难伪造的号来作为用户的个人标志,但不法分子仍然可以通过某些技术手段到达伪造的目的。为了保护个人隐私平安,SkyTalk可以采用声纹识别进展更强的个人信息认证。声纹和指纹一样,是每个人的生物特征。声纹从个人语音声波中提取,不易伪造。假设结合原先的号验证,那么将大大增强SkyTalk的平安性。

开放式语音平台。这一改进将允许第三方开发平台的插件,将大大增强SkyTalk的应用性。因此,本工程完全可以开展成一个开放的语音应用平台,使各种eb网站或效劳都可以通过语音应用的方式出如今这个平台上,为交谈中的人们带来更多的便利。

面向个人的应用更智能的IVR。IVR〔InterativeVieRespnse〕在 系统中的应用相当广泛。利用SkyTalk,那么可以进一步改进IVR效劳系统。传统的IVR基于企

业数据库,旨在代替 接线员,向企业的用户提供顾客咨询效劳,或是提供 点餐、点歌。改进后的SkyTalkIVR那么基于云技术和用户个人标志,可以将 和用户的互联网生活严密相连。例如,用户可以像听收音机一样,收听自己GgleReader的最新资讯;可以收听个人电子邮箱中的最新邮件还可以利用语音远程操纵自己的计算机只需说出文档的名字,就可以将文档提娶传输到。对于普通用户而言,SkyTalkIVR提供了一种全新的方式去访问互联网。而对于残疾人士而言,那么可以通过它来享受互联网的乐趣。

该工程获得第26届全国青少年科技创新大赛创新成果竞赛工程中学组计算机科学一等奖。

专家评语

工程提出和实现了一种智能通话系统SkyTalk,内容涉及云资源信息效劳、语音识别与合成等技术,方便了人们获取实时语音效劳信息。

2024年1月21日发(作者:铁春桃)

基于云与语音识别的智能通话系统——SkyTalk

基于云与语音识别的智能通话系统SkyTalk

简介

本工程提出一种智能通话系统〔SkyTalk〕,可以方便人们在双方通话中简单、快捷、实时地通过语音获取信息、完成用户指定任务,从而防止大量复杂、耗时的操作。在拨出SkyTalk智能 时,中的基站编号、GPS坐标、挪动速度、通讯录等数据会上传至效劳器,并由效劳器建立智能通话。在通话的过程中,效劳器作为第三方通过语音识别和语音合成响应用户的语音恳求,可以发送通讯录中的号码、说出用户的详细位置、计算到达对方的时间、播送天气预报、进展实时语音翻译等。SkyTalk通过云计算提供反向地址解析、获取互联网信息,不仅简化了效劳器构架,还能为用户提供更多精彩应用。

挪动 拉近了人与人之间的间隔 。 的开展,从贝尔到摩托罗拉,再到今天的4G,技术不断革新,但人们的通话方式却始终没有改变。SkyTalk智能通话系统通过云资源、语音识别与合成,可以使用户在通话过程中,不必挂断、亲自编辑短信、查阅信息或翻开GPS定位,而只需说出问题,SkyTalk便可以用语音加以答复。总之,SkyTalk是信息化、智能化社会下人们通话方式的革新。

工程原理

根本构架

SkyTalk通话系统在 语音通道之外建立一条互联网智能通道。上的GPS位置、通讯录、个人偏好等信息通过这条通道传输到中间效劳器,在云的辅助下对之进展处理与交换。而中间效劳器通过语音识别〔SR〕和文本到语音转换〔TTS〕在 通道上与用户双方进展交互。这样,一方面可以利用互联网通道交换根本数据,另一方面又利用现有 通道进展语音传输,从而防止产生大量的语音数据包。更为详细的SkyTalk的构架〔如图1〕分为3个部分:客户端〔SkyTalklient〕、效劳器〔SkyTalkServer〕和云〔lud〕。

客户端〔SkyTalklient〕一方面取代原有 的拨号界面,另一方面通过平台的API获取的各类信息〔GPS、电子罗盘、通讯录等〕,并通过UI交互获取用户的定制偏好及信息。当用户拨打一个 时,客户端〔SkyTalklient〕向效劳器〔SkyTalkServer〕发送一个恳求,并附上原先获取的信息。

效劳器〔SkyTalkServer〕收到恳求后,建立对等和效劳器之间的三方通话〔Phne-Server-Phne〕。效劳器作为第三方根据语音识别引擎分析用户的语音命令,并结合用户的信息进展相应处理。

云端〔lud〕集成了用户可能需要的信息。这片云是现有的互联网效劳集合。

根本流程本文由论文联盟搜集整理

SkyTalk根本工作流程见图2。

本工程的客户端基于Qt〔ute〕开发。由于涉及访问系统,用Java平台实现是不适宜的。Java虽然提供了此方面的JSR开发包,但由于不同厂商支持的JSR不同,实现也不同,因此兼容性很差。于是,本工程采用效率更高、操作系统支持更强的Qt〔++〕实现。

功能实现

基于Skype的通话系统

一方面为了保障正常通话质量,另一方面为了使效劳器的语音介入成为可能。本工程〔SkyTalk〕采用Skype构建通话系统。Skype在inds平台上为开发者提供了接口。本工程利用接口与Skype进展通信。

音频数据定向传输语音管道

本工程通过虚拟硬件的驱动实现语音定向传输。

语音识别与合成

为了更好地实现语音功能,本工程基于微软SAPI5.4语音引擎构建。这一引擎在inds7和indsServer2022中内置。

已实现的几项详细功能

①在通话中查询当地天气。②在通话中查询当地时间。

③在通话中提供地理位置效劳〔包括通话者的位置,与另一方的间隔 和到达对方的时间〕。

④在通话中说出通讯录中某人的号码。

⑤在通话中发送通讯录中某人的号码。

⑥在通话中播放音乐。

⑦在通话中分享GgleReader。

⑧通话中的实时翻译。

创新点

本工程〔SkyTalk〕使用Skype进展语音传输功能的实现,从而可以利用现有挪动通讯网传输语音数据。这不仅大大减少了语音传输的网络消耗,也使得客户端可以对任何挪动、固定终端拨打智能 。

SkyTalk可以根据用户的需求在 语音通话中提供实时

的语音信息效劳。这使得用户在通话的过程中可以获取互联网资讯、交换信息、解析地理位置、分享各类数据,而不需要事先准备或挂断 后进展操作。因此用户的交谈、讨论得到大大的简化。

通话的过程中进展其他操作〔如翻阅通讯录、用计算机上网查找信息〕并不实际。SkyTalk利用语音技术解决这一问题。语音识别技术识别用户的命令恳求,而语音合成返回效劳器的响应。

通过互联网上的云资源,SkyTalkServer可以获取各类计算功能和各类信息,如反向地址解析与天气资讯。云资源大大拓展了SkyTalkServer的才能,使其可以提供各类通话中的语音效劳。

SkyTalk可以通过利用用户的个人标志进展个性化智能效劳。这样做有3个优点:①可以加载相应的语音识别配置文件,到达更高的识别准确率。②可以访问用户的互联网或私有云的数据,从而能在通话中利用这些信息。③解析用户的个人偏好语言。

SkyTalk对用户通讯录、用户地理位置信息的存储和传输进展了加密,以保障用户隐私及平安。

展望

SkyTalk在功能上和性能上都有很多可以改进的地方。通过改进与扩展,本工程将可以实现更多的应用,到达更好的性能和用户体验。这些改进与扩展包括:

更强的兼容性。目前客户端〔SkyTalklient〕基于诺基亚平台实现。将来,可以为不同的平台实现其客户端,增加SkyTalk系统的应用范围。

更高的质量与性能。在实验中,本工程有多处可以改进之处。通过整合效劳器资源,SkyTalk可以减少拨出 时间、减少延迟。通过优化效劳器框架、选择更好的云资源,SkyTalk可以进步响应速度。通过采用更好的语音识别算法,SkyTalk可以增强识别率。通过这些改进,SkyTalk可以到达更高的性能。

更平安的个人标志。尽管SkyTalk已经通过较难伪造的号来作为用户的个人标志,但不法分子仍然可以通过某些技术手段到达伪造的目的。为了保护个人隐私平安,SkyTalk可以采用声纹识别进展更强的个人信息认证。声纹和指纹一样,是每个人的生物特征。声纹从个人语音声波中提取,不易伪造。假设结合原先的号验证,那么将大大增强SkyTalk的平安性。

开放式语音平台。这一改进将允许第三方开发平台的插件,将大大增强SkyTalk的应用性。因此,本工程完全可以开展成一个开放的语音应用平台,使各种eb网站或效劳都可以通过语音应用的方式出如今这个平台上,为交谈中的人们带来更多的便利。

面向个人的应用更智能的IVR。IVR〔InterativeVieRespnse〕在 系统中的应用相当广泛。利用SkyTalk,那么可以进一步改进IVR效劳系统。传统的IVR基于企

业数据库,旨在代替 接线员,向企业的用户提供顾客咨询效劳,或是提供 点餐、点歌。改进后的SkyTalkIVR那么基于云技术和用户个人标志,可以将 和用户的互联网生活严密相连。例如,用户可以像听收音机一样,收听自己GgleReader的最新资讯;可以收听个人电子邮箱中的最新邮件还可以利用语音远程操纵自己的计算机只需说出文档的名字,就可以将文档提娶传输到。对于普通用户而言,SkyTalkIVR提供了一种全新的方式去访问互联网。而对于残疾人士而言,那么可以通过它来享受互联网的乐趣。

该工程获得第26届全国青少年科技创新大赛创新成果竞赛工程中学组计算机科学一等奖。

专家评语

工程提出和实现了一种智能通话系统SkyTalk,内容涉及云资源信息效劳、语音识别与合成等技术,方便了人们获取实时语音效劳信息。

发布评论

评论列表 (0)

  1. 暂无评论