2024年4月12日发(作者:鄂悦怡)
CATV
【
本文献信息
】
马振洲
.AI
智能音箱机顶盒的关键部件设计与实现
[
J
]
.
广播与电视技术
,
2019,
Vol.
46(10).
I
有线网络
Al
智能音箱机顶盒的
关键部件设计与实现
马振洲
(江苏省广电有线信息网络股份有限公司苏州分公司
,
江苏
215008)
【
摘要
】
随着人工智能大规模应用即将来临
,
普通用户和运营商都非常需要一款集音箱和盒子为一体的人工智能终端产品
,
能够语音远场控制
,
解放用户的双手
,
让用户在家庭环境中尽享高科技带来的便捷生活。
因此本文提出了关于
“
远场语音
操控+智能音箱
+4K
机顶盒
”
的业务融合智能终端产品的设计思路并加以实现
,
以此来确保江苏有线在智慧家庭战略布
局中的核心能力和地位
。
【
关键词
】
人工智能
,
远场语音
,
高保真音箱
【
中图分类号
】
TP393
【
文献标识码
】
B
【
DOI
编码
】
10.16171/.2
Design
of
Key
Component
in
Integrated
AI
Smart
Speaker
and
STB
Ma
Zhenzhou
(Suzhou
Branch,
Jiangsu
Broadcasting
Cable
Information
Network
Co.,
Ltd.,
Jiangsu
215006,
China)
Abstract
With
the
advent
of
large-scale
application
of
artificial
intelligence,
both
users
and
operators
are
in
great
need of
an
artificial
intelligence
terminal
integrated
speaker
and
STB.
It
can
control
far
field
and
free
the
user's
hands,
allowing
users
to
enjoy
home.
The
convenient
life
is
brought
by
advanced
technology.
This
paper
proposed
the
concept
of
"far-field
voice
control
+
smart
speaker
+
4K
set-top
box"
business
integration
intelligent
termina,
in
order
to
ensure
the
core
competence
of Jiangsu
Broadcasting
Cable
Information
Network
Co.,
Ltd.,
in
the
strategic
arrangement
of
smart
home.
Keywords
Artificial
intelligence,
Far-field
voice,
High-fidelity
speakers
均正对听音者
,
导向孔设计往下出声或往后出声
,
音腔采用独
0
引言
本产品目标是研发一款适合广电行业用户的中高端有线电
立悬挂式腔体
。
具有如下特点
:
1-
圆形大口径扬声器为全频扬声器
,
其出声方向向前,
视消费类产品
,
该产品以
TVOS
3.x
软件依托
、
以高带宽的接
入网为支撑
、
以智能语音云平台为基础
、
以家庭中高端消费类
前出声方式对声音各频段衰减均较小
,
能够较好的到达前方听
者的耳朵里
;
电子产品外观形象为突破
,
构建家庭影音中心,
牢固占领百姓
客厅大屏主阵地
,
全力打造
“
客厅文化先锋
、
视频服务专家
”
的广电运营商品牌形象
,
也为新一代的户内智能融合终端奠定
2.
球顶高音成发散状
,
能够很好的扩展其高频到达区域,
往前方出声,
能够很好弥补全频扬声器衰减的部分高频
;
3.
前出声口呈喇叭状结构
,
能够很好的扩展各频段的指向
了技术基础。
该产品的关键部件包括智能音箱
、
拾音
MIC
阵列
、
4K
机顶盒
。
本文主要讨论智能音箱和拾音
MIC
阵列部件的设计
。
性
;
4
.
倒相管往后出声
,其发出的低频声基本无指向性
,
可以
1
产品结构设计
1.1
音箱腔体结构设计整体要求
该结构采用全频扬声器
+
球顶高音方式
,
所有出声方向
广播与电视技术
[
2019
年•第
46
卷•第
10
期
〕
较好的到达听者的耳朵里
;
5.
前出声区域采用蒙布或钢网
,
以减少对声音的衰减
;
6.
整改箱体必须密闭
;
77
CATV
7
.
根据调音情况
,
内部适当增加吸音棉
;
8.
扬声器悬挂系统采用
“
分体式
”
独立悬挂设计
,
有效保
证了扬声器的低音厚实的效果
,
而同时提高了扬声器的音量
。
拾音孔
1
拾音孔
2
1
.2
拾音
MIC
阵列结构设计
1.
MIC
阵形和间距
6MIC
方案设计采用环阵采用环阵
,
其中
MIC
孔中心组
麦克风
1
麦克风
2
图
3
面壳安装方式声腔结构示意图
成的圆直径大约
7
〜
8cm,
如图
2
所示两种
MIC
布局方案
。
拾音孔深
音箱外壳
6MIC
要求
MIC
拾音平面和水平面夹角
<15
度
,
且
MIC
之间无遮挡或之间无遮挡或引起声学反射部件存在
。
2.
麦克风结构安装方案
根据产品结构型式和产品需求
,
该产品的麦克风阵列的结
*
麦克风
构设计采用面壳安装方式
。
图
4
单个麦克风声腔设计示意图
该结构方案麦克风阵列和硅胶套装配后固定于面壳上
,
通
过面壳上的拾音孔进行录音采集
。
析
;
语音识别端侧算法使用自研算法
,
6mic
拾音
;
音箱采用
360
度环绕音箱
,
确保了音效品质
。
内置双频
WiFi
客户端
、
蓝牙彳
」
模组
、
1
」
声道
30W
数字功放
、
6MIC
远场拾音方案
。
STB
主芯片搭载
2GB
DDR4,
8GB
EMMC
配置
;
整机音腔采
2
产品硬件设计
2.1
硬件系统框图
主芯片采用
3798CV200
方案
;
语音平台使用云端数据解
用悬挂腔体设计;电源采用外置电源适配器
19VZ3.5A
;
该产
品以
AI
人工智能云服务平台为核心
,
以云媒体
APP
客户端为
box
顶部做大
,主体结构内部有台阶,
这样
box
头部就卡在台阶内
EV
胶
配置界面
,
同时采用远场语音识别技术
,结合外围智能家居设
备
,
实现通过
APP
、
语音对话等方式对AI
智能音箱机顶盒进
行音视频的播放操控及智能家居设备进行智能化控
。整机系统
硅胶垫
框图和整机接线图如图
5
。
BOX
主体结构
1.
解码芯片采用
HI3798CV200
芯片
,
支持彳
KP60
输出
,
集成
3D
GPU,
音频支持
MPEG1
、
MPEG2
、
MP3
等
,
视频
支持
MPEG1
、
MPEG2
、
MPEG#
、
H.264
s
H.265、
AVS2。
采
工字形硅胶垫圈
,
嵌入反射锥的孔内
用
2GB
DDR4,
8GB
EMMC
配置
,
使用
Full
band
tuner,
内置
||
低氐音嗽叭
|T
RTL8822
双频
WiFi+
蓝牙模块
。
2.
MIC
部分
:使用
6
路
mic拾音
,
连接到
2
颗
ADC
螺丝
反射锥
芯片
,
通过
I2S
与
98CV200交互
。
在功放输入端连接
1
颗
图
1
音箱内部示意图
ADC,
作为回声消除采样信号
,
ADC
芯片使用芯唐公司的
NAU85LOA
。
3.
灯板部分
:
具有
2
彳颗
RGB
LED,
氛围灯效果
,
驱动
Q
O
选择二
C
芯片使用
IS31F3236A
。
4.
音箱部分
:
功放采样模拟功放
,
低音功率
20W,
高音
选择一
0
;
30
度
30
度
o
O
功率达
10W,
使用品牌音箱认证
。
2.2
功放子板电路设计
功放支持
1
」
channel
设计
,
具备回音消除功能
。
采用两
正前方
0
正前方
颗
TAS5756M
芯片
,
如图
6
所示
,
AI
智能音箱机顶盒输出的
I2S
分别送给两颗TAS5756M
做复用
,
一颗芯片工作在
Stereo
图
2
MIC
布局设计
模式
,
并将
DSP
处理以后的
I2S
信号
bypass
输出作为回音
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
78
消除参考信号
;
另外一颗芯片工作在Mono
模式
,
负责推动
subwoofer
扬声器
°
将功放
bypass
输出的
I2S
信号用
DAC
还原为模拟音频信
号以后
,
再用
16kHz
采样率的
ADC
将模拟音频信号转换成
I2S
信号,该信号回传给麦克风阵列,作为回音消除的参考信号,
如图
7
所示
。
法库
()
,
编译安装
()
的修
3
产品软件设计
3.1
MIC
阵列模块音频子系统结构
MIC
集成主要是对适配圭寸装库
(
libbd_audio_
),
算
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
改
,
无需直接调用算法
API,
使用适配封装库中提供的
API
代替
AudioHal
层中相关的
tiny
al
sa
调用即可
,
改动
Andrioid.
mk
的关联
,
实现对麦克风算法的移植使用
,
适配封装库基于
79
CATV
Audio
Flinger
Audio
Flinger
t
AudioHAL
Playback
^^^
AudioHAL
Capture
T
AudioHAL
Playback
▼
I
AudioHAL
Capture
libbd_audio_
•
audio_vdev_init
().
♦
|]
pcm_open()
1.
pcm_read()
][
pcm_close(
]
libtinyalsa
audio_vdev_read()
•
■
dio
vdev
close():
|
pcm_open()
|.
pcm_read()
.|
pcm_clos^
1
libtinyalsa
Kernel
图
8
MIC
阵列模块音频子系统结构图
tinyalsa 封装
。
3.2
远场智能语音软件功能模块
远场智能语音软件实现上为
2
个
APK
应用程序
,
分别为
语音平台
资源平台
HTTP
HTTP
语音程序服务端与语音程序
UI
端
,
双方进程间通过
SOCKET
编程使用
TCP/IP
协议进行数据通信
,
数据封装格式为
JSON,
自定义的通信协议对语音的操作意图及云平台的技能操作(
如
语音程序服务端
API
TTS
播报等
)
定义了一个通用的格式描述,
语音程序
UI
端对
着这个格式去进行功能实现即可
,
而不用关心这个操作意图
是对接哪个语音平台怎样获取的以及一些技能操作需要如何
语音采集
第三方
APK
机顶盒
实现
。同样
,
语音程序服务端只用关心何种情况会发起这个
意图
(
可能是平台直接返回语义理解后的分类
,
也可能是我
图
9
模块间结构设计示意图
们直接自定义关键字所指向的意图
)
,
而不用关心具体意图的
实现
,
这样可以降低不同模块间的耦合度
,
提升开发及维护
意图后
,
会对意图进行相应处理,
包括进行系统级别操作
,
对
接资源平台获取信息数据并展示
,
以及调用第三方
APK接口
效率
。
进行相关操作等
。
最后把需要使用语音平台技能
(
如
TTS播
报等
)
的需求返给语音程序服务端进行处理
。
远场智能语音软件与
AI
智能语音平台间通信流程见图
10
。
远场智能语音软件与
AI
智能音箱机顶盒其他模块及外部
语音平台间结构设计见图
9
。
语音程序服务端主要负责与第三方语音平台进行对接
,
调
用语音平台提供技能接口等
。
如图所示
,
语音程序服务端通过
AudioRecorder
采集语音数据
,
上报语音平台并接收语音平台
3.3
多网卡网络设计方法
1.
需求背景
多网卡的机顶盒
,
一个连接内网
,
一个连接外网
,
要以外
进行语音识别及语义理解后的结果
,
最后组成操作意图后发送
给语音程序
UI
端
,
同时根据语音程序
UI
端反馈的语音平台
技能需求(
如
TTS
播报等
)
进行相应实现
。
网为主
,
内网的访问需要走路由控制
,
同时路由表可在线设置
。
2.
实现方案
终端底层先填写默认的路由表信息,
首次开机完成之后应
用通过
IP方式
,
通过默认路由表信息访问内网前端服务获取
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
语音程序
UI
端主要负责语音操作意图的具体实现
。
如图
所示
,
语音程序
UI
端在接收语音程序服务端发来的语音操作
80
CATV
I
有线网络
终端应用
porting
开机完成之后
前端路由表服务
获取最新路由表信息
返回结果
解析信息版本并与以保存版本对比
版本发星变化时
,
按照指定规则需接路由表信息
I
设置最新的路由表信息
'
----------------
返回设置成功
图
12
下次开机流程图
终端应用
porting
前端路由表服务
规则拼接出来
,以
json
定义中
json
内容拼接举例:
”
10.0.0.0/811
72.0.0.0/81172.18.0.0/161172.16.128.0/17110.192.0.0/12"
应用访问前端接口
:
应用访问前端接口可以通过
http
请
通过默认路由表访问前端路由表服务
,
获取路由表信息
返回路由表信息
-----------
1
------------------------------
解析获取保存路由表版本
按照指定格式拼接路由表信息
求
Json
定义
:
应用通过
ip
方式访问前端获取到的路由表信
将拼接好的路由表信息设置纟合底层
息是一个
json
格式文件
,
信息格式如下
:
{
设置成功
"version":
1.0,
"ip":
图
11
首次开机流程图
[
"10.0.0.0/8",
最新的路由表信息,
解析并保存信息版本
,同时将新的路由表
信息按照指定格式拼接成字符串设置给底层
。
首次以外的开机
"172.16.0.0/12"
],
"dns":
完成之后
,
应用通过已保存的路由表信息访问内网前端服务器
获取最新路由表信息
,
解析获取信息版本
,
与已经保存的版本
[
"111.209.253.2/32",
进行对比
,
看是否有变化
,
如果有变化将最新的路由表信息按
照指定格式拼接成字符串设置给底层
;
如果没有变化
,
则执行
其他流程
;
开机双网通了就请求在线路由表
,
否则
24
小时请
"192.168.2.2/32",
"172.31.253.242/32"
求一次在线路由表
。
]
}
其中
version
表示信息版本
,
ip
表示服务器ip
地址
。
6
平台软件实现细节
3.
具体流程图
如图
11,
如果版本有更新需要将最新的路由表信息设置
给底层
,
如果信息版本没变化
,
则继续执行其它流程
。
4.
网络拓扑图
网络拓扑图如图
13所示
。
开机判断平台的属性或运行过程中收到平台的广播
,
触发
该事件
(平台提供属性和广播名称
)
请求前端的一个配置文件
,
请求到了则调用lmux
shell,
设置解析文件的路由网段给系统
,同时获取无线网卡的网关设
5.
接口说明
JS
接口
:
应用可以通过
ioctlWrite
(
name,
value
)
接口设置
路由表信息
,
其中
name
取值为"
routing^table"
,
value
取值为
置系统默认路由
(
命令和无线网卡的设备命名平台给出
)
。
请求不到则不做设置
,
注意发起请求的规则
,
请求一次,
路由表信息字符串
。
字符串是根据
json
内容按照指定的拼接
广播与电视技术
[2019
年•第
46
卷•第
10
期
〕
81
CATV
升视频播放体验
,
利用无线投屏与
同屏镜像
,
将手机小屏丰富的内容
、
娱乐等生态延伸至电视大屏
,
打造
大小屏结合的新生态
。
5.
具备紧急情况下自动播报语
音预警信息的能力
集成国家应急广播规范
,
利用
7x24
小时待机的内置高保真音箱,
将突发公共事件
、
党和政府重要消
息
、
社区紧急通知
,
在第一时间告
知用户
,
确保消息发布的时效性,
便于用户在第一时间做出响应
,
将
无法连接则重复请求
,
当连接正常
,
但服务器返回异常或其他
生命财产损失降到最低
。
原因则不再请求
,
保证有效请求只做一次
。
5
应用推广
以我国
“
互联网
+
”
、
人工智能战略的逐步实施为契机,
结合数字电视终端技术发展需求
,
规模化生产基于
AI
云平台
4
技术创新点
1.
全球首款
AI+DVB
智能音箱机顶盒
集
4K
P60
超高清有线电视机顶盒、
高品质
360
度环绕音
的
AI
智能高保真音箱机顶盒
,
不仅将为苏州市
“
互联网
+
”
、
人工智能实施建设提供有力的产品支撑
,
扩大基于
AI
云平台
的家联网终端产品技术应用
,
而且将进一步提高信息技术支撑
服务民生建设的能力
,
推动更多
、
更好的人工智能成果惠及广
箱于一体
,
音质远超市场主流的智能音箱
,
通过集成智能语音
引擎
、
DVB-C
有线数字电视协议
、
RTSP
与
HLS
互联网点播
协议
、
DLNA
与
Miracast
无线投屏协议等规范
,
实现了视音频
体验中心
、
互联网视频汇聚中心
、
智慧家庭中心
、
家庭娱乐中
心
、
家庭预警中心等家庭五大中心功能
。
2.
创新设计的远场拾音麦克风阵列
大人民群众
。
本产品在研发阶段主要是放置于江苏有线与上海海思在
苏州分公司智能融合终端实验室的家庭体验区内
,
经过长达
半年的研发测试及对外展示
,
接待行业内外参观领导
、
团队
配置六个麦克风输入通道与两个音响回传参考通道
,
内
置独有的语音降噪
、
回声消除
、
方向定位
、
波束成型等算法,
1000
多人次
,
在语音唤醒
、
语音识别
、
语义执行等几个关键
通过端云结合的智能语音识别
,
在外部噪声
、本机自发声
、
电视干扰声等场景下
,
远场拾音距离达到5m
以上,
抗干扰能
指标上均表现良好
,
达到或超过行业主流产品的效果
。
在此基础上
,
在
2019
年
7
月初
,
小规模量产了
500
台
,
力达到行业顶尖水平整机唤醒率与识别率均达到行业领先水
进行友好用户的内测
,
经过
1
个多月的用户使用情况跟踪
,
目
前产品效果完全符合设计要求
,
能够大批量推向市场
。
平
,
并通过软件创新设计
,
实现远场语音与近场语音的自由
切换
。
3.
全新专利外观设计
,
独特的结构设计
360
度环形交互灯效结合悬浮的语音交互模块
,
凸显产品
科技感
,
内置的高保真音箱
,
采用全频
+
低音两路喇叭设计,
使用倒相式箱体结构
,
有效提升低频量感
,
系统低频清晰饱满,
计划
2019
年
10
月初规模推向市场
。
初期先覆盖苏州地区
,
逐步推广至省内其它地区
,
预计每年新增
20
万台
。
同时向省
外广电运营商推介该产品
,
预计后续本产品年产量可达
50
万
台以上
。
中高频圆润细腻
,
以较小的容积获得了中型音箱的效果
。
4.
中国自主知识产权的电视操作系统TVOS
3.1
的首批商
6
结束语
随着人工智能技术的普及
,
用户对这类便捷操控的
AI
智
用
通过对
TVOS
3.1底层硬件适配处理确保
AI
智能业务可
能控制的机顶盒的需求也必然会增加
,
远场语音操控的智能机
顶盒
,
智能电视等会逐步成为家庭智能化的入口
。
所以从目前
的情况推测
,
未来远场语音控制用在智能机顶盒
,
展示在电视
管可控
,
并采用独特的多网卡网络设计
,
通过对
DLNA
与
Miracast
等协议优化处理
,
加快无线连接
、
降低传输时延
、
提
这样的大屏上一定非常具有前景
。
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
82
Wireless
Coverage
I
无线覆盖
【
本文献信息
】
韩鹏.解决大功率短波广播节目覆盖盲区的方案
[
J
]
.
广播与电视技术
,
2019,
Vol.
46(10).
覆盖盲区的方案
韩鹏
(青海省广播电视局五六六台
,
青海
810000
)
【
摘要
】
在地广人稀的青藏高原
,
大功率短波广播是对广袤牧区进行广播覆盖最经济
、
最有效
、
最便捷的途径
。
而主要
通过天波传输的大功率短波发射台因为静区效应
,
导致台站在离天波最近的落地点有近
70
〜
130km
的短波广播覆盖盲区
,
这种情况无法满足广大牧区对广播节目全覆盖的要求
。
本文分析短波广播覆盖盲区形成的原因
,
提出了减缩覆盖盲区范围
的方案
,
采用具有良好表现的近垂直入射天波成功解决了我省短波广播覆盖盲区的问题
。
【
关键词
】
短波广播
,
覆盖盲区
,
静区效应
,近垂直入射天波
【
中图分类号
】
TN93
【
文献标识码
】
B
【
DOI
编码
】
10.16171/.2
A
Solution
of
High
Power
HF
Radio
Program
Coverage
Against
Blind
Area
Han
Peng
(566 Station
of
Qinghai
Provincial
Radio
and
Television
Bureau,
Qinghai
810000,
China)
Abstract
In
the
vast
and
sparsely
populated
Qinghai-Tibet
Plateau,
high
power
HF
radio
is
the
most
economical,
effective
and
convenient
way
to
broadcast
in
vast
pastoral
areas.
The
HF
radio
mainly
transmits
through
sky
wave.
Because
of
the
effect
of
silence
zone,
there
is
nearly
70-130
kilometers
of
HF
radio
blind
coverage
around
the
nearest
landing
site
of
the
station.
This
is
difficult
to
meet
the
requirements
of
the
vast
pastoral
coverage
of
radio
programs.
This
paper
analyses
the
causes
of
HF
broadcasting
blind
coverage.
A
solution
of
high
power
HF
radio
program
coverage
against
blind
area
is
proposed.
The
NVIS
with
good
performance
has
successfully
solved
the
problem
of
HF
broadcasting
blind
coverage
in
Qinghai
province.
Keywords
HF
radio,
Covering
blind-area,
Effect
of
silence
zone,
NVIS
然受到新媒体等先进信息传播途径的影响比较大
,
但短波这一
0
引言
青海省作为一个经济发展落后的西部多民族省份
,
广播覆
古老和传统的通信方式在我省仍然受到相当程度的重视
,
短
波广播不仅没有被淘汰
,
还在快速发展
。
由于其自身优势,
可
以有效地覆盖国土面积
,
可满足类似我省这样地域广袤
、
人口
盖在全省广大牧区中有着极为重要的地位
。
进入
21
世纪
,在
卫星通信
、
移动通信
、
宽带网络快速发展的今天
,
短波广播虽
稀少
、
聚集零散
、
基础设施落后的民族地区
。
我省牧区群众在
由于目前
AI
智能机顶盒的价格还是偏高
,
所以用户数量
的增加有一个逐步上升的过程
,
等到
MIC
远场拾音模块趋于
参考文献
:
[
1
]
臧亮
.
国内智能音箱行业发展状况研究
[
R
]
.
2018
(
11
).
平价化后
,
该类
AI
智能机顶盒数量的增加会达到峰值
。
本文主要对
AI
智能音箱机顶盒的关键部件包括智能音箱
、
拾音
MIC
阵列的设计进行了初步的阐述
,
广电运营商对于此
[
2
]
万声国
.
基于语音识别的智能
WIFI
音箱
[
D
]
.
东南大学
;
2017
.
作者简介
:
马振洲
,
男,
1983
年生
,
硕士
,
通信与信息系统专业
,工
程师
,
主要从事有线电视智能终端相关技术研究
。
类产品接触不多
,对相关运营商及生产厂商研究类似形态的产
品有一定的参考意义
。
EH33
广播与电视技术
[
2019
年•第
46
卷•第
10
期
〕
83
2024年4月12日发(作者:鄂悦怡)
CATV
【
本文献信息
】
马振洲
.AI
智能音箱机顶盒的关键部件设计与实现
[
J
]
.
广播与电视技术
,
2019,
Vol.
46(10).
I
有线网络
Al
智能音箱机顶盒的
关键部件设计与实现
马振洲
(江苏省广电有线信息网络股份有限公司苏州分公司
,
江苏
215008)
【
摘要
】
随着人工智能大规模应用即将来临
,
普通用户和运营商都非常需要一款集音箱和盒子为一体的人工智能终端产品
,
能够语音远场控制
,
解放用户的双手
,
让用户在家庭环境中尽享高科技带来的便捷生活。
因此本文提出了关于
“
远场语音
操控+智能音箱
+4K
机顶盒
”
的业务融合智能终端产品的设计思路并加以实现
,
以此来确保江苏有线在智慧家庭战略布
局中的核心能力和地位
。
【
关键词
】
人工智能
,
远场语音
,
高保真音箱
【
中图分类号
】
TP393
【
文献标识码
】
B
【
DOI
编码
】
10.16171/.2
Design
of
Key
Component
in
Integrated
AI
Smart
Speaker
and
STB
Ma
Zhenzhou
(Suzhou
Branch,
Jiangsu
Broadcasting
Cable
Information
Network
Co.,
Ltd.,
Jiangsu
215006,
China)
Abstract
With
the
advent
of
large-scale
application
of
artificial
intelligence,
both
users
and
operators
are
in
great
need of
an
artificial
intelligence
terminal
integrated
speaker
and
STB.
It
can
control
far
field
and
free
the
user's
hands,
allowing
users
to
enjoy
home.
The
convenient
life
is
brought
by
advanced
technology.
This
paper
proposed
the
concept
of
"far-field
voice
control
+
smart
speaker
+
4K
set-top
box"
business
integration
intelligent
termina,
in
order
to
ensure
the
core
competence
of Jiangsu
Broadcasting
Cable
Information
Network
Co.,
Ltd.,
in
the
strategic
arrangement
of
smart
home.
Keywords
Artificial
intelligence,
Far-field
voice,
High-fidelity
speakers
均正对听音者
,
导向孔设计往下出声或往后出声
,
音腔采用独
0
引言
本产品目标是研发一款适合广电行业用户的中高端有线电
立悬挂式腔体
。
具有如下特点
:
1-
圆形大口径扬声器为全频扬声器
,
其出声方向向前,
视消费类产品
,
该产品以
TVOS
3.x
软件依托
、
以高带宽的接
入网为支撑
、
以智能语音云平台为基础
、
以家庭中高端消费类
前出声方式对声音各频段衰减均较小
,
能够较好的到达前方听
者的耳朵里
;
电子产品外观形象为突破
,
构建家庭影音中心,
牢固占领百姓
客厅大屏主阵地
,
全力打造
“
客厅文化先锋
、
视频服务专家
”
的广电运营商品牌形象
,
也为新一代的户内智能融合终端奠定
2.
球顶高音成发散状
,
能够很好的扩展其高频到达区域,
往前方出声,
能够很好弥补全频扬声器衰减的部分高频
;
3.
前出声口呈喇叭状结构
,
能够很好的扩展各频段的指向
了技术基础。
该产品的关键部件包括智能音箱
、
拾音
MIC
阵列
、
4K
机顶盒
。
本文主要讨论智能音箱和拾音
MIC
阵列部件的设计
。
性
;
4
.
倒相管往后出声
,其发出的低频声基本无指向性
,
可以
1
产品结构设计
1.1
音箱腔体结构设计整体要求
该结构采用全频扬声器
+
球顶高音方式
,
所有出声方向
广播与电视技术
[
2019
年•第
46
卷•第
10
期
〕
较好的到达听者的耳朵里
;
5.
前出声区域采用蒙布或钢网
,
以减少对声音的衰减
;
6.
整改箱体必须密闭
;
77
CATV
7
.
根据调音情况
,
内部适当增加吸音棉
;
8.
扬声器悬挂系统采用
“
分体式
”
独立悬挂设计
,
有效保
证了扬声器的低音厚实的效果
,
而同时提高了扬声器的音量
。
拾音孔
1
拾音孔
2
1
.2
拾音
MIC
阵列结构设计
1.
MIC
阵形和间距
6MIC
方案设计采用环阵采用环阵
,
其中
MIC
孔中心组
麦克风
1
麦克风
2
图
3
面壳安装方式声腔结构示意图
成的圆直径大约
7
〜
8cm,
如图
2
所示两种
MIC
布局方案
。
拾音孔深
音箱外壳
6MIC
要求
MIC
拾音平面和水平面夹角
<15
度
,
且
MIC
之间无遮挡或之间无遮挡或引起声学反射部件存在
。
2.
麦克风结构安装方案
根据产品结构型式和产品需求
,
该产品的麦克风阵列的结
*
麦克风
构设计采用面壳安装方式
。
图
4
单个麦克风声腔设计示意图
该结构方案麦克风阵列和硅胶套装配后固定于面壳上
,
通
过面壳上的拾音孔进行录音采集
。
析
;
语音识别端侧算法使用自研算法
,
6mic
拾音
;
音箱采用
360
度环绕音箱
,
确保了音效品质
。
内置双频
WiFi
客户端
、
蓝牙彳
」
模组
、
1
」
声道
30W
数字功放
、
6MIC
远场拾音方案
。
STB
主芯片搭载
2GB
DDR4,
8GB
EMMC
配置
;
整机音腔采
2
产品硬件设计
2.1
硬件系统框图
主芯片采用
3798CV200
方案
;
语音平台使用云端数据解
用悬挂腔体设计;电源采用外置电源适配器
19VZ3.5A
;
该产
品以
AI
人工智能云服务平台为核心
,
以云媒体
APP
客户端为
box
顶部做大
,主体结构内部有台阶,
这样
box
头部就卡在台阶内
EV
胶
配置界面
,
同时采用远场语音识别技术
,结合外围智能家居设
备
,
实现通过
APP
、
语音对话等方式对AI
智能音箱机顶盒进
行音视频的播放操控及智能家居设备进行智能化控
。整机系统
硅胶垫
框图和整机接线图如图
5
。
BOX
主体结构
1.
解码芯片采用
HI3798CV200
芯片
,
支持彳
KP60
输出
,
集成
3D
GPU,
音频支持
MPEG1
、
MPEG2
、
MP3
等
,
视频
支持
MPEG1
、
MPEG2
、
MPEG#
、
H.264
s
H.265、
AVS2。
采
工字形硅胶垫圈
,
嵌入反射锥的孔内
用
2GB
DDR4,
8GB
EMMC
配置
,
使用
Full
band
tuner,
内置
||
低氐音嗽叭
|T
RTL8822
双频
WiFi+
蓝牙模块
。
2.
MIC
部分
:使用
6
路
mic拾音
,
连接到
2
颗
ADC
螺丝
反射锥
芯片
,
通过
I2S
与
98CV200交互
。
在功放输入端连接
1
颗
图
1
音箱内部示意图
ADC,
作为回声消除采样信号
,
ADC
芯片使用芯唐公司的
NAU85LOA
。
3.
灯板部分
:
具有
2
彳颗
RGB
LED,
氛围灯效果
,
驱动
Q
O
选择二
C
芯片使用
IS31F3236A
。
4.
音箱部分
:
功放采样模拟功放
,
低音功率
20W,
高音
选择一
0
;
30
度
30
度
o
O
功率达
10W,
使用品牌音箱认证
。
2.2
功放子板电路设计
功放支持
1
」
channel
设计
,
具备回音消除功能
。
采用两
正前方
0
正前方
颗
TAS5756M
芯片
,
如图
6
所示
,
AI
智能音箱机顶盒输出的
I2S
分别送给两颗TAS5756M
做复用
,
一颗芯片工作在
Stereo
图
2
MIC
布局设计
模式
,
并将
DSP
处理以后的
I2S
信号
bypass
输出作为回音
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
78
消除参考信号
;
另外一颗芯片工作在Mono
模式
,
负责推动
subwoofer
扬声器
°
将功放
bypass
输出的
I2S
信号用
DAC
还原为模拟音频信
号以后
,
再用
16kHz
采样率的
ADC
将模拟音频信号转换成
I2S
信号,该信号回传给麦克风阵列,作为回音消除的参考信号,
如图
7
所示
。
法库
()
,
编译安装
()
的修
3
产品软件设计
3.1
MIC
阵列模块音频子系统结构
MIC
集成主要是对适配圭寸装库
(
libbd_audio_
),
算
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
改
,
无需直接调用算法
API,
使用适配封装库中提供的
API
代替
AudioHal
层中相关的
tiny
al
sa
调用即可
,
改动
Andrioid.
mk
的关联
,
实现对麦克风算法的移植使用
,
适配封装库基于
79
CATV
Audio
Flinger
Audio
Flinger
t
AudioHAL
Playback
^^^
AudioHAL
Capture
T
AudioHAL
Playback
▼
I
AudioHAL
Capture
libbd_audio_
•
audio_vdev_init
().
♦
|]
pcm_open()
1.
pcm_read()
][
pcm_close(
]
libtinyalsa
audio_vdev_read()
•
■
dio
vdev
close():
|
pcm_open()
|.
pcm_read()
.|
pcm_clos^
1
libtinyalsa
Kernel
图
8
MIC
阵列模块音频子系统结构图
tinyalsa 封装
。
3.2
远场智能语音软件功能模块
远场智能语音软件实现上为
2
个
APK
应用程序
,
分别为
语音平台
资源平台
HTTP
HTTP
语音程序服务端与语音程序
UI
端
,
双方进程间通过
SOCKET
编程使用
TCP/IP
协议进行数据通信
,
数据封装格式为
JSON,
自定义的通信协议对语音的操作意图及云平台的技能操作(
如
语音程序服务端
API
TTS
播报等
)
定义了一个通用的格式描述,
语音程序
UI
端对
着这个格式去进行功能实现即可
,
而不用关心这个操作意图
是对接哪个语音平台怎样获取的以及一些技能操作需要如何
语音采集
第三方
APK
机顶盒
实现
。同样
,
语音程序服务端只用关心何种情况会发起这个
意图
(
可能是平台直接返回语义理解后的分类
,
也可能是我
图
9
模块间结构设计示意图
们直接自定义关键字所指向的意图
)
,
而不用关心具体意图的
实现
,
这样可以降低不同模块间的耦合度
,
提升开发及维护
意图后
,
会对意图进行相应处理,
包括进行系统级别操作
,
对
接资源平台获取信息数据并展示
,
以及调用第三方
APK接口
效率
。
进行相关操作等
。
最后把需要使用语音平台技能
(
如
TTS播
报等
)
的需求返给语音程序服务端进行处理
。
远场智能语音软件与
AI
智能语音平台间通信流程见图
10
。
远场智能语音软件与
AI
智能音箱机顶盒其他模块及外部
语音平台间结构设计见图
9
。
语音程序服务端主要负责与第三方语音平台进行对接
,
调
用语音平台提供技能接口等
。
如图所示
,
语音程序服务端通过
AudioRecorder
采集语音数据
,
上报语音平台并接收语音平台
3.3
多网卡网络设计方法
1.
需求背景
多网卡的机顶盒
,
一个连接内网
,
一个连接外网
,
要以外
进行语音识别及语义理解后的结果
,
最后组成操作意图后发送
给语音程序
UI
端
,
同时根据语音程序
UI
端反馈的语音平台
技能需求(
如
TTS
播报等
)
进行相应实现
。
网为主
,
内网的访问需要走路由控制
,
同时路由表可在线设置
。
2.
实现方案
终端底层先填写默认的路由表信息,
首次开机完成之后应
用通过
IP方式
,
通过默认路由表信息访问内网前端服务获取
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
语音程序
UI
端主要负责语音操作意图的具体实现
。
如图
所示
,
语音程序
UI
端在接收语音程序服务端发来的语音操作
80
CATV
I
有线网络
终端应用
porting
开机完成之后
前端路由表服务
获取最新路由表信息
返回结果
解析信息版本并与以保存版本对比
版本发星变化时
,
按照指定规则需接路由表信息
I
设置最新的路由表信息
'
----------------
返回设置成功
图
12
下次开机流程图
终端应用
porting
前端路由表服务
规则拼接出来
,以
json
定义中
json
内容拼接举例:
”
10.0.0.0/811
72.0.0.0/81172.18.0.0/161172.16.128.0/17110.192.0.0/12"
应用访问前端接口
:
应用访问前端接口可以通过
http
请
通过默认路由表访问前端路由表服务
,
获取路由表信息
返回路由表信息
-----------
1
------------------------------
解析获取保存路由表版本
按照指定格式拼接路由表信息
求
Json
定义
:
应用通过
ip
方式访问前端获取到的路由表信
将拼接好的路由表信息设置纟合底层
息是一个
json
格式文件
,
信息格式如下
:
{
设置成功
"version":
1.0,
"ip":
图
11
首次开机流程图
[
"10.0.0.0/8",
最新的路由表信息,
解析并保存信息版本
,同时将新的路由表
信息按照指定格式拼接成字符串设置给底层
。
首次以外的开机
"172.16.0.0/12"
],
"dns":
完成之后
,
应用通过已保存的路由表信息访问内网前端服务器
获取最新路由表信息
,
解析获取信息版本
,
与已经保存的版本
[
"111.209.253.2/32",
进行对比
,
看是否有变化
,
如果有变化将最新的路由表信息按
照指定格式拼接成字符串设置给底层
;
如果没有变化
,
则执行
其他流程
;
开机双网通了就请求在线路由表
,
否则
24
小时请
"192.168.2.2/32",
"172.31.253.242/32"
求一次在线路由表
。
]
}
其中
version
表示信息版本
,
ip
表示服务器ip
地址
。
6
平台软件实现细节
3.
具体流程图
如图
11,
如果版本有更新需要将最新的路由表信息设置
给底层
,
如果信息版本没变化
,
则继续执行其它流程
。
4.
网络拓扑图
网络拓扑图如图
13所示
。
开机判断平台的属性或运行过程中收到平台的广播
,
触发
该事件
(平台提供属性和广播名称
)
请求前端的一个配置文件
,
请求到了则调用lmux
shell,
设置解析文件的路由网段给系统
,同时获取无线网卡的网关设
5.
接口说明
JS
接口
:
应用可以通过
ioctlWrite
(
name,
value
)
接口设置
路由表信息
,
其中
name
取值为"
routing^table"
,
value
取值为
置系统默认路由
(
命令和无线网卡的设备命名平台给出
)
。
请求不到则不做设置
,
注意发起请求的规则
,
请求一次,
路由表信息字符串
。
字符串是根据
json
内容按照指定的拼接
广播与电视技术
[2019
年•第
46
卷•第
10
期
〕
81
CATV
升视频播放体验
,
利用无线投屏与
同屏镜像
,
将手机小屏丰富的内容
、
娱乐等生态延伸至电视大屏
,
打造
大小屏结合的新生态
。
5.
具备紧急情况下自动播报语
音预警信息的能力
集成国家应急广播规范
,
利用
7x24
小时待机的内置高保真音箱,
将突发公共事件
、
党和政府重要消
息
、
社区紧急通知
,
在第一时间告
知用户
,
确保消息发布的时效性,
便于用户在第一时间做出响应
,
将
无法连接则重复请求
,
当连接正常
,
但服务器返回异常或其他
生命财产损失降到最低
。
原因则不再请求
,
保证有效请求只做一次
。
5
应用推广
以我国
“
互联网
+
”
、
人工智能战略的逐步实施为契机,
结合数字电视终端技术发展需求
,
规模化生产基于
AI
云平台
4
技术创新点
1.
全球首款
AI+DVB
智能音箱机顶盒
集
4K
P60
超高清有线电视机顶盒、
高品质
360
度环绕音
的
AI
智能高保真音箱机顶盒
,
不仅将为苏州市
“
互联网
+
”
、
人工智能实施建设提供有力的产品支撑
,
扩大基于
AI
云平台
的家联网终端产品技术应用
,
而且将进一步提高信息技术支撑
服务民生建设的能力
,
推动更多
、
更好的人工智能成果惠及广
箱于一体
,
音质远超市场主流的智能音箱
,
通过集成智能语音
引擎
、
DVB-C
有线数字电视协议
、
RTSP
与
HLS
互联网点播
协议
、
DLNA
与
Miracast
无线投屏协议等规范
,
实现了视音频
体验中心
、
互联网视频汇聚中心
、
智慧家庭中心
、
家庭娱乐中
心
、
家庭预警中心等家庭五大中心功能
。
2.
创新设计的远场拾音麦克风阵列
大人民群众
。
本产品在研发阶段主要是放置于江苏有线与上海海思在
苏州分公司智能融合终端实验室的家庭体验区内
,
经过长达
半年的研发测试及对外展示
,
接待行业内外参观领导
、
团队
配置六个麦克风输入通道与两个音响回传参考通道
,
内
置独有的语音降噪
、
回声消除
、
方向定位
、
波束成型等算法,
1000
多人次
,
在语音唤醒
、
语音识别
、
语义执行等几个关键
通过端云结合的智能语音识别
,
在外部噪声
、本机自发声
、
电视干扰声等场景下
,
远场拾音距离达到5m
以上,
抗干扰能
指标上均表现良好
,
达到或超过行业主流产品的效果
。
在此基础上
,
在
2019
年
7
月初
,
小规模量产了
500
台
,
力达到行业顶尖水平整机唤醒率与识别率均达到行业领先水
进行友好用户的内测
,
经过
1
个多月的用户使用情况跟踪
,
目
前产品效果完全符合设计要求
,
能够大批量推向市场
。
平
,
并通过软件创新设计
,
实现远场语音与近场语音的自由
切换
。
3.
全新专利外观设计
,
独特的结构设计
360
度环形交互灯效结合悬浮的语音交互模块
,
凸显产品
科技感
,
内置的高保真音箱
,
采用全频
+
低音两路喇叭设计,
使用倒相式箱体结构
,
有效提升低频量感
,
系统低频清晰饱满,
计划
2019
年
10
月初规模推向市场
。
初期先覆盖苏州地区
,
逐步推广至省内其它地区
,
预计每年新增
20
万台
。
同时向省
外广电运营商推介该产品
,
预计后续本产品年产量可达
50
万
台以上
。
中高频圆润细腻
,
以较小的容积获得了中型音箱的效果
。
4.
中国自主知识产权的电视操作系统TVOS
3.1
的首批商
6
结束语
随着人工智能技术的普及
,
用户对这类便捷操控的
AI
智
用
通过对
TVOS
3.1底层硬件适配处理确保
AI
智能业务可
能控制的机顶盒的需求也必然会增加
,
远场语音操控的智能机
顶盒
,
智能电视等会逐步成为家庭智能化的入口
。
所以从目前
的情况推测
,
未来远场语音控制用在智能机顶盒
,
展示在电视
管可控
,
并采用独特的多网卡网络设计
,
通过对
DLNA
与
Miracast
等协议优化处理
,
加快无线连接
、
降低传输时延
、
提
这样的大屏上一定非常具有前景
。
广播与电视技术
[201
9
年•第
46
卷•第
10
期
〕
82
Wireless
Coverage
I
无线覆盖
【
本文献信息
】
韩鹏.解决大功率短波广播节目覆盖盲区的方案
[
J
]
.
广播与电视技术
,
2019,
Vol.
46(10).
覆盖盲区的方案
韩鹏
(青海省广播电视局五六六台
,
青海
810000
)
【
摘要
】
在地广人稀的青藏高原
,
大功率短波广播是对广袤牧区进行广播覆盖最经济
、
最有效
、
最便捷的途径
。
而主要
通过天波传输的大功率短波发射台因为静区效应
,
导致台站在离天波最近的落地点有近
70
〜
130km
的短波广播覆盖盲区
,
这种情况无法满足广大牧区对广播节目全覆盖的要求
。
本文分析短波广播覆盖盲区形成的原因
,
提出了减缩覆盖盲区范围
的方案
,
采用具有良好表现的近垂直入射天波成功解决了我省短波广播覆盖盲区的问题
。
【
关键词
】
短波广播
,
覆盖盲区
,
静区效应
,近垂直入射天波
【
中图分类号
】
TN93
【
文献标识码
】
B
【
DOI
编码
】
10.16171/.2
A
Solution
of
High
Power
HF
Radio
Program
Coverage
Against
Blind
Area
Han
Peng
(566 Station
of
Qinghai
Provincial
Radio
and
Television
Bureau,
Qinghai
810000,
China)
Abstract
In
the
vast
and
sparsely
populated
Qinghai-Tibet
Plateau,
high
power
HF
radio
is
the
most
economical,
effective
and
convenient
way
to
broadcast
in
vast
pastoral
areas.
The
HF
radio
mainly
transmits
through
sky
wave.
Because
of
the
effect
of
silence
zone,
there
is
nearly
70-130
kilometers
of
HF
radio
blind
coverage
around
the
nearest
landing
site
of
the
station.
This
is
difficult
to
meet
the
requirements
of
the
vast
pastoral
coverage
of
radio
programs.
This
paper
analyses
the
causes
of
HF
broadcasting
blind
coverage.
A
solution
of
high
power
HF
radio
program
coverage
against
blind
area
is
proposed.
The
NVIS
with
good
performance
has
successfully
solved
the
problem
of
HF
broadcasting
blind
coverage
in
Qinghai
province.
Keywords
HF
radio,
Covering
blind-area,
Effect
of
silence
zone,
NVIS
然受到新媒体等先进信息传播途径的影响比较大
,
但短波这一
0
引言
青海省作为一个经济发展落后的西部多民族省份
,
广播覆
古老和传统的通信方式在我省仍然受到相当程度的重视
,
短
波广播不仅没有被淘汰
,
还在快速发展
。
由于其自身优势,
可
以有效地覆盖国土面积
,
可满足类似我省这样地域广袤
、
人口
盖在全省广大牧区中有着极为重要的地位
。
进入
21
世纪
,在
卫星通信
、
移动通信
、
宽带网络快速发展的今天
,
短波广播虽
稀少
、
聚集零散
、
基础设施落后的民族地区
。
我省牧区群众在
由于目前
AI
智能机顶盒的价格还是偏高
,
所以用户数量
的增加有一个逐步上升的过程
,
等到
MIC
远场拾音模块趋于
参考文献
:
[
1
]
臧亮
.
国内智能音箱行业发展状况研究
[
R
]
.
2018
(
11
).
平价化后
,
该类
AI
智能机顶盒数量的增加会达到峰值
。
本文主要对
AI
智能音箱机顶盒的关键部件包括智能音箱
、
拾音
MIC
阵列的设计进行了初步的阐述
,
广电运营商对于此
[
2
]
万声国
.
基于语音识别的智能
WIFI
音箱
[
D
]
.
东南大学
;
2017
.
作者简介
:
马振洲
,
男,
1983
年生
,
硕士
,
通信与信息系统专业
,工
程师
,
主要从事有线电视智能终端相关技术研究
。
类产品接触不多
,对相关运营商及生产厂商研究类似形态的产
品有一定的参考意义
。
EH33
广播与电视技术
[
2019
年•第
46
卷•第
10
期
〕
83