2024年5月12日发(作者:红怜南)
基于百度指数的手机品牌热度聚类与趋势分析
刁宇捷
【摘 要】国内手机市场竞争激烈,通过手机品牌百度搜索指数数据分析,可以洞悉手
机品牌热度的变化趋势.应用趋势分析和K-Means聚类方法对2014年1月—
2017年4月40个月的手机品牌搜索指数进行趋势和聚类研究,结果表明:国外手机
品牌正逐渐失去国人的青睐,但iPhone还处于搜索指数排名第一的位置;国内手机
品牌热度近年呈现良好的上升态势,其中华为手机的表现尤为突出.
【期刊名称】《科技创业月刊》
【年(卷),期】2017(030)017
【总页数】3页(P14-16)
【关键词】手机品牌;品牌热度;百度指数;趋势;聚类分析
【作 者】刁宇捷
【作者单位】育明高中,辽宁大连116023
【正文语种】中 文
【中图分类】F416.6
我国是全球最大的手机消费市场,国内和国外的手机厂商都希望在竞争激烈的市场
中占有更大的份额。手机市场的竞争在相当程度上是手机品牌的竞争,手机品牌在
较短的时间中看上去比较稳定,但实际上随着时间的推移,一些手机品牌逐渐成长
壮大,而也有一些手机品牌逐渐淡出这个市场。百度指数是以海量网民关键词搜索
为基础的数据分享平台,通过对手机品牌搜索指数历史数据的提取,可以对不同热
度的手机品牌进行分类,并对手机品牌热度的趋势进行研究。
系统聚类和K-Means是两种较为常用的聚类算法,对大数据集进行分类时,系统
聚类执行效率不够理想,而K-Means聚类算法具有简单、高效的优点,特别对大
数据集分类时,它的可伸缩性和高效性表现得尤为明显。因此本文采用K-Means
算法对手机品牌热度进行聚类计算。
K-means算法是一种把数据集D中的N个样本点分为K类(K≤N)的聚类方法,
分类后同一类的样本点具有较好的相似性,不同类之间的样本点相似程度较低。该
算法的计算步骤如下:①在D中随机选取K个样本点,作为初始类中心;②按照
最相似的原则,即距离类中心最近的原则,将N个样本点分派给各类中心,形成
K个分类;③依次计算各类中样本点的均值,并以此值作为新的K个类中心;④
判断是否满足终止聚类的条件,即本次迭代的各类中心和上次迭代的各类中心是否
相同,如果满足条件则分类结束,如果不满足,转到第二步。
在上面的步骤中需要明确一个关键问题,即样本点之间的相似程度,相似程度的度
量方式有很多,其中用得最为广泛的是欧式距离。
这里相似程度的度量仅介绍本文所采取的欧式距离。假设数据集D中的每个样本
包含d个属性,设第i个样本点为xi={xi1,xi2,…,xid},第j个样本点为
xj={xj1,xj2,…,xjd},样本xi和xj距离d(xi,xj)来表示。d(xi,xj)以欧式距离来计算为:
欧式距离越小,相似程度越好,越有可能聚成一类;距离越大,相似程度越差,越
有可能属于不同的类。
百度是全球最大的中文搜索引擎和中文网站,百度指数是以海量网民的搜索行为为
基础的大数据分享平台。百度指数包含指数探索、品牌表现、数说专题和我的指数
4个模块。借助百度指数可以洞悉网民的需要变化、监测舆情的发展趋势、定位消
费者的特征、分析行业的动态和特点。学术界越来越多地认识到百度指数的数据价
值,近年来以百度指数为基础进行相关问题分析的论文有逐年加速上升的趋势。图
1展示了中国知网期刊库中2006—2016年间以百度指数为标题或关键字的论文
数量变化趋势。由图1可见,百度指数越来越成为数据分析与数据挖掘的数据来
源与依据。
对于手机行业品牌热度的分析,本文采用百度指数品牌表现模块中手机行业数据。
百度指数中的手机行业板块中,可以检索到手机行业品牌榜的月度、季度和年度榜
单。为了数据更精确,数据变化趋势更清晰,本文选取了月度榜单,月度榜单提供
了自2014年至今每月以手机品牌搜索指数为排序标准的品牌排行榜的前50名。
本文收集整理了2014年1月—2017年4月共计40个月的手机品牌搜索指数及
排名。在这个时间段中,进入过前50名的手机品牌数共计80个品牌。
在40个月手机搜索指数进入月前50名排名的80个手机品牌数据中,有44个品
牌不是连续出现在排名榜中:有的是前面时段出现在排名中;有的是后面时段出现
在排名中;有的是随时间变化,时而出现,时而又不出现。因此在后面的品牌趋势
与聚类分析中将这44个品牌手机的数据剔除,仅对另外40个月均进入排名榜的
36个品牌进行聚类分析,这36个品牌占领着我国手机消费的主要市场份额。
百度的搜索指数反映了人们对手机品牌的关注程度,反映了人们选择手机的兴趣所
在。搜索指数是手机品牌热度的反映,品牌热度在相当程度上体现了品牌的竞争力。
图2是筛选的36个手机品牌在40个月中搜索指数变化的趋势图。从趋势图2中
可以看出如下几点。
(1)iPhone几乎始终占据着搜索指数第一的位置,但是搜索指数还是呈逐渐下降的
趋势,近期华为手机的搜索指数和iPhone越来越接近。
(2)在2014年3月到8月期间,小米手机曾经一度有超越iPhone的态势,但是
在后面的时间段还是落后下来,但是小米手机还是在2016年10月以前一直居于
搜索榜第二的位置,之后多次被华为手机所超越。
(3)三星手机下降的趋势非常明显,在2015年3月之前还稳居第三,之后就陆续
地被华为、荣耀、VIVO、OPPO等所超越,目前市场表现并不出色。
(4)华为手机在搜索指数趋势上表现最为突出,从2014年1月落后于iPhone、小
米手机、三星、魅族、VIVO排名第六的位置,至2017年4月上升为第三位置,
位居iPhone、小米手机之后,近半年来和小米手机不相上下,而且和iPhone的
搜索热度也非常接近,在iPhone、小米手机和三星手机的搜索热度逐步下降的的
趋势下,华为手机迅速上升的趋势表现出该品牌突出的市场竞争力。
(5)诺基亚手机从2014年1月搜索指数第4的位置也逐步沉沦下去,到2017年4
月已经退步到第9的位置。
综上,整体来看国外手机品牌占领市场的绝对优势已经逐步消退,国产手机品牌逐
步崛起,在我国手机市场中逐渐获得市场份额。
为了对手机品牌热度有一个更系统的了解,本文采用了K-Means聚类方法对36
个手机品牌2014年1月—2017年4月间40个月的百度指数进行聚类。聚类工
具选用了SPSS21,聚类数设为4,最大迭代次数设为20次,聚类标准设为0。
聚类结果如表1所示。从40个月手机品牌搜索指数的聚类来看:iPhone还是具
有较大的优势,单独占据一类;三星、小米手机手机占据第二类;OPPO、VIVO、
华为、魅族、荣耀处于第三类;前三类手机共11个品牌占据市场大部分份额,其
余25个品牌应该说在市场上表现不突出,位居第四类。
从趋势图2中可以发现,近一年来手机品牌的变化幅度都比较大,因此为了系统
了解近一年手机品牌热度的整体情况,本文对36个手机品牌从2016年5月—
2017年4月间12个月的百度指数进行再次聚类。
通过对基于百度指数的手机品牌搜索热度数据的分析,可以得出以下结论。
(1)从时间趋势的总体上看,苹果公司的iPhone一直稳定的占有手机品牌热度第
一的位置。无论是国外手机品牌还是国内手机品牌都无法超越其霸主地位。
(2)国内手机无论出于聚类第二类还是第三类的品牌,在品牌热度上都大体呈现上
升的态势。在这方面华为手机的表现尤为突出,已经形成稳步提升的趋势。而国产
小米手机却有下降的趋势。整体上表现是国内品牌手机热度在提升,国外品牌手机,
包括iPhone在内热度都在下降。
(3)国外手机品牌,如三星、诺基亚等,甚至包括iPhone,热度都在下降。表明国
人正逐渐不再青睐国外品牌,开始更愿意选择国内品牌的手机。
总之,近年国产手机在国内市场的表现相当辉煌,已经占领了国内手机市场份额的
70%,这得益于灵活的安卓手机系统,得益于国内手机企业对国人消费特点的精
准定位,得益于互联网思维在生产和营销中的合理运用,得益于完善高效的供应链
的协调发展,得益于智能手机技术的研发投入。智能手机市场的竞争相当激烈,崛
起与没落仅发生在很短的时间中,因此国内手机企业应保持高度的创新性与高效性,
才能在国内市场保持竞争力,同时进一步开拓国外市场。
【相关文献】
1 尚优,江文奇,王晨晨.基于K-means的科技服务僵尸平台分类管理研究[J].科技管理研究,2016(14).
2 胡海涛,朱建民.基于K-means聚类的大学教学管理利益相关者分析[J].湘潭大学自然科学学
报,2015(3).
3 张凯,郭健栖.图书馆主题大数据调查及前瞻性构想——基于百度指数的分析[J].中国图书馆学
报,2016(6).
4 赵映慧,高鑫,姜博.东北三省城市百度指数的网络联系层级结构[J].经济地理,2015(5).
2024年5月12日发(作者:红怜南)
基于百度指数的手机品牌热度聚类与趋势分析
刁宇捷
【摘 要】国内手机市场竞争激烈,通过手机品牌百度搜索指数数据分析,可以洞悉手
机品牌热度的变化趋势.应用趋势分析和K-Means聚类方法对2014年1月—
2017年4月40个月的手机品牌搜索指数进行趋势和聚类研究,结果表明:国外手机
品牌正逐渐失去国人的青睐,但iPhone还处于搜索指数排名第一的位置;国内手机
品牌热度近年呈现良好的上升态势,其中华为手机的表现尤为突出.
【期刊名称】《科技创业月刊》
【年(卷),期】2017(030)017
【总页数】3页(P14-16)
【关键词】手机品牌;品牌热度;百度指数;趋势;聚类分析
【作 者】刁宇捷
【作者单位】育明高中,辽宁大连116023
【正文语种】中 文
【中图分类】F416.6
我国是全球最大的手机消费市场,国内和国外的手机厂商都希望在竞争激烈的市场
中占有更大的份额。手机市场的竞争在相当程度上是手机品牌的竞争,手机品牌在
较短的时间中看上去比较稳定,但实际上随着时间的推移,一些手机品牌逐渐成长
壮大,而也有一些手机品牌逐渐淡出这个市场。百度指数是以海量网民关键词搜索
为基础的数据分享平台,通过对手机品牌搜索指数历史数据的提取,可以对不同热
度的手机品牌进行分类,并对手机品牌热度的趋势进行研究。
系统聚类和K-Means是两种较为常用的聚类算法,对大数据集进行分类时,系统
聚类执行效率不够理想,而K-Means聚类算法具有简单、高效的优点,特别对大
数据集分类时,它的可伸缩性和高效性表现得尤为明显。因此本文采用K-Means
算法对手机品牌热度进行聚类计算。
K-means算法是一种把数据集D中的N个样本点分为K类(K≤N)的聚类方法,
分类后同一类的样本点具有较好的相似性,不同类之间的样本点相似程度较低。该
算法的计算步骤如下:①在D中随机选取K个样本点,作为初始类中心;②按照
最相似的原则,即距离类中心最近的原则,将N个样本点分派给各类中心,形成
K个分类;③依次计算各类中样本点的均值,并以此值作为新的K个类中心;④
判断是否满足终止聚类的条件,即本次迭代的各类中心和上次迭代的各类中心是否
相同,如果满足条件则分类结束,如果不满足,转到第二步。
在上面的步骤中需要明确一个关键问题,即样本点之间的相似程度,相似程度的度
量方式有很多,其中用得最为广泛的是欧式距离。
这里相似程度的度量仅介绍本文所采取的欧式距离。假设数据集D中的每个样本
包含d个属性,设第i个样本点为xi={xi1,xi2,…,xid},第j个样本点为
xj={xj1,xj2,…,xjd},样本xi和xj距离d(xi,xj)来表示。d(xi,xj)以欧式距离来计算为:
欧式距离越小,相似程度越好,越有可能聚成一类;距离越大,相似程度越差,越
有可能属于不同的类。
百度是全球最大的中文搜索引擎和中文网站,百度指数是以海量网民的搜索行为为
基础的大数据分享平台。百度指数包含指数探索、品牌表现、数说专题和我的指数
4个模块。借助百度指数可以洞悉网民的需要变化、监测舆情的发展趋势、定位消
费者的特征、分析行业的动态和特点。学术界越来越多地认识到百度指数的数据价
值,近年来以百度指数为基础进行相关问题分析的论文有逐年加速上升的趋势。图
1展示了中国知网期刊库中2006—2016年间以百度指数为标题或关键字的论文
数量变化趋势。由图1可见,百度指数越来越成为数据分析与数据挖掘的数据来
源与依据。
对于手机行业品牌热度的分析,本文采用百度指数品牌表现模块中手机行业数据。
百度指数中的手机行业板块中,可以检索到手机行业品牌榜的月度、季度和年度榜
单。为了数据更精确,数据变化趋势更清晰,本文选取了月度榜单,月度榜单提供
了自2014年至今每月以手机品牌搜索指数为排序标准的品牌排行榜的前50名。
本文收集整理了2014年1月—2017年4月共计40个月的手机品牌搜索指数及
排名。在这个时间段中,进入过前50名的手机品牌数共计80个品牌。
在40个月手机搜索指数进入月前50名排名的80个手机品牌数据中,有44个品
牌不是连续出现在排名榜中:有的是前面时段出现在排名中;有的是后面时段出现
在排名中;有的是随时间变化,时而出现,时而又不出现。因此在后面的品牌趋势
与聚类分析中将这44个品牌手机的数据剔除,仅对另外40个月均进入排名榜的
36个品牌进行聚类分析,这36个品牌占领着我国手机消费的主要市场份额。
百度的搜索指数反映了人们对手机品牌的关注程度,反映了人们选择手机的兴趣所
在。搜索指数是手机品牌热度的反映,品牌热度在相当程度上体现了品牌的竞争力。
图2是筛选的36个手机品牌在40个月中搜索指数变化的趋势图。从趋势图2中
可以看出如下几点。
(1)iPhone几乎始终占据着搜索指数第一的位置,但是搜索指数还是呈逐渐下降的
趋势,近期华为手机的搜索指数和iPhone越来越接近。
(2)在2014年3月到8月期间,小米手机曾经一度有超越iPhone的态势,但是
在后面的时间段还是落后下来,但是小米手机还是在2016年10月以前一直居于
搜索榜第二的位置,之后多次被华为手机所超越。
(3)三星手机下降的趋势非常明显,在2015年3月之前还稳居第三,之后就陆续
地被华为、荣耀、VIVO、OPPO等所超越,目前市场表现并不出色。
(4)华为手机在搜索指数趋势上表现最为突出,从2014年1月落后于iPhone、小
米手机、三星、魅族、VIVO排名第六的位置,至2017年4月上升为第三位置,
位居iPhone、小米手机之后,近半年来和小米手机不相上下,而且和iPhone的
搜索热度也非常接近,在iPhone、小米手机和三星手机的搜索热度逐步下降的的
趋势下,华为手机迅速上升的趋势表现出该品牌突出的市场竞争力。
(5)诺基亚手机从2014年1月搜索指数第4的位置也逐步沉沦下去,到2017年4
月已经退步到第9的位置。
综上,整体来看国外手机品牌占领市场的绝对优势已经逐步消退,国产手机品牌逐
步崛起,在我国手机市场中逐渐获得市场份额。
为了对手机品牌热度有一个更系统的了解,本文采用了K-Means聚类方法对36
个手机品牌2014年1月—2017年4月间40个月的百度指数进行聚类。聚类工
具选用了SPSS21,聚类数设为4,最大迭代次数设为20次,聚类标准设为0。
聚类结果如表1所示。从40个月手机品牌搜索指数的聚类来看:iPhone还是具
有较大的优势,单独占据一类;三星、小米手机手机占据第二类;OPPO、VIVO、
华为、魅族、荣耀处于第三类;前三类手机共11个品牌占据市场大部分份额,其
余25个品牌应该说在市场上表现不突出,位居第四类。
从趋势图2中可以发现,近一年来手机品牌的变化幅度都比较大,因此为了系统
了解近一年手机品牌热度的整体情况,本文对36个手机品牌从2016年5月—
2017年4月间12个月的百度指数进行再次聚类。
通过对基于百度指数的手机品牌搜索热度数据的分析,可以得出以下结论。
(1)从时间趋势的总体上看,苹果公司的iPhone一直稳定的占有手机品牌热度第
一的位置。无论是国外手机品牌还是国内手机品牌都无法超越其霸主地位。
(2)国内手机无论出于聚类第二类还是第三类的品牌,在品牌热度上都大体呈现上
升的态势。在这方面华为手机的表现尤为突出,已经形成稳步提升的趋势。而国产
小米手机却有下降的趋势。整体上表现是国内品牌手机热度在提升,国外品牌手机,
包括iPhone在内热度都在下降。
(3)国外手机品牌,如三星、诺基亚等,甚至包括iPhone,热度都在下降。表明国
人正逐渐不再青睐国外品牌,开始更愿意选择国内品牌的手机。
总之,近年国产手机在国内市场的表现相当辉煌,已经占领了国内手机市场份额的
70%,这得益于灵活的安卓手机系统,得益于国内手机企业对国人消费特点的精
准定位,得益于互联网思维在生产和营销中的合理运用,得益于完善高效的供应链
的协调发展,得益于智能手机技术的研发投入。智能手机市场的竞争相当激烈,崛
起与没落仅发生在很短的时间中,因此国内手机企业应保持高度的创新性与高效性,
才能在国内市场保持竞争力,同时进一步开拓国外市场。
【相关文献】
1 尚优,江文奇,王晨晨.基于K-means的科技服务僵尸平台分类管理研究[J].科技管理研究,2016(14).
2 胡海涛,朱建民.基于K-means聚类的大学教学管理利益相关者分析[J].湘潭大学自然科学学
报,2015(3).
3 张凯,郭健栖.图书馆主题大数据调查及前瞻性构想——基于百度指数的分析[J].中国图书馆学
报,2016(6).
4 赵映慧,高鑫,姜博.东北三省城市百度指数的网络联系层级结构[J].经济地理,2015(5).