中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)12?0019?03
Abstract: As the location retrieval accuracy of mining massive music resources in the cloud big data environment is not high, positioning mining method of massive music resources in cloud computing environment is improved, and a high?precision positioning mining method of massive music resources based on adaptive cascade retrieval control is proposed. The 百度竞价推广antic feature segmentation and time series state space reconstruction of data information in massive music resource database are conducted accorpng to the key words and music types, and then the self?correlation feature extraction of massive music resources in cloud computing environment is carried out. The extracted self?correlation features are taken as the pheromone guide to make high?precision positioning mining. The adaptive cascade retrieval control model is used to control the mining accuracy. The simulation analysis results show that this method can improve the positioning mining accuracy of music resources, resource utilization and data precision ratio.
Keywords: cloud computing environment; massive music resources; location mining; retrieval control
?S着云数据信息技术和云计算技术的进步,很多的音乐资源通过Deep Web数据库的形式存储于互联网空间中,提供给互联网用户进行有偿或者不收费的下载[1]。对大量音乐资源的高效优化管理能提升音乐赏析用户的体验,提升对音乐播放软件的认同度,大量音乐资源信息库是搜集、整理、珍藏音乐资源并供人下载和播放的数据库,结合音乐播放软件达成音乐共享和传播。在云计算环境下,需要对大量音乐资源进行高精度定位,对云计算环境下大量音乐资源进行优化配置和访问控制,提升云计算环境下大量音乐资源的管理和检索效率;因此研究音乐资源在云计算环境下的高精度定位挖掘办法具备要紧意义。
1 大量音乐资源信息预处置
1.1 音乐资源信息语义特点分割
为了达成对云计算环境下大量音乐资源的高精度定位挖掘,需要进行语义特点分割,减少资源定位挖掘的计算开销,使用自适应特点分割模型进行大量音乐资源库的存储音奥创息的数据特点重构和特点分割,去除冗余的信息特点[2?3]。音乐资源存储地区按音乐的歌词的关键字和音乐种类进行语义特点分割。音乐种类的存储本体特点通过自适应均衡分割办法被分为若干个(K个)数据子集,为云计算环境下大量音乐资源的语义特点并查集,满足:。依据音乐的播放环境和时尚程度,进行资源分布区间的网格模型构建,使得音乐资源存储的状况分布结构满足,其中且。由此,使用决策树模型构建音乐资源信息检索和挖掘的特点访问控制模型。在进行音乐资源信息语义特点分割中需要第一创建一个空节点root作为根节点,在匹配节点的父节点处创建语义特点分割的分支结构模型[4],并通过规则数据集匹配的音乐资源的存储空间,进行节点匹配,搜索节点为root节点,以叶节点B:0.7为起始节点进行语义特点分割。在匹配节点的父节点处得到候选数据项为: ,以节点C:0.8中的BC为搜索节点,得到语义特点分割的自适应概率分布为0.7×0.8=0.56,由此构建压缩的UF?tree决策树模型,达成对云计算环境下的音乐资源信息存储空间的语义特点分割如下:
式中:表示待匹配本体的关系模型;为到目前数据项在TID集的概率分布。云计算环境下大量音乐资源库中的特点空间采样数据集,依据音乐资源信息语义特点分割结果,进行了分布式特点重构剖析。
式中,为云计算环境下的音乐资源检索的统计频次参量。通过自适应级联检索控制,挖掘音乐资源的候选项集和产生频繁项集,提升对音乐的准确检索和定位挖掘能力。具体算法描述如下: 输入: 音乐资源搜索节点初始化参数,音乐资源定位挖掘的概率向量,候选集AllCanpdate
输出:音乐资源挖掘的繁项集和规则集FrequentItems
(1) group?dependen=new MapReduce framework (Null);
(2) parallel closed frequent T in DBgid
(3) LocalFPtree.insert_tree(T,LocalFPtree.root,G?List);
(4) file management item in nowGroup
//闭频繁项集特点分解
{ Heap HP= Parallel FP?Growth ();
LocalFPtree.FPGrowth(mining large data.,item, HP);
//遍历每条事务数据
Support=0.0f;
Add(canpdateItem,FrequentItems)
End}
3 实验测试剖析
对大量音乐资源的定位挖掘仿真实验打造在Hadoop云计算平台上。仿真的硬件CPU为Intel? CoreTM i7?2600。使用Matlab仿真工具进行数学仿真,结合酷狗、QQ音乐软件进行音乐资源的嵌入式访问接口设计和兼容性数据库存储,音乐软件通过100 MB以太网相连在网络中。对音乐资源进行语义特点分割的尺度为1.45,音?纷试吹氖?据信息流采样样本长度为1 024,频带2~30 kHz、时宽3.6 ms,对DeepWeb数据库中的大量音乐资源进行信息采样和挖掘定位仿真。依据上述实验环境设定,进行音乐资源的定位挖掘,以挖掘精度为测试评价指标,进行10 000次挖掘实验,使用不同办法进行对比,得到挖掘精度对比结果如图2所示。图3为数据查准率对比。
据查准率对比
图3给出了以酷狗音乐软件为访问接口,使用本文设计的音乐资源定位挖掘办法和传统的挖掘办法进行音乐资源检索的查准率对比。剖析上述仿真实验结果得知,使用本文办法进行云计算环境下大量音乐资源的定位挖掘的精度较高,信息检索的查准率高于传统办法,达成高精度的定位挖掘。
4 结 语