哼唱音乐检索媒体技术
摘:着现代科技快速发展尤互联网强信息技术背景数字化视频音频已取代模拟视频音频信息遍INTERNET媒体数数量正飞速增长海量数字信息中快速检索出需容正研究方传统音乐检索方法通曲名作者演奏者等样属性寻找情况种方式满足现音乐检索需求般情况通音乐旋律特征记忆音乐然想利哼唱歌曲旋律方式进行音乐查找种哼唱音乐检索年研究热点试图通提取音频音长等特征表达识音乐容相似度量进行音乐旋律检索匹配仅户带极便利时极具商业空间文哼唱音乐检索技术进行研究容:(1)介绍哼唱检索研究现状相关乐理知识(2)介绍哼唱音乐检索技术基原理(3)谈关项技术研究应价值(4)谈哼唱音乐检索实施设想展
关键字:哼唱检索特征提取商业价值应设计
Abstract Along with the rapid development of modern science and technology especially by the powerful IT support of Internet digital video and audio have replaced the analog video and audio information throughout internet The number of multimedia data is growing tremendously A quick retrieving for the information we need from the vast amounts of digital information is now the research direction of current The traditional method of music querying is searching by the name of the music composer or performer but in most circumstances this method is far from satisfaction While music query by SingingHumming (QBSH) is more directly and conveniently that easy to accept by the youth which now is becoming a hot topic in research field QBSH attempts to express and identify the melody content by extracting the audio frequency and length and other features according to similarities This attempt will provide not only the convenience but also great commercial benefits This paper explores the QBSH in the following aspects (1) Introduce the status quo of QBSH and the related music theory (2) Introduce the rationale of QBSH (3) Discuss the further study and outlook of QBSH
Key Words QBSH feature extract commercial benefits application design
前言:
声音传达思想情感媒介音乐类语言音乐产业文化创意产业重组成部分着数字技术广泛应视听设备断更新门语言断扩充着音乐庞数库中方便快捷寻找户需求乐曲成值研究问题
1研究背景意义
11哼唱检索技术概述
哼唱检索通语音识技术户哼唱曲调作系统输入通检索音乐数库哼唱搜索引擎中特征进行识判断哼唱歌曲曲目返回检索歌曲户哼唱时存发音准等错误检索结果出张歌曲列表难发现张歌曲列表根歌曲间相似度进行排序该项检索技术早家名Melodi公司推出旗网站Midomi已实现功早07年Midomi已开始运营
12哼唱检索系统发展现状
哼唱检索系统实基容音频信息检索部分基容音频信息检索研究工作20世纪90年代开始研究利音频信息幅度频谱等物理特征响度音高音色等听觉特征音频类语义等特征实现基容音频信息检索然年哼唱检索尤突出已成国外研究热点文艺引起国众研究机构学者广泛关注系列针音频数类型算法系统雨春笋般出现起步晚数复杂研究难度等原该检索技术文检索技术相然存差距量问题亟解决
2相关乐理知识
21音乐基常识:音性质素
解哼唱音乐检索前先解相关乐理知识
谈音乐首先知道概念:音音物体振动周围空气产生振动四周传播形成系列波波音音组成固定体系表现音乐思想塑造音乐形象
音高低强弱长短音色四种性质音高低物体定时间振动次数决定音频率频率高音高频率低音低般耳够听音频范围约30—17000赫兹音长短振动延续时间决定振动延续时间音长成正音强弱振幅决定振幅音强振幅音弱音色发音物体产生谐波决定发音物体性质形状产生谐波音色
音4种构成素分:节奏旋律声音色四种素构成音乐基容
22音乐旋律表示方法
音乐常接触媒体着时间延续变化构成旋律知道通常段音乐旋律包含两方面容:方面音乐时间延续方面音乐时间变化果描述段音乐旋律某种方法两方面信息实表达出音乐旋律表示方法匹配方法基旋律音乐组织检索重环音乐旋律表示匹配方法探讨进行哼唱音乐检索研究重组成部分目前音乐旋律表示方法致分两类
类描述旋律时忽略乐音时间延续性类重视音乐时间延续性着时间发生旋律变化
23数字音乐信息存形式
数字音乐格式五花八门外分两类:
第类:音乐指令文件MIDI般音乐创作软件制作成实质种音乐演奏命令包括具体声音数文件
第二类:声音文件通录音设备录制原始声音实质种二进制采样数文件较
24常见数字音频音乐文件格式
MIDI
乐器数字接口英文缩写(Musical Instrument Digital Interface)数字音乐电子合成乐器统国际标准MIDI身发音协议包含产生特定声音指令指令包括调种MIDI设备音色声音强弱持续时间等电脑指令交声卡合成相应声音指令发出钢琴者提琴声音等等现MIDI已成电脑音乐代名词电脑播放MIDI文件时两种方法合成声音:波表合成(**器声音样存储声卡波形中播放时波形表中取出产生声音)FM合成(通频率声音混合模拟乐器声音)
MAV
Microsoft公司开发种WAV声音文件格式电脑常见声音格式支持压缩算法时支持种音频位数采样频率声道缺点文件体积较适合长时间记录
MP3
着良压缩(12:1)较音质开放性终避免导致版权争样背景文件更音质更时效保护版权MP4应运生
WMA
Windows Media Audio缩写微软开发技术WMA技术性压缩率远远Mp3抛面
3核心问题关键技术
翻阅量文献发现许文献问题研究焦点核心集中匹配旋律构造音乐数库哼唱输入转化类似MIDI格式便音乐数库中音乐进行匹配断深入课题语音误差难避免研究核心中涉输入哼唱进行检测音符特征提取旋律表达等容面音乐特征提取旋律匹配进行研究
31音乐信号特征提取
时接触音乐系列音符序组成音符构成音乐基单元音乐角度音高音长音强等特征外音乐具节奏节拍速度旋律等音乐特征中旋律动直接唤起情感说音乐旋律音乐灵魂
音乐旋律系列反映该音乐题音符组成够充分显示音乐容特征段旋律中音符种含义丰富形式链接起表达作者种感情
认知程中通音乐旋律认识首歌听首歌曲时脑首歌曲旋律提取出映射脑海中熟记结构中哼唱程脑海中旋律通声带振动表达出程音乐旋律记忆中第位信息附加首音乐作品文字描述第二位信息种验子哼出年前首老歌说出歌曲名字音乐旋律相文字描述留更直观更深刻印象更加容易忘记音乐种认识程提示旋律身具特征研究音乐检索
哼唱检索系统工作流程图表示:
户哼唱
乐曲库
特征提取
特征提取
旋律表示
乐曲索引
检索算法
前N位
1…
2…
﹕
N…
户哼唱
乐曲库
特征提取
特征提取
旋律表示
乐曲索引
检索算法
前N位
1…
2…
﹕
N…
户哼唱
乐曲库
特征提取
特征提取
旋律表示
乐曲索引
检索算法
前N位
1…
2…
﹕
N…
32旋律表达特征提取方法
哼唱容采集存储系统中系统带录音程序完成利专业音频处理软件采集终WAV格式录制哼唱容保存相应文件夹中保存文件夹中提取特征包括波形预处理音符切分参数提取
321波形预处理
(1)零率检测:指相邻采样具符号频率越高零率越高
(2)量检测:声音波形振幅说明声音强度数字声音信号处理中量表示通声音波形振幅判断声声
322音符切分
噪音声非典型点声音波形切分片段片段包含独立完整音符信息声音波形切分信息声音波形预处理量检测阶段字啊判断声声时相应音符切分位置确定
323参数提取
参数提取整特征提取步较相邻音符零率获相音高序列
33检索算法概述
331动态时间规整算法概述
检索算法基容音乐信息检索研究核心性直接影响检索结果整系统性需考虑节奏变化发音准确音漏音等必须考虑户够接受均检索时间等问题动态时间规整算法定路径限制寻找代价佳路径方法选择路径方式合理代价函数具重作
4现实应价值
讨出哼唱检索音乐种友基容音乐检索方法已引起广泛研究兴趣户通麦克风哼唱出歌曲某片段系统会动找出歌曲户输入相似程度排列出种方法相熟悉歌曲名称演唱者出版时间等检索音乐方法更加方便然想象哼唱检索音乐具极广泛应前景
41娱**应:KTV手机计算机
普通户利检索功方便互联网找喜欢音乐KTV哼唱点歌需歌音乐专业士方便判断创作否具新意版权理部门方便查处首音乐作品否新手机点歌成新应点否想象目前三网合趋势种时尚方便检索方式仅局限音乐哼唱适语音模糊匹配搜索通声音计算机传递信息数例:设计网络CD店者实体店哼唱铃声载等涉技术
5实际应设计设想
51 超级点歌王设计
然哼唱音乐检索方便快捷搜索歌曲难想应点歌系统里设想设计超级点歌王音乐搜寻系统然关键运音乐哼唱搜索技术初步设想功:者搜寻音乐时需唱者哼歌曲段系统进行搜寻结果相似度排序列出希超级点歌王系统处理种情况:第种直觉输入歌曲完全知道歌曲歌名歌词演唱者等第二种唱哼者乐器演奏完全语言者国界限制第三种起音高者低系统找第四种头唱歌曲中间开始唱种前面讨研究中说受噪音干扰
52声控式玩具设计
音乐娱乐应意外实种拓展方实现技术商业化认种技术应玩具设计种应目前声控玩具没数前设定程序会鼓掌发出声狗效果单果利技术设计会唱歌布偶否更吸引创作呢?中国直加工制造国出口玩具系列轻工艺谓五花八门质量创新折扣利新技术融入进里面新意会提高收益质量创作会听歌唱歌精灵
53旋律进行身分认证
想法安全名词思路信息爆炸时代里开放式互联网更注重网络安全信息安全军事安全甚生活中住信息安全等等保障:密码设置报警保护设置权限生活中设置开关锁利红外线感应身份证……否旋律进行身份认证呢?中方法指纹DNA样类指纹DNA独二外解名词声纹类似瞳纹种独特物质认声纹会更方便实际难想更方便旋律验证庞音乐数库中段模样旋律许会猜果段旋律组合起呢?想知许真种意思方案
6结展
篇科技文中致解哼唱音乐检索媒体技术容前门技术算法设计正断进步深入直认音乐永远会市场找出市场言种稀缺性——稀缺东西会较高价值科学技术服务生活强生产力相信新兴技术开发应会着时间推移越越成熟带价值实性会亮点
参考文献:
1现代电子技术2010年第33卷第10期 P3336
2网络安全技术应2010年05期 种改进哼唱式音乐检索方法
3郭敏刘加 电子信息技术2009年12期 P6264 76
4韩纪庆 音频处理技术M** 清华学出版社2007011
5徐建新 种新型媒体检索技术—基容检索情报学报 2000 19(4) 411410
6郭红波 音乐哼唱检索关键技术研究 西北学硕士文 2007
7李扬吴亚栋刘宝龙 种新似模拟旋律匹配方法哼唱技术检索系统中应计算机研究发展 2003 12 40(11)15541560
8张晶耿国华王凤 音乐哼唱检索技术WEB应 计算机应软件
9赖国明杨圣云 基容音乐检索研究 计算机工程设计 200627(23)
10金毅黄敏 基旋律音乐检索研究旋律特征表达提取 现代图书情报技术20034 P4951
11许洁萍袁立武刘怡 音乐检索系统中户哼唱旋律错误研究 第二届谐机环境联学术会议(HHME2006) 第15届中国媒体学术会议(NCMT06)文集 2006 P422427
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档