让机器像人一样听音乐

发布时间：2021-02-27 11:22:11 所属栏目：外闻来源：互联网

导读：复杂的软件程序也很难精确地挑出一个部分。 Facebook AI 的研究人员已经开发了一个系统，可以做到这一点精确度高得惊人。创建者名叫亚历山大笛福兹（Alexandre Defossez），是Facebook人工智能巴黎实验室的科学家。笛福兹的系统被称为Demucs，这个名字来源

复杂的软件程序也很难精确地挑出一个部分。

Facebook AI 的研究人员已经开发了一个系统，可以做到这一点——精确度高得惊人。

创建者名叫亚历山大·笛福兹（Alexandre Defossez），是Facebook人工智能巴黎实验室的科学家。笛福兹的系统被称为Demucs，这个名字来源于“音乐资源深度提取器”，其工作原理是检测声波中的复杂模式，对每种乐器或声音的波形模式建立一个高层次的理解，然后利用人工智能将它们巧妙地分离开来。

笛福兹说，像Demucs这样的技术，不仅能帮助音乐家学习复杂的吉他即兴重复段落；总有一天，它还能让人工智能助手在嘈杂的房间里更容易听到语音指令。

笛福兹说他的目标是让人工智能系统擅长识别音频源的组成部分，就像它们现在可以在一张照片中准确地区分不同的物体一样。“我们在音频方面还没有达到同样的水平，”他说。

分解声波的更好方法

声源分离长期以来一直吸引着科学家。1953年，英国认知科学家科林·切里（Colin Cherry）创造了“鸡尾酒会效应”这个词语，用来描述人类在拥挤嘈杂的房间里专注于一次谈话的能力。

工程师们首先试图通过调整立体声录音中的左右声道，或调整均衡器设置来提高或降低某些频率，从而隔离歌曲的人声或吉他声。

基于声谱图的人工智能系统，在分离出以单一频率响起或共振的乐器的音符方面相对有效，例如钢琴或小提琴旋律。

这些旋律在声谱图上显示为清晰、连续的水平线。但是隔离那些产生残余噪音的撞击声，比如鼓，低音拍击，是一项非常艰巨的任务。鼓点感觉像一个单一的、实时的整体事件，但它实际上包含了不同的部分。对于鼓来说，它包括覆盖较高频率范围的初始撞击，随后是在较低频率范围内的无音高衰减。笛福兹说，一般的小鼓“

（编辑：阿坝站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

美国庞大战争机器危及	同中国发展外交关系是
美国监管部门未发现蓝	三星特斯拉纷至沓来！