萨里大学联手字节跳动等机构,推出生成模型 AudioSR
据品玩援引 HuggingFace 报道,来自萨里大学、字节跳动和加利福尼亚大学圣迭戈分校的研究者们推出了一款生成模型产品 AudioSR。
论文显示,AudioSR 够对各种类型的音频进行稳定的音频超分辨率处理。udioSR 可以将带宽在 2 kHz 至 16 kHz 范围内的任何输入音频信号上采样为带宽为 24 kHz 且采样率为 48 kHz 的高分辨率音频信号。对各种音频超分辨率基准进行的广泛客观评估表明,所提出的模型取得了很好的效果。论文显示,研究人员的主观评估结果表明,AudioSR 可以作为即插即用模块,提高各种音频生成模型的生成质量。