行业背景
随着 Sora、MusicGen、AudioCraft
等多模态大模型的兴起,高质量、结构化的音乐符号数据(乐谱)成为训
练音乐理解与生成模型的核心资产。MuseScore
作为全球最大的用户原创乐谱平台(300万+曲目),其 MSCZ
原生格式包含完整的音符、节拍、调号、乐器等结构信息,是目前可获取
的最高质量符号音乐数据源。
数据价值
- MSCZ 格式可无损转换为 MusicXML、MIDI、PDF、MP3 等多种下游格式
- 覆盖古典、流行、爵士等全风格,钢琴、弦乐、管乐等全乐器
- 含完整元数据(作曲家、调性、拍号、时长、演奏难度等)
- 可直接用于音乐 SFT(监督微调)、乐谱识别、自动编曲等任务
项目定位
为大模型训练团队提供大规模、结构化、多格式的乐谱数据集,目标采集
量 200万条,是国内为数不多具备该平台完整数据采集能力的技术团队。
点击空白处退出提示












评论