Labs Timeline What's New

↑↓ to navigate ↵ to open Esc to close

ACAVCaps

dataset

2025-08-06 Xiaomi

38,000-hour collection of general audio captions for training holistic audio-reasoning models.

Paper (arXiv)GitHub

audiotraining-data