Falcon 3 | Lab Index

Family of 1B, 3B, 7B, 10B dense Transformers plus Mamba-7B SSM variant. 7B trained from scratch on 14T tokens (1,024 H100s). 10B created via depth upscaling + 2T additional tokens. 1B/3B via pruning + distillation. MMLU: 73.1 (10B). #1 on HuggingFace Open LLM Leaderboard at launch for size class.

No results found