Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

Bee是腾讯混元团队与清华大学联合推出的全栈开源多模态大模型解决方案,通过提升数据质量缩小开源模型与闭源模型的性能差距。项目包含三大核心成果:1500万规模的高质量双层CoT数据集Honey-Data-15M、开源的数据增强工具HoneyPipe及DataStudio,以及基于该数据集训练的8B模型Bee-8B。Bee-8B在多项基准测试中表现优异,尤其在数学推理和图表理解任务上超越了主流半开源模型。项目通过公开数据集和方法论,为开源社区提供了提升MLLM性能的重要基础设施。Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

>>展开阅读