Blossom Data – 面向大模型的数据处理框架

BlossomData 是面向大模型训练数据的一体化数据处理框架,通过 Schema 显式建模数据结构,用 Dataset + Operator 搭建可组合、可复用的数据流水线,内置翻译、合成、蒸馏、验证等常用算子,并支持 Local / Ray / Spark 多种执行后端。