首页  >  快讯 >  区块链 >  小红书开源首个大模型,预训练未使用合成数据
 06月10日 星期二 (今天)
09:15
小红书开源首个大模型,预训练未使用合成数据
小红书开源了首个大模型dots.llm1,小红书方面表示,dots.llm1是一个1420亿参数的混合专家模型(MoE),在推理过程中仅激活140亿参数,能保持高性能的同时大幅度降低训练和推理成本。此外,dots.llm1.ins在预训练阶段使用了11.2万亿的非合成数据,最终性能与阿里Qwen3-32b相比,在中英文、数学、对齐任务上表现接近。
举报
币  海  财  经  社  区 轻财经,投资更简单、轻松

圈子热点消息


广告