Stable Diffusion背后团队发布开源大语言模型可用于本地部署

原创

2023-04-20 02:56 星期四

财联社史正丞

对于许多商业和研究实体来说，能把AI模型部署到本地，自然也解决了机密数据泄露的担忧。

财联社4月20日讯（编辑史正丞）当地时间周三（19日），开发AI图像生成工具Stable Diffusion的创业公司Stability AI宣布，发布并开源该团队训练的大语言模型StableLM。

（来源：Stability AI）

根据该团队的公告，目前StableLM的“阿尔法版本”中拥有30亿和70亿参数的模型已经可以从GitHub等开源平台上下载，后续还将推出150亿至650亿参数的版本。与Stable Diffusion类似，StableLM同样支持知识共享4.0协议，开发者可以在遵守协议的情况下，将这个模型用于商业或研究活动。

这家公司在去年发布的Stable Diffusion，使得AI“文生图”赛道成为AIGC领域商业化前景最为明朗的行业。

Stability AI介绍称，StableLM可以生成文本和代码，并将助力一系列下游应用。这个模型建立在经典训练集The Pile的新实验训练集上，token数量翻了3倍至1.5万亿，公司也将在适当的时候发布数据集的详细信息。尽管公布出来的模型参数量很少，但数据集的丰富性使 StableLM在会话和编程任务中表现出惊人的高性能，展现了小型高效模型如何通过适当的训练提供高性能。