Vicuna-13B开源模型发布:仅需300美元实现ChatGPT 90%性能

Vicuna-13B开源模型发布:仅需300美元实现ChatGPT 90%性能插图

2023年3月31日,UC伯克利与CMU、斯坦福、UCSD和MBZUAI联合推出了一款具有130亿参数的开源模型Vicuna。这款模型仅需300美元的训练成本,便能实现与ChatGPT 90%的性能。

Vicuna模型是在ShareGPT平台上,通过用户共享对话数据对LLaMA进行微调训练而来的。在测试中,研究人员设计了8个问题类别,包括数学、写作和编码等,将Vicuna-13B与其他四个模型进行性能对比。采用GPT-4作为评判标准,结果表明Vicuna-13B在超过90%的情况下具有与ChatGPT和Bard相匹敌的能力。同时,在超过90%的情况下胜过了其他模型,如LLaMA和斯坦福的Alpaca。

值得一提的是,Vicuna-13B的权重现已正式发布,用户可以在单个GPU上运行。Vicuna-13B需要大约28GB的GPU显存。如果没有足够的显存,用户还可以使用模型并行在同一台机器上聚合多个GPU的显存。此外,如果想在CPU上运行,用户需要大约60GB的内存。

总之,Vicuna-13B作为一款开源模型,其性价比极高,仅需300美元就能实现ChatGPT 90%的性能。这将为AI研究和应用领域带来新的突破,值得关注与尝试。立即了解更多关于Vicuna-13B的信息,并体验其高性能带来的便捷!

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注