Vicuna-13B开源模型发布:仅需300美元实现ChatGPT 90%性能

温馨提示(看过来)

每日不间断更新《资源分享》和《每日必看》栏目!敬请关注,谢谢!

如部分内容需要密码,请扫一扫关注公众号免费获取!微信搜索“流浪宇宙寻资源”关注公众号回复”密码“即可获得密码,不愿意搜索的直接扫下方二维码。

如果您有资源可以投稿的这里,发给我,来换取金钱,具体价格商量。

如果您对网站有建议,可以这里提问帮您解决。

Vicuna-13B开源模型发布:仅需300美元实现ChatGPT 90%性能插图

2023年3月31日,UC伯克利与CMU、斯坦福、UCSD和MBZUAI联合推出了一款具有130亿参数的开源模型Vicuna。这款模型仅需300美元的训练成本,便能实现与ChatGPT 90%的性能。

Vicuna模型是在ShareGPT平台上,通过用户共享对话数据对LLaMA进行微调训练而来的。在测试中,研究人员设计了8个问题类别,包括数学、写作和编码等,将Vicuna-13B与其他四个模型进行性能对比。采用GPT-4作为评判标准,结果表明Vicuna-13B在超过90%的情况下具有与ChatGPT和Bard相匹敌的能力。同时,在超过90%的情况下胜过了其他模型,如LLaMA和斯坦福的Alpaca。

值得一提的是,Vicuna-13B的权重现已正式发布,用户可以在单个GPU上运行。Vicuna-13B需要大约28GB的GPU显存。如果没有足够的显存,用户还可以使用模型并行在同一台机器上聚合多个GPU的显存。此外,如果想在CPU上运行,用户需要大约60GB的内存。

总之,Vicuna-13B作为一款开源模型,其性价比极高,仅需300美元就能实现ChatGPT 90%的性能。这将为AI研究和应用领域带来新的突破,值得关注与尝试。立即了解更多关于Vicuna-13B的信息,并体验其高性能带来的便捷!

公众号(流浪宇宙寻资源)
公众号(J科技资源)