600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火

AIGC行业资讯3年前 (2023)更新管理员

9.8K 0 25

https://crfm.stanford.edu/alpaca/

斯坦福发布了一个由LLaMA 7B微调的模型Alpaca，训练3小时，性能比肩GPT-3.5。

Alpaca: A Strong Open-Source Instruction-Following Model

作者：Rohan Taori and Ishaan Gulrajaniand Tianyi Zhang and Yann Dubois and Xuechen Li and Carlos Guestrin and Percy Liang and Tatsunori B. Hashimoto

Alpaca是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。关键是训练成本奇低，不到600美元。在8个80GB A100上训练了3个小时，不到100美元；生成数据使用OpenAI的API，500美元。

OpenAI最大的创新之一就是将指令调优用在了GPT-3上。斯坦福使用了现有的大语言模型，来自动生成遵循指令演示。

官网地址：https://crfm.stanford.edu/2023/03/13/alpaca.html

模型入口：https://crfm.stanford.edu/alpaca

github地址：https://github.com/tatsu-lab/stanford_alpaca

600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火

600刀GPT-3.5平替！斯坦福70亿参数「羊驼」爆火

更多内容可参考：

https://simonwillison.net/2023/Mar/13/alpaca

# AIGC行业资讯 # AI # GPT # Meta # OpenAI # 创新

© 版权声明

AI工具文章转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权或其它疑问请联系AIGC工具导航或点击删除。

相关文章

ai视频生成软件特效(Ai特效软件如何制作 )

共谋AI产业新未来 2024中国5G＋工业互联网大会人工智能产业发展专题会在武汉举行

论文结论字数要求，精确、简洁、有力的陈述

ai美颜技术的应用(拍自媒体用哪个软件美颜)

AIGC概念股一路上涨，经济日报：莫让过度炒作耽误新技术

教育大模型，重塑未来教育的智能引擎

堆友更新