斯坦福AI团队抄袭中国国产大模型事件始末

释放双眼,带上耳机,听听看~!
近日,斯坦福AI团队被曝出抄袭中国国产大模型的事件,模型结构和代码与面壁智能的MiniCPM-Llama3-V 2.5几乎一模一样。斯坦福团队选择删库跑路,引发舆论关注,事件仍在持续发酵中。

快科技6月3日消息,近日,斯坦福AI团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。

斯坦福的Llama3-V项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越GPT-4V、Gemini Ultra、Claude Opus等的多模态大模型

然而,一位网友发现,Llama3-V的模型结构和代码与出自清华系明星创业公司面壁智能的MiniCPM-Llama3-V 2.5几乎一模一样,只是变量名有所变化。

面对抄袭的指控,斯坦福团队选择了删库跑路,目前在GitHub和HuggingFace上的相关项目均显示404,无法访问。

面壁智能的MiniCPM-Llama3-V 2.5项目具有独特的功能,如识别清华简一种罕见的中国古代文字。

Llama3-V在未公开的实验性特征上与MiniCPM-Llama3-V 2.5表现出高度相似的行为,这些特征是根据MiniCPM-Llama3-V 2.5团队内部数据训练的。

面对抄袭的质疑,斯坦福团队最初辩称,他们的工作早于面壁智能的MiniCPM,只是使用了他们的tokenizer。

然而,随后他们在Medium上的声明被删除,且最新的回应也被撤回。

面壁智能CEO李大海对此事件做出了正式回应,要求Llama3-V作者对这个问题给出一个正式的解释,目前,此事仍在持续发酵中。

本网站的内容主要来自互联网上的各种资源,仅供参考和信息分享之用,不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益,请联系我们,我们将尽快采取行动,包括删除或更正。
AI资讯

沙特阿美子公司Prosperity7投资智谱AI,估值达30亿美元

2024-6-3 17:54:05

AI资讯

年轻美国人对人工智能的态度调查报告

2024-6-3 18:58:07

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索