美国留学选择什么专业好?留学美国热门专业推荐
2019-06-26
更新时间:2024-08-07 16:24作者:小乐
最近AI圈又传来一个大新闻,《斯坦福团队抄袭中国 AI !》。估计很多人刚看到这个标题,也和石超一样一头雾水。啊?你瞎了吗?哪个斯坦福?你确定这不是相反吗?
你猜怎么着,这就是QS排名前五的美国斯坦福大学。不说国内网友,行业大佬们也按捺不住,表示时代变了。
准确的说,应该是斯坦福本科生团队抄袭了清华博士创业公司的产品,那就是面墙智能的开源模型:MiniCPM-Llama3-V 2.5小钢炮。事情要从5月29日说起。这一天,两位来自斯坦福大学的印度年轻人,其中一位与佛陀(Siddharth)同名,在全球最大的AI 开源社区—— HuggingFace 上发布了他们的大型模型Llama-3-V。
看着他们光鲜亮丽的实习简历,分别来自特斯拉和SpaceX,网友们很快就把这位号称“500美元就能训练得和GPT-4V、Gemini Ultra一样出色”的后起之秀放在了HuggingFace主页上,推文浏览量也突破了30万。
一开始,可能有人会想:我们国家世代人才辈出。你看,本科生也能取得与大公司不相上下的成绩。世界一流意味着什么?很快,一些眼尖的业内人士就发现了不对劲。你这个东西看起来和21号的MiniCPM大炮很像,无法复制。为啥不标明出处?
人们之所以第一眼就认定它是抄袭,主要是因为它声称具有体积小、性能强、多模态等特点。很难不将其与清华的MiniCPM进行比较。但他也表示自己是原创,没有引用MiniCPM。然而,面对别人的指责,这个大学生团队仍然表示MiniCPM引用了LLaVA-UHD。我们也引用了这一点。这是学者的问题。这能叫抄袭吗?假装困惑真是天才。
问题是MiniCPM和LLaVA-UHD原来的外观早就不一样了,你的Llama3-V的外观不能说和LLaVA-UHD一模一样,至少和它没有关系,但是看起来就像是同一个母亲的孩子。让我们把它们放在一起仔细看看。好家伙,即使模型结构和别人类似,配置文件也是一模一样的。
再看一下代码,除了增加了一些格式和改变了几个变量名之外,没有什么区别。即使是清华大学专门定义的特殊符号在你的代码中也没有被改变。更搞笑的是,有网友发现运行Llama3-V时,斯坦福团队提供的权重文件(神经网络微调的参数)无法运行,但如果将变量名改为MiniCPM-Llama3-V 2.5,就可以顺利启动了。
事情都敲定了,印度小伙依然不肯承认。很快,收到消息的Wallface Intelligence 官方也得出了结论,称Llama3-V 项目的作者并没有完全理解MiniCPM-Llama3-V 2.5 的架构,甚至连他们自己的代码也没有完全理解。换句话说,相当阴阳,“你抄的时候都没看懂。”
此外,墙面团队还出示了雷神之锤的证据。 Llama3-V居然可以识别清华简!清华竹简是清华校友捐赠的重要文物。这些埋藏于战国时期的竹简,躲过了秦始皇的焚书,保存了包括古籍《尚书》、先秦史料、医学哲学等在内的极其珍贵的原始档案,总之是上古时代。版本《永乐大典》。清华简认其实是MiniCPM-Llama3-V 2.5开发过程中内置的一个彩蛋。所有训练识别的数据都是Facewall Intelligence与清华大学合作逐字扫描和标注的,从未公开。斯坦福团队不可能获得这些完全私密的数据,但是两个模型都能实现识别,甚至错误都是一模一样的。
至此,可以说他们100%抄袭了,这是板上钉钉的事情了。这两个印度哥们是如何在数万人的殴打和全世界网友的嘲讽下做到的呢?回答,删除数据库,逃跑!
他们立即在HuggingFace 上删除了Llama3-V 模型,并表示:“非常感谢那些在评论中指出与之前研究相似之处的人。我们意识到我们的架构与OpenBMB 的MiniCPM-Llama3-V 2.5 非常相似,他们是一步之遥我们已经把原作者的模型删掉了,“不行,你还想炫耀吗?”然后他们就连续跪了三遍道歉,说我们兄弟两个。只是为了推广它,而代码却被外包给了南加州大学的另一个人,这是不公平的!
但事情闹大了,可耻的斯坦福大学官员也赶紧制止了。他们的人工智能实验室主任、Google Deepmind 研究员Christopher David Manning 直接发文,“典型的是不承认自己的错误!” MiniCPM 向这个中国开源模式致敬。
被抄袭的面墙智能联合创始人刘志远对他们喊道:“团队里的三个人中有两个只是斯坦福大学的本科生,未来的路还很长,如果你们知道的话承认你的错误并改正它们,你就可以做很多好事。” Wall Face CEO李大海也幽默回应:“我们对这起事件深感遗憾。一方面,我们觉得这也是获得国际团队认可的一种方式。另一方面,我们呼吁大家构建一个开放的社区。” ,合作和信任的社区环境。“我们希望团队的优秀工作能够被更多人注意到和认可,但不是这样的。”
话虽如此,这件事确实让大家注意到,国产AI似乎并不是刻板印象。就连一开始的大佬、Hugging Face 负责人Omar Sanseviero 也表示,“社区一直忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、大视觉模型、音频和扩散模型做一些令人兴奋的事情。令人惊奇的事情。”
他还提到了鹅厂的大混元模型和最近流行的ChatTTS
以本次的主角壁挂式智能手机为例。虽然各大厂商(上个月谷歌Android 15,几天后苹果iOS 18)都在布局大型移动机型,但经过这次事件,大家发现这家中国公司在这个赛道上也表现出色。 MiniCPM不仅体积小,而且仅用2.4B的数据规模就能实现数倍的模型能力。它不仅支持Android系统,还支持鸿蒙,在推理和解决问题上也不逊色。
视觉识别能力也相当不错,尤其是在中文图像场景下,表现比ChatGPT-4V更好。
此外,今天中午,Wallface官方还宣布,《小钢炮》MiniCPM决定免费向公众开放!对学术研究完全开放,企业和个人只需填写调查问卷进行注册即可获准商业使用。什么是格局~(战术后备)
世超觉得网友确实应该改变一些刻板印象。曾经很多人认为国产AI只是ChatGPT的一个外壳。如果这行不通,那也行不通。感谢XXX开源。不过,正如刘志远所说,虽然与国际领先模型还有差距,但中国的大模型已经从无名小卒成长为AI领域的关键推动者之一。至于这两个年轻人,希望你们不要再玩这种小把戏了。