美國留學(xué)選擇什么專業(yè)好?留學(xué)美國熱門專業(yè)推薦
2019-06-26
更新時間:2024-06-08 17:00作者:小樂
最近AI圈又傳來一個大新聞,《斯坦福團隊抄襲中國 AI !》。估計很多人剛看到這個標題,也和石超一樣一頭霧水。啊?你瞎了嗎?哪個斯坦福?你確定這不是相反嗎?
你猜怎么著,這就是QS排名前五的美國斯坦福大學(xué)。不說國內(nèi)網(wǎng)友,行業(yè)大佬們也按捺不住,表示時代變了。
準確的說,應(yīng)該是斯坦福本科生團隊抄襲了一家清華博士創(chuàng)業(yè)公司的產(chǎn)品,那就是面墻智能的開源模型:MiniCPM-Llama3-V 2.5小鋼炮。事情要從5月29日說起。這一天,兩位來自斯坦福大學(xué)的印度年輕人,其中一位與佛陀(Siddharth)同名,在全球最大的AI 開源社區(qū)—— HuggingFace 上發(fā)布了他們的大型模型Llama-3-V。
看著他們光鮮亮麗的實習(xí)簡歷,分別來自特斯拉和SpaceX,網(wǎng)友們很快就把這位號稱“500美元就能訓(xùn)練到和GPT-4V、Gemini Ultra一樣出色”的后起之秀放在了HuggingFace主頁上,推文瀏覽量也突破了30萬。
一開始,可能有人會想:我們國家世代人才輩出。你看,本科生也能取得與大公司不相上下的成績。世界一流意味著什么?很快,一些眼尖的業(yè)內(nèi)人士就發(fā)現(xiàn)了不對勁。你這個東西看起來和21號的MiniCPM大炮很像,無法復(fù)制。為啥不標明出處?
人們之所以第一眼就認定它是抄襲,主要是因為它聲稱具有體積小、性能強、多模態(tài)等特點。很難不將其與清華的MiniCPM進行比較。但他也表示自己是原創(chuàng),沒有引用MiniCPM。然而,面對別人的指責,這個大學(xué)生團隊仍然表示MiniCPM引用了LLaVA-UHD。我們也引用了這一點。這是學(xué)者的問題。這能叫抄襲嗎?假裝困惑真是天才。
問題是MiniCPM和LLaVA-UHD原來的外觀早就不一樣了,你的Llama3-V的外觀不能說和LLaVA-UHD一模一樣,至少和它沒有關(guān)系,但是看起來就像是同一個母親的孩子。讓我們把它們放在一起仔細看看。好家伙,即使模型結(jié)構(gòu)和別人類似,配置文件也是一模一樣的。
再看一下代碼,除了增加了一些格式和改變了幾個變量名之外,沒有什么區(qū)別。甚至清華大學(xué)專門定義的特殊符號在你的代碼中也沒有被改變。更搞笑的是,有網(wǎng)友發(fā)現(xiàn)運行Llama3-V時,斯坦福團隊提供的權(quán)重文件(神經(jīng)網(wǎng)絡(luò)微調(diào)的參數(shù))無法運行,但如果將變量名改為MiniCPM-Llama3-V 2.5,就可以順利啟動了。
事情都敲定了,印度小伙依然不肯承認。很快,收到消息的Wallface Intelligence 官方也得出了結(jié)論,稱Llama3-V 項目的作者并沒有完全理解MiniCPM-Llama3-V 2.5 的架構(gòu),甚至連他們自己的代碼也沒有完全理解。換句話說,就是很陰陽,“抄了也不懂。”
此外,墻面團隊還出示了雷神之錘的證據(jù)。 Llama3-V居然可以識別清華簡!清華竹簡是清華校友捐贈的重要文物。這些埋藏于戰(zhàn)國時期的竹簡,躲過了秦始皇的焚書,保存了包括古籍《尚書》、先秦史料、醫(yī)學(xué)哲學(xué)等在內(nèi)的極其珍貴的原始檔案,總之是上古時代。版本《永樂大典》。清華簡認其實是MiniCPM-Llama3-V 2.5開發(fā)過程中內(nèi)置的一個彩蛋。所有訓(xùn)練識別的數(shù)據(jù)都是Facewall Intelligence與清華大學(xué)合作逐字掃描和標注的,從未公開。斯坦福團隊不可能獲得這些完全私密的數(shù)據(jù),但兩個模型都能實現(xiàn)識別,甚至錯誤都一模一樣。
至此,可以說他們100%抄襲了,這是板上釘釘?shù)氖虑榱?。這兩個印度哥們是如何在數(shù)萬人的毆打和全世界網(wǎng)友的嘲諷下做到的呢?回答,刪除數(shù)據(jù)庫,逃跑!
他們立即在HuggingFace 上刪除了Llama3-V 模型,并表示:“非常感謝那些在評論中指出與之前研究相似之處的人。我們意識到我們的架構(gòu)與OpenBMB 的MiniCPM-Llama3-V 2.5 非常相似,它們是一步之遙我們已經(jīng)刪除了關(guān)于作者的原始模型,“不,太多了。你還想炫耀嗎?”然后他們就連續(xù)跪下道歉了三遍,說我們兩兄弟只是推廣而已,代碼外包給了南加州大學(xué)的另一個家伙,不公平!
但事情鬧大了,可恥的斯坦福大學(xué)官員也趕緊制止了。他們的人工智能實驗室主任、Google Deepmind 研究員Christopher David Manning 直接發(fā)文,“典型的是不承認自己的錯誤!” MiniCPM 向這個中國開源模式致敬。
被抄襲的面墻智能聯(lián)合創(chuàng)始人劉志遠對他們喊道:“團隊里的三個人,有兩個只是斯坦福大學(xué)的本科生,未來的路還很長,如果你們知道承認自己的錯誤并改正它們,你就可以做很多好事?!?Wall Face CEO李大海也幽默回應(yīng):“我們對這起事件深感遺憾。一方面,我們覺得這也是獲得國際團隊認可的一種方式。另一方面,我們呼吁大家構(gòu)建一個開放的平臺?!?,合作和信任的社區(qū)環(huán)境。“我們希望團隊的優(yōu)秀工作能夠被更多人注意到和認可,但不是以這種方式?!?
話雖如此,這次事件確實讓大家注意到,國產(chǎn)AI似乎并不是刻板印象。就連一開始的大佬、Hugging Face 負責人Omar Sanseviero 也表示,“社區(qū)一直忽視中國機器學(xué)習(xí)生態(tài)系統(tǒng)的工作。他們正在用有趣的大語言模型、大視覺模型、音頻和擴散模型做一些令人興奮的事情。太神奇了。”并提到了鵝廠渾源模式和最近流行的ChatTTS。
以本次的主角壁掛式智能手機為例。雖然各大廠商(上個月谷歌Android 15,幾天后蘋果iOS 18)都在布局大型移動機型,但經(jīng)過這次事件,大家發(fā)現(xiàn)這家中國公司在這個賽道上也表現(xiàn)出色。 MiniCPM不僅體積小,而且僅用2.4B的數(shù)據(jù)量就能實現(xiàn)數(shù)倍的模型能力。它不僅支持Android系統(tǒng),還支持鴻蒙,在推理和解決問題上也不遜色。
視覺識別能力也相當不錯,尤其是在中文圖像場景下,表現(xiàn)比ChatGPT-4V更好。
此外,今天中午,Wallface官方還宣布,《小鋼炮》MiniCPM決定免費向公眾開放!對學(xué)術(shù)研究完全開放,企業(yè)和個人只需填寫調(diào)查問卷進行注冊即可獲準商業(yè)使用。什么是格局~(戰(zhàn)術(shù)后備)
世超覺得網(wǎng)友確實應(yīng)該改變一些刻板印象。曾經(jīng)很多人認為國產(chǎn)AI只是ChatGPT的一個外殼。如果這行不通,那也行不通。感謝XXX開源。不過,正如劉志遠所說,雖然與國際領(lǐng)先模型還有差距,但中國的大模型已經(jīng)從無名小卒成長為人工智能應(yīng)用的關(guān)鍵推動者之一。至于這兩個年輕人,希望你們不要再玩這種小把戲了。
來源:負面評論