CVPR再度上演抄襲大戲:IBM中稿論文被指照搬自己承辦競賽第二名的idea


一波未平,一波又起,CVPR2022又被曝出論文抄襲!這兩天,來自中國的研究團隊發現,自己去年參加ICDAR競賽的idea,竟然被IBM拿去投中瞭今年的CVPR。而這件事最諷刺的一點在於,ICDAR2021正是由IBM自己承辦的。

目前,作者已經將相關舉證信息發給瞭CVPR的Program Chairs。

這件事的熱度還在發酵。Reddit上的討論熱度即將破千。

然而,挑戰大廠的權威,又何談容易呢。

作者自述

下面,讓我們用第一人稱,還原一下原作者的自述。感受一下原作者的憤怒和委屈。

“我叫Xianbiao Qi,在計算機視覺領域搞研究已經十多年瞭。我寫這篇博客是為瞭揭露一起明目張膽的剽竊行為。IBM蘇黎世研究院剽竊瞭我們的研究。”

“他們抄的不是文本內容,他們抄的是我們辛辛苦苦做出來的idea。”

Xianbiao Qi所說的論文是“PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML”,於2021年6月上傳至arXiv,合作者有Jiaquan Ye, Xianbiao Qi和Yelin He等人。

此外,代碼也一並進行瞭開源。

論文地址:https://arxiv.org/abs/2105.01848

論文地址:https://arxiv.org/abs/2105.01848

而抄襲團隊則是來自IBM蘇黎世研究院的Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak和Peter Staar等人。

他們把最精華的點子吃幹抹凈帶走,然後把文章改頭換面地發在瞭IEEE/CVF計算機視覺和模式識別會議論文集上。

剽過來的文章名叫“TableFormer: Table Structure Understanding with Transformers”,請大傢擦亮慧眼。

論文地址:https://arxiv.org/abs/2203.01017

論文地址:https://arxiv.org/abs/2203.01017

Xianbiao Qi表示,Nassar等人的文章把我們的整體方法,以及預處理和後期處理的部分、可視化部分、推理部分、給出的系統解決方案都抄瞭過去。甚至還有代碼和預訓練模型。

但是,Nassar等人沒什麼別的本事,完美包裝卻熟練得很。他們的文章沒有一個字引用瞭Xianbiao Qi團隊的文章內容。他們以為這樣就能把查重蒙騙過去瞭。

通俗地講就是,研究生抄襲一般直接抄文字,而這位蘇黎世的博士後更“高級”——重寫idea。

實際上,這辦法還真行。Nassar等人的文章確實沒被判定為抄襲。最後還是其他很多專傢發現瞭兩篇文章在idea上的雷同,轉告給瞭Xianbiao Qi團隊。

在Reddit上,有不少網友表示支持作者維權,同時也提醒他在舉證的時候盡量不要帶有情緒,雖然很難做到。

也有網友指出,現在列出的證據遠非決定性的:

這兩個團隊在同一個問題上,使用相同的公開數據,解決方案也有相似之處。但這並不意味著一方抄襲瞭另一方。

而知乎上對此的討論也非常熱烈。

簡要時間線

事情就是這麼個事情,時間線還是有必要好好梳理一下的:

2021年4月7日,Xianbiao Qi團隊結束瞭ICDAR 2021表格識別競賽,並取得瞭第二名的成績。這是由澳大利亞的IBM小組舉辦的。

同年5月5日,團隊在arXiv上發表瞭想法的技術報告,以及預印版本。占瞭個坑。

兩個月之後的7月29日,團隊開源瞭相關代碼,甚至還在Github上公開瞭相關的幻燈片。

2021年9月,團隊發佈瞭TableMASTER的預訓練模型。11月,繼續發佈瞭tablemaster_mmocr的docker環境。

Xianbiao Qi自嘲道,“我們這個項目基本等於全裸瞭,該發佈的全發佈瞭。但我們發佈是為瞭造福整個社區,不是方便你們抄襲來的。”

年底,來也技術團隊在“表格識別方法評述及來也科技的實踐”提到瞭這篇論文:

TableMASTER從一個非常新穎的角度來解決表格識別問題,是一次大膽的嘗試,並且效果也是十分出色。PaddleOCR也用相似的思路開源瞭一個十分輕量的表格識別模型,並提供瞭PubTabNet數據集的預訓練模型,略有不同的是paddleTable采用瞭RARE和GRU而不是MASTER和transformer。

時間來到2022年3月2日,TableFormer發佈瞭。

當然,Xianbiao Qi憤怒之下沒有喪失冷靜,他列舉瞭九大證據,實錘抄襲。

9大證據

Our methodology, you plagiarize

Our Pre-processing, you plagiarize

Our Post-processing, you plagiarize

Our Inference speedup method,  you plagiarize

Our"tricky"work, you even plagiarize

Our text line detection and text line recognition, you plagiarize

Our systematic solution, you plagiarize

Our visualization, you plagiarize

Misleading the audiences in order to not be captured for plagiarism

第一,方法論部分,抄瞭。

TableFormer直接抄襲瞭Xianbiao Qi團隊的點子,把文字部分改寫瞭。

而且關鍵的圖表也重新畫瞭一遍。但是核心思想是雷同的。

第二,預處理階段,抄瞭。

Nassar等人直接盜用瞭齊憲標團隊的序列長度最大值500,然後悄悄改成瞭512。其實為什麼改成這個數他們自己也不清楚。

第三,後期處理部分,抄瞭。

Xianbiao Qi的團隊設計瞭三個巧妙的規則來處理後期部分。

而抄襲團隊直接根據Qi的團隊放出的開源代碼,把三個規則寫成瞭9條。

而這些規則和代碼是Xianbiao Qi的團隊花瞭好幾周的時間才完成的。

第四,推理加速方法,抄瞭。

在推理階段,Xianbiao Qi團隊在之前的論文中提出瞭一種memory-cache方法。而Nassar等人直接就用瞭。

Xianbiao Qi表示,“你們真懂是啥意思嗎就用?”

第五,小技巧,居然也抄瞭。

第六,文本行檢測和文本行識別,抄瞭。

Xianbiao Qi團隊訓練文本行檢測和識別的過程,Nassar等人直接抄瞭。

第七,系統化解決方案,抄瞭。

兩邊的處理過程完全一樣,不可能完全是巧合。

第八,可視化部分,抄瞭。

可以看到,可視化的圖標部分,Nassar等人隻是換瞭個顏色。

第九,用各種手段誤導讀者,避免因為剽竊被抓到。

最後,作者表示這次學到的最深刻的教訓就是:“即使開源瞭代碼,也不要開源自己訓練好的模型。”


相關推薦

2022-06-28

,韓國有聲音擔心,這次事件會是“黃禹錫事件”的二度上演。2005年,曾任首爾大學獸醫學院首席教授、一度被視為韓國民族英雄的黃禹錫,被揭發偽造多項研究成果。其在《Science》上發表的幹細胞研究均屬子虛烏有。2009年,

2022-06-27

全球頂級學術會議(CVPR)上展示瞭研究成果,但被發現抄襲並受到各方嚴厲批評。韓國國內擔心,該醜聞有可能發酵為第二起“黃禹錫事件”。“一個單詞都沒有改變”CVPR是人工智能和機器學習領域的全球頂級學術會議。“CVPR

2022-07-29

人才都已成長起來,平時在“討論出idea、頭腦風暴、寫論文”之餘經常“有好多空餘時間不知道幹嘛”,因此想在繼續從事基礎科研的同時,試著去做些業務,“擴大自己的skill set(技能樹)”。因此,他選擇加入商湯,希望

2022-07-17

“2處屬於抄襲,4處引用不規范。”“相關責任人均已主動離職。”“大模型研究中心部門重組。”……一篇名為ARoadmapforBigModel、由百人聯合完成的綜述報告,因涉嫌抄襲在國內外學術圈引發不小的關註。對此,涉事單位北京智

2023-01-30

圍之內。2021年6月,小雞詞典曾起訴新浪微博國際版大量抄襲照搬,起因經過可點此查看。

2022-06-23

最高,占全部的44.59%;同濟大學、阿裡集團拿下最佳學生論文獎;黃煦濤紀念獎花落斯坦福大學教授李飛飛;《LearningtoSolveHardMinimalProblems》獲最佳論文獎。除此之外,值得一提的是,今年CVPR大會特設瞭緬懷近期因病去世的青年A

2024-01-31

多傢媒體報道,博主楊藩講藝術發視頻稱與輝同行直播間抄襲自己的視頻文案。楊藩稱,與輝同行主播董董解說米開朗基羅的內容、架構、用語與自己早前發佈的視頻幾乎一模一樣。對此,律師指出,直播、短視頻的文案是有版

2022-07-25

據報道,今年10月,特斯拉將去參加和解會議,就其首席執行官埃隆·馬斯克(ElonMusk)2018年關於將公司私有化的推文的證券欺詐案進行談判。此次會議有可能讓本案正式結束。起訴特斯拉和馬斯克的投資者在該案中取得穩步進

2023-01-16

據日媒報道,一項研究顯示,中國是人工智能(AI)研究論文領域無可爭議的領導者,在數量和質量上都遠遠超過美國。根據該研究,從AI論文數量來看,中國一直位居世界第一。2021年,中國發表4.3萬篇論文,大約是美國的兩倍;

2024-02-01

董宇輝因“直播間被指大規模抄襲”事件備受關註。風波尚未平息時,他開啟一場直播之旅——昨晚,他與劉德華、導演寧浩同框,言語中表示“當一起事件發酵時,沒有人在乎事實,都會把這個事件放大,都想自己受益,事實

2022-09-02

的欺詐軟件和“山寨鍵盤”軟件,此外蘋果官方軟件存在抄襲開發者的情況。這位開發者的名字叫做雷瑟林(KostaEleftheriou),他開發一款蘋果手表上使用的鍵盤(輸入工具)FlickType。雷瑟林在蘋果開發者群體中有一些名氣,因

2023-03-14

放量、口碑一路狂飆”。不過2月初,《狂飆》片頭涉嫌抄襲網飛紀錄片《無辜檔案》的消息引起熱議,從對比視頻來看,《狂飆》片頭的確有許多元素與《無罪檔案》類似,比如用一張圖片展示人物不同時期的樣貌、色調的設

2022-07-19

2016年的時候就已經很明確,而在2014年左右,已經有研究論文發表。“設備廠商很清楚知道我們的目標在哪裡,兩年後必須要有一個什麼樣的機器,如果沒做出來,我們的設備就很容易被淘汰。”一位設備廠的研發人員告訴《財

2022-08-20

印度移動支付平臺Paytm創始人或將面臨自IPO以來最大的考驗——是否留任。Paytm重要股東、印度投資公司IIAS反對其繼續“掌舵”,因其無法兌現盈利且薪資過高。當地時間8月19日周五,“印度支付寶”Paytm的創始人或將面臨自IPO