計算機視覺領域如何從別人的論文裡獲取自己的idea?

視學演算法發表於2020-04-06

點選上方“視學演算法”,選擇“星標”公眾號

重磅乾貨,第一時間送達

計算機視覺領域如何從別人的論文裡獲取自己的idea?

來源:知乎  整理:Amusi  https://www.zhihu.com/question/353691411

本文僅作為學術分享,如果侵權,會刪文處理

計算機視覺領域如何從別人的論文裡獲取自己的idea?

作者:Cheng Li
https://www.zhihu.com/question/353691411/answer/900046621

發現看的人有點多 (為了避免誤導)感覺要補充說明下

如果只是A+B需要說明為什麼是non-trivial的

一般至少要改成A+B'

或者A+B+C比較容易發

比如之前搞過一篇

其實是Unsupervised Landmark + VUNet的decompose + CycleGAN

如果只是前面兩個term做到一半的時候試著投ICLR 就沒成。。。

後來把CycleGAN的部分做完CVPR就中了。。。

(因為好像點讚的人很多我們後面整理一下自己的publication,其實很多時候A+B'也可以做出還不錯的想法)


原來回答:

我其實有個不錯的想法。。。

找40篇比較新的oral paper

最好是開源的、你能看懂的、儘可能時髦的、大佬點讚的。

然後畫一個40*40的矩陣。。

對角線上的元素不看,還剩下1560個元素

每個元素看看A+B是不是靠譜

雖然可能99%都不靠譜。。。

但是還是有可能篩出來15篇左右的idea。。。。

(如果考慮交換性可能只有7篇也夠了。。。)

或者你找40篇比較新的不是你發的oral paper,

再找K篇自己的paper,也可以做這個事情。

這樣就不用排除對角元素了


個人的publication水平還不高

不過很多其實也不是A+B產生的。。

比如CNN之前的話

有一些是發資料集的

Pixel-level hand detection in ego-centric videos

有一些其實是一個經典pipeline裡面有A+B+C很多步

別人討論B,C等步驟比較多,但是A步驟也很重要

想出一個A的trick最後發展出一片文章

Face alignment by coarse-to-fine shape searching

A+B也可以有一些跨度大的時候,也能產生一些還比較有趣的想法。。

並不是簡簡單單的incremental work

比如把推薦系統用在分類器推薦(CNN時代之前)。。

Model recommendation with virtual probes for egocentric hand detection

分而治之也是常見思路,任何topic都可以加(CNN時代之前)

Unconstrained face alignment via cascaded compositional learning

還有有的時候看到別人RL+tracking的文章,想到手裡的聚類也可以這麼做,就搞了一個

A+B(不過步子扯有點大老是被拒後來就投了AAAI)

Merge or not? learning to group faces via imitation learning

今年還看到有人用GCN聚類所以結合GCN重新投了一篇。。。

(還沒release)

類似這樣。。

還有有時候可以做一些哲學討論,就不是簡單的A+B了

The devil of face recognition is in the noise


我好擔心老闆們看到這個說我誤人子弟啊。。。

作者:寫bug的程旭源
https://www.zhihu.com/question/353691411/answer/897499123

idea不是單單看論文就能想出來,很多場景下都可能有idea,這需要靈感。

你意思應該是research scope 或者research problems吧?

一般先看introduction和conclusion,會知道這篇論文做了什麼、貢獻是什麼、實驗結果,以及未來工作展望。future work可以作為一個啟發。如果文章研究方向、用的演算法你感興趣,可以去experiment那裡看看,設計思路、框架,去discussion那裡看看實驗分析,結果效果不好的地方都可能作為research problem。

那對應的解決方法——你的idea ,可能牽扯到你理論基礎底蘊、論文復現時候的靈感、實力應用場景的啟發等多方面。

如果上邊說的太抽象,那就一句話吧,復現你感興趣的論文,復現的過程中多想,就有idea了。

作者:張小雨
https://www.zhihu.com/question/353691411/answer/899997687

從論文題目,概要,引言,結論和討論入手。

首先談題目

每年的CS論文都很多很多,但是我們沒有精力一一閱覽,所以通過題目可以篩選掉很多自己不care的方向。可以減小自己尋找idea的精力成本。

其次,從概要入手,看論文主要針對什麼問題,大概方法是什麼,最後結論是什麼。牢牢把握住這三點。

最後看討論和結論部分,這裡往往是尋找idea的重點所在。看討論部分,有哪些問題說的不清楚,或者作者寫的不夠完善,一些現象的原因探究不夠徹底等等這些方面都可以嘗試著去挖掘。至於結論部分,也是如此,看作者運用了什麼方法,什麼評價指標,得出了什麼結論,可以思考方法是否最優,評價指標是否最好,如果更換以後,結論是否一致,如果一致的話,那麼可以驗證本文,如果不一致,那麼原因在哪裡,我們在進行這類研究時,需要考慮哪些因素的影響。

另外,對論文的整理歸類也十分重要,看得有一定數量以後,就會明白,針對某一個問題,主要研究方法有哪些,做的程度如何,理解需要改進,深入,補足,問題遷移到其他領域甚至是提出創新性方法的地方,這都是平時的點滴積累。

作者:LeapMay
https://www.zhihu.com/question/353691411/answer/910600098

第一,先把別人論文裡的程式碼復現一下,搞懂methdology,搞懂code,把別人的論文吃透。

第二,仔細琢磨論文裡conclusion裡的結語和下一步工作方向。

第三,尋找論文方法裡的欠缺,模型是否可以優化,思路是否可以精簡,結合自己的儲備,初步判斷自己可以開闢的點,然後儘量和周圍大牛進行討論交流。

第四, 根據自己可以立足的點,著手理論推導和工程實現,進一步提煉idea。

- END -

如果看到這裡,說明你喜歡這篇文章,請轉發、點贊掃描下方二維碼或者微信搜尋「perfect_iscas」,新增好友後即可獲得10套程式設計師全棧課程+1000套PPT和簡歷模板向我私聊「進群」二字即可進入高質量交流群。

掃描二維碼進群↓

計算機視覺領域如何從別人的論文裡獲取自己的idea?

計算機視覺領域如何從別人的論文裡獲取自己的idea?

計算機視覺領域如何從別人的論文裡獲取自己的idea?

在看 計算機視覺領域如何從別人的論文裡獲取自己的idea?

相關文章