計算機視覺領域如何從別人的論文裡獲取自己的idea?
點選上方“視學演算法”,選擇“星標”公眾號
重磅乾貨,第一時間送達
來源:知乎 整理:Amusi https://www.zhihu.com/question/353691411
本文僅作為學術分享,如果侵權,會刪文處理
計算機視覺領域如何從別人的論文裡獲取自己的idea?
作者:Cheng Li
https://www.zhihu.com/question/353691411/answer/900046621
發現看的人有點多 (為了避免誤導)感覺要補充說明下
如果只是A+B需要說明為什麼是non-trivial的
一般至少要改成A+B'
或者A+B+C比較容易發
比如之前搞過一篇
其實是Unsupervised Landmark + VUNet的decompose + CycleGAN
如果只是前面兩個term做到一半的時候試著投ICLR 就沒成。。。
後來把CycleGAN的部分做完CVPR就中了。。。
(因為好像點讚的人很多我們後面整理一下自己的publication,其實很多時候A+B'也可以做出還不錯的想法)
原來回答:
我其實有個不錯的想法。。。
找40篇比較新的oral paper
最好是開源的、你能看懂的、儘可能時髦的、大佬點讚的。
然後畫一個40*40的矩陣。。
對角線上的元素不看,還剩下1560個元素
每個元素看看A+B是不是靠譜
雖然可能99%都不靠譜。。。
但是還是有可能篩出來15篇左右的idea。。。。
(如果考慮交換性可能只有7篇也夠了。。。)
或者你找40篇比較新的不是你發的oral paper,
再找K篇自己的paper,也可以做這個事情。
這樣就不用排除對角元素了
個人的publication水平還不高
不過很多其實也不是A+B產生的。。
比如CNN之前的話
有一些是發資料集的
Pixel-level hand detection in ego-centric videos
有一些其實是一個經典pipeline裡面有A+B+C很多步
別人討論B,C等步驟比較多,但是A步驟也很重要
想出一個A的trick最後發展出一片文章
Face alignment by coarse-to-fine shape searching
A+B也可以有一些跨度大的時候,也能產生一些還比較有趣的想法。。
並不是簡簡單單的incremental work
比如把推薦系統用在分類器推薦(CNN時代之前)。。
Model recommendation with virtual probes for egocentric hand detection
分而治之也是常見思路,任何topic都可以加(CNN時代之前)
Unconstrained face alignment via cascaded compositional learning
還有有的時候看到別人RL+tracking的文章,想到手裡的聚類也可以這麼做,就搞了一個
A+B(不過步子扯有點大老是被拒後來就投了AAAI)
Merge or not? learning to group faces via imitation learning
今年還看到有人用GCN聚類所以結合GCN重新投了一篇。。。
(還沒release)
類似這樣。。
還有有時候可以做一些哲學討論,就不是簡單的A+B了
The devil of face recognition is in the noise
我好擔心老闆們看到這個說我誤人子弟啊。。。
作者:寫bug的程旭源
https://www.zhihu.com/question/353691411/answer/897499123
idea不是單單看論文就能想出來,很多場景下都可能有idea,這需要靈感。
你意思應該是research scope 或者research problems吧?
一般先看introduction和conclusion,會知道這篇論文做了什麼、貢獻是什麼、實驗結果,以及未來工作展望。future work可以作為一個啟發。如果文章研究方向、用的演算法你感興趣,可以去experiment那裡看看,設計思路、框架,去discussion那裡看看實驗分析,結果效果不好的地方都可能作為research problem。
那對應的解決方法——你的idea ,可能牽扯到你理論基礎底蘊、論文復現時候的靈感、實力應用場景的啟發等多方面。
如果上邊說的太抽象,那就一句話吧,復現你感興趣的論文,復現的過程中多想,就有idea了。
作者:張小雨
https://www.zhihu.com/question/353691411/answer/899997687
從論文題目,概要,引言,結論和討論入手。
首先談題目
每年的CS論文都很多很多,但是我們沒有精力一一閱覽,所以通過題目可以篩選掉很多自己不care的方向。可以減小自己尋找idea的精力成本。
其次,從概要入手,看論文主要針對什麼問題,大概方法是什麼,最後結論是什麼。牢牢把握住這三點。
最後看討論和結論部分,這裡往往是尋找idea的重點所在。看討論部分,有哪些問題說的不清楚,或者作者寫的不夠完善,一些現象的原因探究不夠徹底等等這些方面都可以嘗試著去挖掘。至於結論部分,也是如此,看作者運用了什麼方法,什麼評價指標,得出了什麼結論,可以思考方法是否最優,評價指標是否最好,如果更換以後,結論是否一致,如果一致的話,那麼可以驗證本文,如果不一致,那麼原因在哪裡,我們在進行這類研究時,需要考慮哪些因素的影響。
另外,對論文的整理歸類也十分重要,看得有一定數量以後,就會明白,針對某一個問題,主要研究方法有哪些,做的程度如何,理解需要改進,深入,補足,問題遷移到其他領域甚至是提出創新性方法的地方,這都是平時的點滴積累。
作者:LeapMay
https://www.zhihu.com/question/353691411/answer/910600098
第一,先把別人論文裡的程式碼復現一下,搞懂methdology,搞懂code,把別人的論文吃透。
第二,仔細琢磨論文裡conclusion裡的結語和下一步工作方向。
第三,尋找論文方法裡的欠缺,模型是否可以優化,思路是否可以精簡,結合自己的儲備,初步判斷自己可以開闢的點,然後儘量和周圍大牛進行討論交流。
第四, 根據自己可以立足的點,著手理論推導和工程實現,進一步提煉idea。
- END -
如果看到這裡,說明你喜歡這篇文章,請轉發、點贊。掃描下方二維碼或者微信搜尋「perfect_iscas」,新增好友後即可獲得10套程式設計師全棧課程+1000套PPT和簡歷模板,向我私聊「進群」二字即可進入高質量交流群。
↓掃描二維碼進群↓
喜歡文章,點個在看
相關文章
- 計算機視覺、機器學習相關領域論文和原始碼大集合計算機視覺機器學習原始碼
- 2024年3月的計算機視覺論文推薦計算機視覺
- iOS計算機視覺—人臉識別iOS計算機視覺
- 計算機視覺論文集計算機視覺
- 必看,10篇定義計算機視覺未來的論文計算機視覺
- 一文讀懂計算機視覺中的深度域適應計算機視覺
- 2024年4月計算機視覺論文推薦計算機視覺
- 2020年十大計算機視覺論文 - kdnuggets計算機視覺
- 如何寫/審AI領域的論文AI
- 從穿戴計算到智慧機器人,立體視覺領域「黑馬」INDEMIND成長記機器人視覺
- Alan Yuille:在計算機視覺領域,誰是殺死神經網路的真凶?UI計算機視覺神經網路
- 工業機器人領域機器視覺的四個顯著功能機器人視覺
- 計算機視覺專案-人臉識別與檢測計算機視覺
- 解讀 | 2019年10篇計算機視覺精選論文(上)計算機視覺
- 智慧噴灑:計算機視覺在農業機械自動化領域的小試牛刀計算機視覺
- 大模型時代的計算機視覺!CVPR 2024線上論文分享會啟動大模型計算機視覺
- 嵌入式視覺領域的機器學習視覺機器學習
- ACM MM & ECCV 2022 | 美團視覺8篇論文揭秘內容領域的智慧科技ACM視覺
- 獲“艾美獎”的計算機視覺專家Andrew博士:不斷為自己創造謎題計算機視覺
- 憑藉在計算機視覺領域長期的技術深耕以及豐富的場景經驗計算機視覺
- 計算機視覺學習之路------你想要的都在這裡了計算機視覺
- 計算機視覺—人臉識別(Haar特徵+Adaboost分類器)(7)計算機視覺特徵
- 計算機視覺—人臉識別(Hog特徵+SVM分類器)(8)計算機視覺HOG特徵
- 全球計算機視覺頂會CVPR 2019論文出爐:騰訊優圖25篇論文入選計算機視覺
- 2024年6月計算機視覺論文推薦:擴散模型、視覺語言模型、影片生成等計算機視覺模型
- 谷歌的googLeNet卷積神經網路為什麼在計算機視覺領域如此強大?谷歌Go卷積神經網路計算機視覺
- 重新審視雲端計算領域的“鼻祖”AWS
- [AI開發]Python+Tensorflow打造自己的計算機視覺API服務AIPython計算機視覺API
- 超全!深度學習在計算機視覺領域應用一覽(附連結)深度學習計算機視覺
- 盤點國內八家初創計算機視覺領域優質企業計算機視覺
- 計算機視覺中的深度學習計算機視覺深度學習
- 從智慧化“天眼”看計算機視覺未來計算機視覺
- 如何實時接收某一領域的最新科研論文
- 計算機經典論文計算機
- 【計算機視覺前沿研究 熱點 頂會】ECCV 2024中目標檢測有關的論文計算機視覺
- 計算機視覺中的注意力機制計算機視覺
- iOS計算機視覺—ARKitiOS計算機視覺
- Hugging Face 中計算機視覺的現狀Hugging Face計算機視覺