计算机视觉领域如何从别人的论文里获取自己的idea?

  • 2019 年 12 月 6 日
  • 筆記

编辑:Amusi 来源:知乎

https://www.zhihu.com/question/353691411

本文仅作为学术分享,如果侵权,会删文处理

计算机视觉领域如何从别人的论文里获取自己的idea?

作者:Cheng Li https://www.zhihu.com/question/353691411/answer/900046621

发现看的人有点多 (为了避免误导)感觉要补充说明下

如果只是A+B需要说明为什么是non-trivial的

一般至少要改成A+B'

或者A+B+C比较容易发

比如之前搞过一篇

其实是Unsupervised Landmark + VUNet的decompose + CycleGAN

如果只是前面两个term做到一半的时候试着投ICLR 就没成。。。

后来把CycleGAN的部分做完CVPR就中了。。。

(因为好像点赞的人很多我们后面整理一下自己的publication,其实很多时候A+B'也可以做出还不错的想法)


原来回答:

我其实有个不错的想法。。。

找40篇比较新的oral paper

最好是开源的、你能看懂的、尽可能时髦的、大佬点赞的。

然后画一个40*40的矩阵。。

对角线上的元素不看,还剩下1560个元素

每个元素看看A+B是不是靠谱

虽然可能99%都不靠谱。。。

但是还是有可能筛出来15篇左右的idea。。。。

(如果考虑交换性可能只有7篇也够了。。。)

或者你找40篇比较新的不是你发的oral paper,

再找K篇自己的paper,也可以做这个事情。

这样就不用排除对角元素了


个人的publication水平还不高

不过很多其实也不是A+B产生的。。

比如CNN之前的话

有一些是发数据集的

Pixel-level hand detection in ego-centric videos

有一些其实是一个经典pipeline里面有A+B+C很多步

别人讨论B,C等步骤比较多,但是A步骤也很重要

想出一个A的trick最后发展出一片文章

Face alignment by coarse-to-fine shape searching

A+B也可以有一些跨度大的时候,也能产生一些还比较有趣的想法。。

并不是简简单单的incremental work

比如把推荐系统用在分类器推荐(CNN时代之前)。。

Model recommendation with virtual probes for egocentric hand detection

分而治之也是常见思路,任何topic都可以加(CNN时代之前)

Unconstrained face alignment via cascaded compositional learning

还有有的时候看到别人RL+tracking的文章,想到手里的聚类也可以这么做,就搞了一个

A+B(不过步子扯有点大老是被拒后来就投了AAAI)

Merge or not? learning to group faces via imitation learning

今年还看到有人用GCN聚类所以结合GCN重新投了一篇。。。

(还没release)

类似这样。。

还有有时候可以做一些哲学讨论,就不是简单的A+B了

The devil of face recognition is in the noise


我好担心老板们看到这个说我误人子弟啊。。。

作者:写bug的程旭源 https://www.zhihu.com/question/353691411/answer/897499123

idea不是单单看论文就能想出来,很多场景下都可能有idea,这需要灵感。

你意思应该是research scope 或者research problems吧?

一般先看introduction和conclusion,会知道这篇论文做了什么、贡献是什么、实验结果,以及未来工作展望。future work可以作为一个启发。如果文章研究方向、用的算法你感兴趣,可以去experiment那里看看,设计思路、框架,去discussion那里看看实验分析,结果效果不好的地方都可能作为research problem。

那对应的解决方法——你的idea ,可能牵扯到你理论基础底蕴、论文复现时候的灵感、实力应用场景的启发等多方面。

如果上边说的太抽象,那就一句话吧,复现你感兴趣的论文,复现的过程中多想,就有idea了。

作者:张小雨 https://www.zhihu.com/question/353691411/answer/899997687

从论文题目,概要,引言,结论和讨论入手。

首先谈题目

每年的CS论文都很多很多,但是我们没有精力一一阅览,所以通过题目可以筛选掉很多自己不care的方向。可以减小自己寻找idea的精力成本。

其次,从概要入手,看论文主要针对什么问题,大概方法是什么,最后结论是什么。牢牢把握住这三点。

最后看讨论和结论部分,这里往往是寻找idea的重点所在。看讨论部分,有哪些问题说的不清楚,或者作者写的不够完善,一些现象的原因探究不够彻底等等这些方面都可以尝试着去挖掘。至于结论部分,也是如此,看作者运用了什么方法,什么评价指标,得出了什么结论,可以思考方法是否最优,评价指标是否最好,如果更换以后,结论是否一致,如果一致的话,那么可以验证本文,如果不一致,那么原因在哪里,我们在进行这类研究时,需要考虑哪些因素的影响。

另外,对论文的整理归类也十分重要,看得有一定数量以后,就会明白,针对某一个问题,主要研究方法有哪些,做的程度如何,理解需要改进,深入,补足,问题迁移到其他领域甚至是提出创新性方法的地方,这都是平时的点滴积累。

作者:LeapMay https://www.zhihu.com/question/353691411/answer/910600098

第一,先把别人论文里的代码复现一下,搞懂methdology,搞懂code,把别人的论文吃透。

第二,仔细琢磨论文里conclusion里的结语和下一步工作方向。

第三,寻找论文方法里的欠缺,模型是否可以优化,思路是否可以精简,结合自己的储备,初步判断自己可以开辟的点,然后尽量和周围大牛进行讨论交流。

第四, 根据自己可以立足的点,着手理论推导和工程实现,进一步提炼idea。