计算机视觉领域如何从别人的论文里获取自己的idea？

2019 年 12 月 6 日
筆記

编辑：Amusi 来源：知乎

https://www.zhihu.com/question/353691411

本文仅作为学术分享，如果侵权，会删文处理

计算机视觉领域如何从别人的论文里获取自己的idea？

作者：Cheng Li https://www.zhihu.com/question/353691411/answer/900046621

发现看的人有点多（为了避免误导）感觉要补充说明下

如果只是A+B需要说明为什么是non-trivial的

一般至少要改成A+B'

或者A+B+C比较容易发

比如之前搞过一篇

其实是Unsupervised Landmark + VUNet的decompose + CycleGAN

如果只是前面两个term做到一半的时候试着投ICLR 就没成。。。

后来把CycleGAN的部分做完CVPR就中了。。。

（因为好像点赞的人很多我们后面整理一下自己的publication，其实很多时候A+B'也可以做出还不错的想法）

原来回答：

我其实有个不错的想法。。。

找40篇比较新的oral paper

最好是开源的、你能看懂的、尽可能时髦的、大佬点赞的。

然后画一个40*40的矩阵。。

对角线上的元素不看，还剩下1560个元素

每个元素看看A+B是不是靠谱

虽然可能99%都不靠谱。。。

但是还是有可能筛出来15篇左右的idea。。。。

（如果考虑交换性可能只有7篇也够了。。。）

或者你找40篇比较新的不是你发的oral paper，

再找K篇自己的paper，也可以做这个事情。

这样就不用排除对角元素了

个人的publication水平还不高

不过很多其实也不是A+B产生的。。

比如CNN之前的话

有一些是发数据集的

Pixel-level hand detection in ego-centric videos

有一些其实是一个经典pipeline里面有A+B+C很多步

别人讨论B，C等步骤比较多，但是A步骤也很重要

想出一个A的trick最后发展出一片文章

Face alignment by coarse-to-fine shape searching

A+B也可以有一些跨度大的时候，也能产生一些还比较有趣的想法。。

并不是简简单单的incremental work

比如把推荐系统用在分类器推荐（CNN时代之前）。。

Model recommendation with virtual probes for egocentric hand detection

分而治之也是常见思路，任何topic都可以加（CNN时代之前）

Unconstrained face alignment via cascaded compositional learning

还有有的时候看到别人RL+tracking的文章，想到手里的聚类也可以这么做，就搞了一个

A+B（不过步子扯有点大老是被拒后来就投了AAAI）

Merge or not? learning to group faces via imitation learning

今年还看到有人用GCN聚类所以结合GCN重新投了一篇。。。

（还没release）

类似这样。。

还有有时候可以做一些哲学讨论，就不是简单的A+B了

The devil of face recognition is in the noise

我好担心老板们看到这个说我误人子弟啊。。。

作者：写bug的程旭源 https://www.zhihu.com/question/353691411/answer/897499123

idea不是单单看论文就能想出来，很多场景下都可能有idea，这需要灵感。

你意思应该是research scope 或者research problems吧？

一般先看introduction和conclusion，会知道这篇论文做了什么、贡献是什么、实验结果，以及未来工作展望。future work可以作为一个启发。如果文章研究方向、用的算法你感兴趣，可以去experiment那里看看，设计思路、框架，去discussion那里看看实验分析，结果效果不好的地方都可能作为research problem。

那对应的解决方法——你的idea ，可能牵扯到你理论基础底蕴、论文复现时候的灵感、实力应用场景的启发等多方面。

如果上边说的太抽象，那就一句话吧，复现你感兴趣的论文，复现的过程中多想，就有idea了。

作者：张小雨 https://www.zhihu.com/question/353691411/answer/899997687

从论文题目，概要，引言，结论和讨论入手。

首先谈题目

每年的CS论文都很多很多，但是我们没有精力一一阅览，所以通过题目可以筛选掉很多自己不care的方向。可以减小自己寻找idea的精力成本。

其次，从概要入手，看论文主要针对什么问题，大概方法是什么，最后结论是什么。牢牢把握住这三点。

最后看讨论和结论部分，这里往往是寻找idea的重点所在。看讨论部分，有哪些问题说的不清楚，或者作者写的不够完善，一些现象的原因探究不够彻底等等这些方面都可以尝试着去挖掘。至于结论部分，也是如此，看作者运用了什么方法，什么评价指标，得出了什么结论，可以思考方法是否最优，评价指标是否最好，如果更换以后，结论是否一致，如果一致的话，那么可以验证本文，如果不一致，那么原因在哪里，我们在进行这类研究时，需要考虑哪些因素的影响。

另外，对论文的整理归类也十分重要，看得有一定数量以后，就会明白，针对某一个问题，主要研究方法有哪些，做的程度如何，理解需要改进，深入，补足，问题迁移到其他领域甚至是提出创新性方法的地方，这都是平时的点滴积累。

作者：LeapMay https://www.zhihu.com/question/353691411/answer/910600098

第一，先把别人论文里的代码复现一下，搞懂methdology，搞懂code，把别人的论文吃透。

第二，仔细琢磨论文里conclusion里的结语和下一步工作方向。

第三，寻找论文方法里的欠缺，模型是否可以优化，思路是否可以精简，结合自己的储备，初步判断自己可以开辟的点，然后尽量和周围大牛进行讨论交流。

第四，根据自己可以立足的点，着手理论推导和工程实现，进一步提炼idea。

计算机视觉领域如何从别人的论文里获取自己的idea？

计算机视觉领域如何从别人的论文里获取自己的idea？

VirMach 便宜 VPS

QNews

计算机视觉领域如何从别人的论文里获取自己的idea？

计算机视觉领域如何从别人的论文里获取自己的idea？

分享此文：

Related Posts

JAVA实现BP神经网络算法

从Linux源码看Socket(TCP)的listen及连接队列

3*3卷积+1*3卷积+3*1卷积=白给的精度提升

Node.js在携程的落地和最佳实践

VirMach 便宜 VPS

QNews

熱門文章

熱門搜尋

33卷积+13卷积+3*1卷积=白给的精度提升