独立研究时需要的工具(初步稿)
我所说的独立研究并非获得博士学位后有助理教授职位的那种牛逼研究,而是脱离团队、导师的苦逼的自发行为。既然这是个苦逼的过程,那么一定要避免傻逼地走弯路,所以我把阳志平和其他很多人的经验综合起来,形成一个类似工作流的研究环境。这个工作流是以信息为基础的,分为收集、分析、管理、协作分享以及输出这5个部分。
想独立开展一个领域的研究是困难的,没有基础,没有协作,没有实验条件也没有妹子。。。。所以使用的工具尽量是开源免费的、有论坛和众多资源可以讨论的。
(1)信息的收集
信息包括文献、代码、博客甚至微博等各种相关资源。
(a)文献:除了学校的数据库或者文献代理,我自己认为google是最好的选择。微软学术搜索虽然界面酷炫,但返回的结果却特么不知道是用什么狗屁算法实现的都是些不需要的东西。。。百度这个神奇的搜索引擎是不能用来搜索学术信息的,联想功能实在是太牛逼了。。。平淡无奇的检索词也能返回毁三观的内容。应该说Google Scholar能检索到研究所需要的绝大部分文献,因为所有的出版商数据库SpringerLink, Elsiever, Wiley, Oxford等等都可以被检索到,中国的CNKI、万方、维普也都可以。从文摘角度来说独立研究和团队学术研究没有区别,区别在于全文。小木虫、丁香园这类可以文献互助的地方解决了以上的问题。Google的另一个好处是一篇论文往往有n多个版本,很多作者有个人博客会贴全文,Arvix等也会有物理、数学、计算机的预印本论文。还可以问作者要全文。那么全文就不是问题了。。。。。。
(b)代码:一般我就Google然后搜索语言+实现功能,这类信息一般搜索都没问题。例如支持向量机:SVM 支持向量机 Java
(c)博客、微博:现实中很多牛人都有博客和微波。。仔细找找, 科学网、微波、Research Gate都可以。。
最后想说数据其实也是一种信息,这方面数据堂起了好头。
从收集来说,一方面是主动搜索即你找信息,另一方面就是订阅也就是信息找你。Google Alert和Google Reader是我采用的。经常看的那几本杂志、博客都用RSS订阅到Google Reader,我和一个朋友解释为啥要用Google Reader而不是直接在杂志页面翻:因为可以在一个浏览器看到所有杂志,而且永远有记录读过什么?什么重要?哪些没读?这样整个信息收集就规范化了。。Google Alert可以通过订阅关键词发送邮件,新的相关论文不用自己找。。加上各个国外出版商数据库都有的citation alert email服务。你可以了解你关心的领域的最新进展。会议是非正式的信息收集渠道,这个渠道对没有研究经费的人来说可能不能参与得太多,这时微薄和博客起到了求 ppt的作用了。不过即使不参加会议,光那些论文也不一定能看得完。。。。。。
(2)信息分析
这里所说的信息分析主要还是文献,通过分析来判断研究方向哪些比较重要,那些人,论文,机构比较牛论文应该学习。文献有结构化的摘要,引用信息,分析较为容易。而其他信息源基本都是文本,也就是非结构化的,应用现有工具分析起来很困难。。。
工作的地方一些SB对Google Scholar报以嗤之以鼻的态度时经常说:Google的引用数据不准确,不权威,很多错。。错你妹,错你大爷。。。。他们认为被教授引用的论文就是牛逼的,而被一般人引用的论文就SB, 难道世界不是平等的吗?即使只是一篇手稿也是有价值的。。
引用是现有的可以用来分析论文流行度的比较靠谱的办法之一。。。好的论文不一定刚发表就被大量引用,大量引用的论文也不一定是对的。。。请注意,是判别流行度,而不是质量。。所以提供了引用次数的好处来了。。。次数多的读一下没坏处,次数少的忙了就不读。。另一个途径是杂志好坏。。。一般某个学科总有那么一个学会,这也总有那么几本牛逼杂志。。。物理的prl,临床医学的jama,lancet,nejm。这也是勉强判断论文重要性的一个办法。。
再次就要靠同行评议了,这方面也有一些网站粗现:f1000,sciencewatch,SCImago journal&country rank还有中科院的科学观察也不错,有一些利用分析工具分析SCI或者Scopus这类收费数据的报告。也许这些可以帮助我们把握一些研究趋势,弥补没有团队、没有实验室、没有Partner交流少的缺憾。当然像plos等一些OA(open access)期刊都推出了Altermetrics的服务,即让你看到用户的行为记录:比如转发到博客、微博、下载记录、收藏到文献管理软件和网站的记录等等。行为记录是第一手反映文章情况的资料,行为记录的反映速度比引用快,所以当一篇论文刚出来不久还没被引用时这是个很好的替代办法。
前面已经提到了文献管理软件,Mendeley,CiteUlike这类具有社会性的文献管理软件也可以观察到研究的趋势,一个办法是找到收藏你感兴趣内容比较多的人,有时这些人就是这些论文的作者,他们会比你更有热情地关注研究趋势。
(3)信息管理
分析完重要文献就是管理了,但这一步其实在收集信息时有很多已经做掉了,因为很多好论文Google reader读到就顺手收藏了。这里要说的是文献管理软件,这是一个很庞大的市场,有个那么几十种。。我推荐3种:mendeley, zetero和CiteUlike。Mendeley是我比较喜欢的软件,一大特点就是同步,手机平板(Andriod,ios)、电脑(mac,windows,linux)还有在线网络版。另外就是可以自动识别PDF题录,虽然这个功能还不很完善,但至少方便了很多,很多下载的PDF都是一串数字,时间一长就忘了哪个是哪个了。。。最后也是我最喜欢的就是自带PDF浏览器,不用再开另外的pdf,这样读、写、标注、笔记和管理都在一个工具里进行了。社会性是Mendeley和Citeulike的共同特性,这方便了通过找到人就找到了相关论文,省了很多找论文的时间。。。另一种办法前面忘了说了,就是通过引用关系找论文,这种办法可以有个时间脉络,什么事研究的基础,什么是研究的前沿。两种办法我都喜欢。。。。管理了文献主要就是在写作时方便插入引文,这是软件的初衷,但发展到现在已经不是我最看中的功能了。。。Google reader可以很方便地导入到mendely网上有教程。。。Google Scholar也是可以通过在浏览器安装两个插件导入到Citeulike和Mendely。。这基本也保证了学术写作的论文题录收集。。
Evernote也和mendeley一样同步控必用。。。这个网摘工具现在越来越觉得超方便,还可以存储照片。。所有的网络信息都可以保存到这里,我有个同学经常将代码示例保存到Evernote,所以不会像传说中一个移动硬盘带着身家性命代码的人一样。。。。
(4)信息分享
Mendeley等文献管理软件都有群组功能,这方便了你找到智趣相投的人邀请他(当然也有她)加入以某个研究专题文献为目的小组,分享所获得的文献。Evernote也有这个功能。另外我想说博客、wiki这些都是分享,很多东西可能不能形成一个论文,因为没有创新,但作为一种知识保存、分享是十分有益的。。
代码是最好的名片,目前有很多学科或多或少涉及到统计、数据挖掘、模拟的数据处理,不可避免的会有代码。。。更不用说CS这类专业了。大学时老师说起面试,很霸气的说,你到公司拿出你做的东西,然后就可以谈价钱了,爱要不要。。。。。Github地址也许再过几年真的可以代替简历了,刘未鹏的这篇博客真的很有道理。通过豆瓣也让我找到了一个学习的榜样,这和社会性是分不开的,物以类聚人以群分还是有道有理有根据的 。。。问答网站也是分享的好地方,知乎、果壳、quora还有stackoverflow都既可以锻炼概括能力又可以搜索感兴趣的问题答案。
(5)信息协作
Google doc和Zoho百会是在线编辑的好工具,zetero也支持在线文献插入。之前那种genewiki发Nature的情形让我羡慕了好久。。。很多很多类似的office功能目前都支持在线协作。。。协作后的输出最好是可重复的研究,这时候R语言的knitr包有了用武之地,这个包也支持Tex 。。。希望以后还有phthon的,perl的,matlab的还有java的,凡是有代码,有运算,有可视化的都可以重复就完美了。。。
这样从信息输入到信息输出就是整个流程,另外没钱买试剂,买材料,买加工设备不在本文讨论之列,总有解决的办法的,只要你想独立研究。。。。
想独立开展一个领域的研究是困难的,没有基础,没有协作,没有实验条件也没有妹子。。。。所以使用的工具尽量是开源免费的、有论坛和众多资源可以讨论的。
![]() |
基于信息的研究工作流 |
(1)信息的收集
信息包括文献、代码、博客甚至微博等各种相关资源。
(a)文献:除了学校的数据库或者文献代理,我自己认为google是最好的选择。微软学术搜索虽然界面酷炫,但返回的结果却特么不知道是用什么狗屁算法实现的都是些不需要的东西。。。百度这个神奇的搜索引擎是不能用来搜索学术信息的,联想功能实在是太牛逼了。。。平淡无奇的检索词也能返回毁三观的内容。应该说Google Scholar能检索到研究所需要的绝大部分文献,因为所有的出版商数据库SpringerLink, Elsiever, Wiley, Oxford等等都可以被检索到,中国的CNKI、万方、维普也都可以。从文摘角度来说独立研究和团队学术研究没有区别,区别在于全文。小木虫、丁香园这类可以文献互助的地方解决了以上的问题。Google的另一个好处是一篇论文往往有n多个版本,很多作者有个人博客会贴全文,Arvix等也会有物理、数学、计算机的预印本论文。还可以问作者要全文。那么全文就不是问题了。。。。。。
(b)代码:一般我就Google然后搜索语言+实现功能,这类信息一般搜索都没问题。例如支持向量机:SVM 支持向量机 Java
(c)博客、微博:现实中很多牛人都有博客和微波。。仔细找找, 科学网、微波、Research Gate都可以。。
最后想说数据其实也是一种信息,这方面数据堂起了好头。
从收集来说,一方面是主动搜索即你找信息,另一方面就是订阅也就是信息找你。Google Alert和Google Reader是我采用的。经常看的那几本杂志、博客都用RSS订阅到Google Reader,我和一个朋友解释为啥要用Google Reader而不是直接在杂志页面翻:因为可以在一个浏览器看到所有杂志,而且永远有记录读过什么?什么重要?哪些没读?这样整个信息收集就规范化了。。Google Alert可以通过订阅关键词发送邮件,新的相关论文不用自己找。。加上各个国外出版商数据库都有的citation alert email服务。你可以了解你关心的领域的最新进展。会议是非正式的信息收集渠道,这个渠道对没有研究经费的人来说可能不能参与得太多,这时微薄和博客起到了求 ppt的作用了。不过即使不参加会议,光那些论文也不一定能看得完。。。。。。
(2)信息分析
这里所说的信息分析主要还是文献,通过分析来判断研究方向哪些比较重要,那些人,论文,机构比较牛论文应该学习。文献有结构化的摘要,引用信息,分析较为容易。而其他信息源基本都是文本,也就是非结构化的,应用现有工具分析起来很困难。。。
工作的地方一些SB对Google Scholar报以嗤之以鼻的态度时经常说:Google的引用数据不准确,不权威,很多错。。错你妹,错你大爷。。。。他们认为被教授引用的论文就是牛逼的,而被一般人引用的论文就SB, 难道世界不是平等的吗?即使只是一篇手稿也是有价值的。。
引用是现有的可以用来分析论文流行度的比较靠谱的办法之一。。。好的论文不一定刚发表就被大量引用,大量引用的论文也不一定是对的。。。请注意,是判别流行度,而不是质量。。所以提供了引用次数的好处来了。。。次数多的读一下没坏处,次数少的忙了就不读。。另一个途径是杂志好坏。。。一般某个学科总有那么一个学会,这也总有那么几本牛逼杂志。。。物理的prl,临床医学的jama,lancet,nejm。这也是勉强判断论文重要性的一个办法。。
再次就要靠同行评议了,这方面也有一些网站粗现:f1000,sciencewatch,SCImago journal&country rank还有中科院的科学观察也不错,有一些利用分析工具分析SCI或者Scopus这类收费数据的报告。也许这些可以帮助我们把握一些研究趋势,弥补没有团队、没有实验室、没有Partner交流少的缺憾。当然像plos等一些OA(open access)期刊都推出了Altermetrics的服务,即让你看到用户的行为记录:比如转发到博客、微博、下载记录、收藏到文献管理软件和网站的记录等等。行为记录是第一手反映文章情况的资料,行为记录的反映速度比引用快,所以当一篇论文刚出来不久还没被引用时这是个很好的替代办法。
前面已经提到了文献管理软件,Mendeley,CiteUlike这类具有社会性的文献管理软件也可以观察到研究的趋势,一个办法是找到收藏你感兴趣内容比较多的人,有时这些人就是这些论文的作者,他们会比你更有热情地关注研究趋势。
(3)信息管理
分析完重要文献就是管理了,但这一步其实在收集信息时有很多已经做掉了,因为很多好论文Google reader读到就顺手收藏了。这里要说的是文献管理软件,这是一个很庞大的市场,有个那么几十种。。我推荐3种:mendeley, zetero和CiteUlike。Mendeley是我比较喜欢的软件,一大特点就是同步,手机平板(Andriod,ios)、电脑(mac,windows,linux)还有在线网络版。另外就是可以自动识别PDF题录,虽然这个功能还不很完善,但至少方便了很多,很多下载的PDF都是一串数字,时间一长就忘了哪个是哪个了。。。最后也是我最喜欢的就是自带PDF浏览器,不用再开另外的pdf,这样读、写、标注、笔记和管理都在一个工具里进行了。社会性是Mendeley和Citeulike的共同特性,这方便了通过找到人就找到了相关论文,省了很多找论文的时间。。。另一种办法前面忘了说了,就是通过引用关系找论文,这种办法可以有个时间脉络,什么事研究的基础,什么是研究的前沿。两种办法我都喜欢。。。。管理了文献主要就是在写作时方便插入引文,这是软件的初衷,但发展到现在已经不是我最看中的功能了。。。Google reader可以很方便地导入到mendely网上有教程。。。Google Scholar也是可以通过在浏览器安装两个插件导入到Citeulike和Mendely。。这基本也保证了学术写作的论文题录收集。。
Evernote也和mendeley一样同步控必用。。。这个网摘工具现在越来越觉得超方便,还可以存储照片。。所有的网络信息都可以保存到这里,我有个同学经常将代码示例保存到Evernote,所以不会像传说中一个移动硬盘带着身家性命代码的人一样。。。。
(4)信息分享
Mendeley等文献管理软件都有群组功能,这方便了你找到智趣相投的人邀请他(当然也有她)加入以某个研究专题文献为目的小组,分享所获得的文献。Evernote也有这个功能。另外我想说博客、wiki这些都是分享,很多东西可能不能形成一个论文,因为没有创新,但作为一种知识保存、分享是十分有益的。。
代码是最好的名片,目前有很多学科或多或少涉及到统计、数据挖掘、模拟的数据处理,不可避免的会有代码。。。更不用说CS这类专业了。大学时老师说起面试,很霸气的说,你到公司拿出你做的东西,然后就可以谈价钱了,爱要不要。。。。。Github地址也许再过几年真的可以代替简历了,刘未鹏的这篇博客真的很有道理。通过豆瓣也让我找到了一个学习的榜样,这和社会性是分不开的,物以类聚人以群分还是有道有理有根据的 。。。问答网站也是分享的好地方,知乎、果壳、quora还有stackoverflow都既可以锻炼概括能力又可以搜索感兴趣的问题答案。
(5)信息协作
Google doc和Zoho百会是在线编辑的好工具,zetero也支持在线文献插入。之前那种genewiki发Nature的情形让我羡慕了好久。。。很多很多类似的office功能目前都支持在线协作。。。协作后的输出最好是可重复的研究,这时候R语言的knitr包有了用武之地,这个包也支持Tex 。。。希望以后还有phthon的,perl的,matlab的还有java的,凡是有代码,有运算,有可视化的都可以重复就完美了。。。
这样从信息输入到信息输出就是整个流程,另外没钱买试剂,买材料,买加工设备不在本文讨论之列,总有解决的办法的,只要你想独立研究。。。。
-
滴答滴 赞了这篇日记 2017-12-13 12:49:37
-
藻盐草 赞了这篇日记 2017-08-27 22:55:22
-
pingeekk 赞了这篇日记 2017-06-01 08:14:33
-
plusthinky 赞了这篇日记 2016-08-14 21:44:18
-
tianqi 赞了这篇日记 2016-04-22 14:39:37
-
168 Hours 赞了这篇日记 2016-04-22 09:21:34
-
Anastasia蜗牛 赞了这篇日记 2016-04-04 23:42:53
-
空羽 赞了这篇日记 2016-03-24 08:57:48
-
[已注销] 赞了这篇日记 2016-03-24 03:58:31
-
mulder 赞了这篇日记 2016-03-24 03:45:03
-
calvino 赞了这篇日记 2016-03-22 14:25:13
-
沈潜 赞了这篇日记 2016-03-21 01:58:32
-
Marlais 赞了这篇日记 2016-03-21 01:33:10
-
Yagami🌈 赞了这篇日记 2015-12-01 22:02:41
-
冰是睡着的水滴 赞了这篇日记 2015-09-30 23:20:37
-
[已注销] 赞了这篇日记 2015-03-19 23:53:44
-
熊猫打坐 赞了这篇日记 2015-01-31 06:39:19
-
rambling 赞了这篇日记 2015-01-14 03:47:34
-
🍉 赞了这篇日记 2014-12-31 20:49:34
-
鹪鹩 赞了这篇日记 2014-10-12 08:35:45
-
笨鸟起飞 赞了这篇日记 2014-08-02 12:10:23
-
吉瑟斯の小宇宙 赞了这篇日记 2014-07-29 19:22:20
-
ericwxia 赞了这篇日记 2014-06-21 04:08:41
-
whalemimi 赞了这篇日记 2014-06-04 10:55:40
-
半夏 赞了这篇日记 2014-04-26 19:33:40
-
春卷果子 赞了这篇日记 2014-02-11 12:02:20
-
坚强的小孩 赞了这篇日记 2014-01-24 07:22:07
-
盒子 赞了这篇日记 2014-01-24 06:09:12
-
小嗨 赞了这篇日记 2014-01-22 16:38:55
-
Amphetamine 赞了这篇日记 2014-01-04 20:48:20
-
环形废墟 赞了这篇日记 2014-01-01 12:30:53
-
Azure 赞了这篇日记 2013-12-19 19:29:27
-
大橙子2046 赞了这篇日记 2013-12-10 09:15:03
-
Daisy喜欢唱歌 赞了这篇日记 2013-12-06 09:52:33
-
河布 赞了这篇日记 2013-12-05 14:14:54
-
浊克斯 赞了这篇日记 2013-12-05 10:57:40
-
安德烈大叔 赞了这篇日记 2013-12-05 09:35:09
-
Ashly 赞了这篇日记 2013-12-05 09:00:47
-
タナトス 赞了这篇日记 2013-12-05 08:41:02
-
米花糖 赞了这篇日记 2013-12-05 06:51:04
-
[已注销] 赞了这篇日记 2013-12-04 23:48:20
-
弗吉尼亚马尔福 赞了这篇日记 2013-12-04 23:46:03
-
梓宸 赞了这篇日记 2013-12-04 23:44:49
-
海风 赞了这篇日记 2013-12-01 12:48:55
-
Max 赞了这篇日记 2013-11-24 16:57:03
-
Anakin 赞了这篇日记 2013-11-22 23:27:12
-
蓝天777麦子 赞了这篇日记 2013-11-21 00:06:52
-
茄子驴 赞了这篇日记 2013-11-14 17:08:34
-
sxc 赞了这篇日记 2013-11-14 01:34:05
-
Lenore-Ciel 赞了这篇日记 2013-11-12 07:34:25
-
S.Queenie 赞了这篇日记 2013-11-11 20:53:20
-
折腾吧,小艾 赞了这篇日记 2013-11-11 20:26:17
-
外焦总欺负里嫩 赞了这篇日记 2013-11-02 23:28:25
-
快乐永动机 赞了这篇日记 2013-11-02 20:19:22
-
泰宝 赞了这篇日记 2013-10-28 16:03:51
-
山鸟瓜子 赞了这篇日记 2013-10-28 15:11:52
-
玻璃熊 赞了这篇日记 2013-08-23 22:02:03
-
biglulufish 赞了这篇日记 2013-07-17 13:42:52
-
szj 赞了这篇日记 2013-07-15 23:34:05
-
一顆青花椒 赞了这篇日记 2013-07-15 18:23:17
-
Lo 赞了这篇日记 2013-07-15 10:18:58
-
[已注销] 赞了这篇日记 2013-07-13 22:58:16
-
城市生活发现 赞了这篇日记 2013-07-13 13:37:41
-
un 赞了这篇日记 2013-07-12 22:35:38
-
思禽 赞了这篇日记 2013-07-12 18:49:43
-
镜知者 赞了这篇日记 2013-07-12 15:18:51
-
willstyle 赞了这篇日记 2013-06-18 08:51:07
-
懒懒的蜗牛 赞了这篇日记 2013-04-13 17:17:13
-
Terry Chen 赞了这篇日记 2013-01-31 17:55:48
-
欧阳 赞了这篇日记 2013-01-28 21:45:54