试着搞一份科研日志
返工第一天有点假期综合症,之前看到友邻用豆瓣日记写科研日志,试试自己能不能搞一份。
先来讲讲现在的项目。
按照工作网站上的分类它应该属于LOFAR组的star formation galaxies working group。在邻近星系的恒星形成通常需要一个trigger才能发生,比如超新星爆发和它的遗迹——随着超新星爆发高速物质被抛到分子云中,密度过高的地方就会形成引力塌缩进入active star formation。在这个过程里同样会产生许多高速电子,它们加速运动形成的同步辐射让我们可以在star forming galaxies中探测到射电信号(比如VLA的1.4GHz波段和LOFAR的150MHz波段)。这些电子最终会被外部的尘埃云吸收,经过高速电子加热后的尘埃会发出远红外辐射,所以通过Spitzer之类的红外望远镜观测远红外波段的尘埃云也可以间接探测到star formation activity。
如果我们假设这些电子最后全都被吸收掉的话——当然是一个比较强的假设——那么就可以得出star forming galaxies中的射电辐射和远红外辐射是一个完全正相关的关系,也就是far-infrared radio correlation(FIRC)。事实上这个correlation即使在整个天文学里也是最工整的一个correlation,几乎适用于所有种类的星系和光度范围。当然它们本质上还是来自不同的物理起源,所以想要完全抛弃环境的影响几乎是不可能的:比如如果calorimetric assumption不成立,也就是电子没有全部被吸收的情况下,FIRC就不再是完美线性的;如果我们引入不同的辐射机制,比如一些电子没有通过同步辐射转化为射电信号而是以宇宙线的形式逃逸,FIRC也会有不同程度的改变。这些变化可能和redshift,stellar mass,luminosity等等参数有关,这样的话,以FIRC为代表的恒星形成过程就会在宇宙的不同阶段有不同的表现。
使用LOFAR深场巡天测量FIRC的好处是它的灵敏度比VLA更高,可以更精确地测量FIRC随不同参数的变化。同时和普通射电波段相比,低频射电波段没有电子free-free emission带来的干扰,是一个更好的star formation indicator。当然射电巡天本身会受到很多其他的干扰,比如活动星系核(AGN)本身也会包含大量的射电辐射,如何把AGN带来的影响剥离开是一个很大的挑战。比如这个项目设定的红移可信区间是z<3,因为测光红移的计算值会受到AGN的干扰,目前实际可信区间可能只能到z=2。如果等到LOFAR配套的光谱巡天WEAVE-LOFAR上线的话情况会好很多。当然AGN的干扰对校准FIRC本身影响也很大,毕竟它不对AGN-dominated galaxies成立。
总结一下之前的工作。
目前的做法是对LOFAR matched catalog里那些有测光数据的源做SED fitting来拟合出AGN fraction、stellar mass、star-formation rate等参数,基本就是根据测光波段数据反过来猜出光谱形状。这里面star-formation rate基本就是根据红外波段拟合了;至于AGN fraction就比较复杂,因为各种code擅长的星系种类不一样。抱了组长大腿之后(求求您phd录我吧!!)拿到一份呕心沥血的分类目录,里面用了五种不同的SED fitting code先把AGN挑出来然后分别进行拟合,这个复杂程度是我不敢想象的。
这个项目的关键是如何get rid of selection effect,基本就是玩弄各种统计建模工具。直接用LOFAR巡天数据的话显然会漏掉一些射电波段不够亮的源,而且离我们越远被漏掉的可能性越大。这样不光会得到一个不完整的correlation,还可能引入一些虚假的特征,毕竟我们要研究它随红移的演化。之前的工作都是先用测光巡天数据然后到LOFAR catalog里比对选源,和我们的数据相比体量小了不少,而且涉及的selection effect也不一样,当然测光巡天信息量比较大所以分析起来也更加容易。
我们的做法是采用forward modeling,也就是先根据目前样本的特征和想要拟合的FIRC模拟生成一份完整的catalog,手动筛掉射电波段过暗的样本,然后把筛掉之后的样本与实测样本比对,相似度越高代表我们生成时采用的FIRC参数越接近真实值。
目前的问题:
生成样本时根据的是radio-selected sample的参数分布,它本身受到selection effect的影响有多大? //这个看起来无解。。
找一个合适的度量二维分布相似度的函数 //找到了,需要测试
现在free parameters是不是多了? //如果算上redshift和stellar mass要4-5个
写MCMC sampling code来拟合参数 //本研用过emcee pack但原始的code不是自己写的,而且看起来这个要复杂一点,继续找一个站在巨人肩膀上的机会(不是
目前的进展:
1/5 今天睡过了大组会,不过本来也没什么好讲的😅幸好小组会下周才开始。arXiv上没有什么感兴趣的文章。研读了一下emcee的文档,算likelihood function貌似要占用很多计算时间,每一步都要先生成样本->筛选->算相似度,不过之前测试过应该还好,码写起来麻烦一点。读了一下之前项目的代码找感觉,明天应该可以开始。找导师要了类似项目的代码,不过下周才能拿到。相比之下更焦虑的应该是刚刚发现十天之后还有一场考试……
1/6 几篇arXiv文章:Observing high-redshift quasar hosts with JWST,一个比较细的JWST mock observation,用MCMC modeling把host galaxy成分从observed PSF里提取出来,有空研究一下里面用到的mock observation代码;Dating individual quasars with HeII proximity effect,测量早期类星体解离HeII region的大小判断活动时间上限,(如果我还做quasar的话……;SF to AGN transition at z~4,打算在oxford申的导师的文章,额其实就是point source和extended source的区别,直接用morphology测的AGN fraction,带一个简单校准,真的靠谱吗;Likelihood inference under photo-z error,用和spectroscopic样本的cross-correlation做测光红移,感觉适用于大样本量能看到clustering的那种,先马。今天先把likelihood function写了吧,明天一定开始写码(
1/7 这周都没组会了,看了一天广相网课,脑壳疼。赶紧毕业吧真的
1/14 不知不觉变成周更了……2D distribution上的likelihood function算起来慢得一笔,主要应该是生成样本太慢,算一遍半分钟,跑一个small scale test都要一个小时,full scale应该要一天吧,脑壳疼++,不如早日屈服改成binned 1D distribution,但乐观估计应该也只能时间减半。加了个简单prior把截距固定在平均值附近。
1/16 跑了整整一天终于把full scale跑完了……结果跟导师meet的时候她说之前自己的MCMC code跑一周是很正常的orz。听了一天mcbp的风扇声时刻怀疑自己电脑要爆炸,虽然买的时候是当工作站买的,还是早点研究一下怎么挪到系里远程服务器上跑吧。我也到了偷偷调prior操控结果的阶段了哎
1/17 A Luminous Quasar at Redshift 7.642 本科导师组又发了一篇雄文,包括在Leiden疑似把我拒了的教授,祝福他们:(申不上就和AGN正式拜拜了👋
1/18 跑了两遍full scale, so far so good,唯一不足的是overall pdf peak位置和单个parameter位置不重合,如果采用单个parameter的pdf可以recover input parameter,开心。接下来研究一下如何画corner plot这周就可以交差了。
1/26 来update一下,cut prior之后看起来都挺好了,目前还有两个问题:用的star- forming galaxy real sample 在upper bound还有一个radio cutoff,需要找组长问一下具体的criteria;fitted sample形状上看起来已经很像了,只是整体上有一个诡异的tilt导致斜率偏小截距偏大,不知道能不能correct掉,就怕是likelihood function的问题哎。还是没画corner plot,这些搞定之后大概已经完成70%了。
西八断更了,三个月之后我终于解决了上面的问题……
快一年过去了我还在写paper draft,fxxk 2021