博士项目申请小结
好累,两个比较重要的申请材料前后大改小改有十几遍。
明天申请ddl,今天把最终版的 research proposal 发给了英国学校做最后的 academic writing 校对,是英国学校提供的一项免费服务。这次申请比两年前申请硕士项目有经验多了,也知道应该怎样突出自己的长处和避免短处,用前同事的话来说就是让自己的申请材料“显眼儿”起来。
这个博士奖学金项目一共有 47 个不同的项目,我申请的项目是通过遥感数据和算法来预估环境污染信息的。 翻译一下,一些环境数据可以通过地面的监测获得,例如空气监测站,但是这些环境监测站并不能覆盖全区域、全人口。一些有预算的大城市可能能布置比较多的监测点,但是比较穷的地方没有可能有这样的监测点。这些比较穷的地方反倒因为修建化工产业园区会面临更严重和更广的环境污染暴露。所以有一种方法就是通过遥感数据和 machine learning、spatiotemporal analysis来让一个模型通过对已有的地面数据来推算没有监测点覆盖的地方的环境污染水平。简单来说就是通过比较复杂的一套算法和遥感信息来预估一个可能没有环境数据监测的地方过去十年二十年的环境污染数据。这样的算法是早 20 年逐渐发展起来的,最近十年发展得比较好,国内做了很多分析 pm2.5 在不同地理范围的研究。例如通过类似的算法评估 pm2.5 在 2010 年到 2016 年长江三角洲流域的时空分布(城市和农村地区)对肺癌病死率的贡献。算法做得好的话,准确率可以达到 70% 左右,这种模型可以作为 evidence-based 的政策制定依据,如果 policy maker 在意的话。
模型的精度一般在1km,但也存在一些问题。例如对与交通有关的污染水平预测准确率会低一些,像氮氧化物主要是交通产生,它的预估水平就低。即便同样是对 pm2.5 的预估,对高速公路附近的 pm2.5 预估准确率低于对城市热点地区的 pm2.5 预估准确率。这是因为 machine learning 不能很好地解决 spatial correlation 的问题,所以现在看到用machine learning 评估pm2.5的研究很多,但是氮氧化物的比较少。我要申请的博士项目就是要解决 machine learning 在 spatial correlation 上的不足,同时把精度从 1km 提高到局部地区(学校医院这些)的预测精度达到 100m 。项目难度很高,挑战很大。
项目申请很激烈,虽然学校设置了 47 个项目来申请,但最终入选的只有8、9个项目,这里面每个项目都很好,但如果没有合适的申请人,项目也不会继续做。评审委员会很严格。假设每个项目至少有两个人申请,最终入选的只有八九个,比率大概在十分之一。在和导师zoom的时候他说过去几年都没有人申请成功。所以如果没有申请成功就当热身好了。
也不是很清楚要不要继续申请别的博士项目,很少能遇到这样的项目,几乎集成了所有我感兴趣的研究方向:machine leaning、environmental epi、air pollution、and modelling。博士群体好像抑郁症情况比较突出,兴趣是第一考虑因素。如果遇到类似项目的话,可能还会考虑申请。