一个Ph.D的转行经验

1. 前言

拿到了人生中第一份工作offer!从无到有,从编程小白到数据科学。希望自己的经历能够给其他正在探索职业发展的同学们一点点启发。

2. 探索

哥大的生物科学博士项目是一个综合的科研项目,项目内各个实验室的方向相差甚远,有做传统分子生物学,细胞生物学的,也有做计算生物,神经科学,和生物物理的。我所在的实验室是一个神经科学和物理的交叉领域,既有前沿神经生物的实验训练,也有少量的物理建模和计算。虽然我一直对神经科学的科研非常感兴趣,也很想继续在科学前沿进行探索,但是神经科学这个领域的竞争空前惨烈,大牛众多,跟很多博士后聊了之后,发现自己并不适合目前这样的科研环境,对一年到头写科研经费和管理学生也没有太多兴趣。作为一个自然科学的博士生,面对学术界越来越激烈的竞争环境,越来越意识到自己一来科研能力并不出众,二来这些年的科研进展也不算顺利,三来也是读书二十多年读得太腻,于是毅然决然地决定毕业之后不继续在学术界做科研了。

身边大多数博士转行无非是这几条路。1)药厂,2)教书,3)金融,4)编程,5)科学交流,6)咨询,7) 其他

2.1 药厂

大多数生物专业的学生去了药厂,前几年还是要做实验的,虽然可能工作时间和收入比做博士后好一些,但是我是不想再做周期很长的实验了。而更多的药厂职位,倾向于经验丰富的博士后,而非刚毕业的博士,这就意味着想要进药厂工作,还是绕不过博士后的几年。了解了就业行情之后,就放弃了药厂这条路。

2.2 教书

身边确实是有博士毕业之后去高中或者大学做讲师的,不过一方面我个人并不是特别喜欢教书育人,另一方面要想成为老师,也要做很多准备,比如积累教书经验,这对于在实验室长时间工作的博士生可能并没有那么容易。我曾经在博士二年级的时候去做了一个学期纽约公立小学的志愿讲师,虽然小朋友们都很可爱,但是我觉得还是更喜欢一些更前沿更具有探索性质的工作。于是也就放弃了教书这条路。

2.3 金融

略微了解之后发现并没有直觉上的好感,那些金融词汇听上去就像是另一种语言。试着看了看CFA(特许金融分析师)的书,也并没有觉得特别喜欢,大概是因为从小就没有被培养出财务管理的技能。

其他与金融投资相关的行业,比如行业研究员(equity research),可以用上一些自己的专业知识进行股票分析,但是听说工作时间特别长,而且压力也不小。更重要的是,这些行业分析和投资理财顾问更倾向于经验丰富的人,比如已经干了几年的管理咨询。毫无经验的菜鸟一开始就做这个,机会也不是很多。

所以很快就放弃了金融这条路。

2.4 编程

我第一次接触编程是本科时期的C语言,当时觉得简直就是在听天书,什么二进制、指针、二叉树,完全不理解它们存在的意义,于是觉得自己大概并没有跟计算机打交道的天分。这令人不开心的第一次接触,让我一直觉得编程语言都非常难学,并且很难用得上。在PhD阶段也几度打起精神学习编程,但是都很不幸地半途而废。先是学完了一遍Google的Python教程(https://developers.google.com/edu/python/),感觉很容易上手,却还是觉得什么都不会,不觉得这些基础的内容在自己的工作中会有什么用处,也不知道学会这个能干什么。自己科研中最多也就是用MATLAB处理一些图像,并没有专业系统的编程训练。编程什么的就这么搁置了下来。几年前隔壁化学实验室一个博士师兄自学编程,然后去了华尔街做金融量化分析师(quant),他当时还鼓励我可以考虑一下做金融工程,说是只要会编程数学好,金融专业知识不懂也可以做。我看了一下他的C++教科书,真是一句话都看不懂,马上就放弃了。而传统意义上的编程工作,基本就是软件工程师了。身边有一些博士转软件工程师然后去了Google的例子,不过大多都是在博士毕业之后又读了一个计算机的硕士,或者博士没读完就中途转了计算机的硕士,总而言之,都是受过专业训练的。而完全靠自学转软件工程师的真的是少之又少。于是我还一度想着要不要申一下哥大的计算机硕士专业,但是看到高额的学费,想到还要再考一次入学考试GRE,就打了退堂鼓。

2.5 科学交流

如果对写作特别有兴趣,也可以考虑进行科学交流(scientific communication)。身边已经有不少PhD成功转行到科学交流行业,从事科学写作。他们的工作内容跟科研紧密联系,虽然不用自己做实验,但是还是需要经常阅读科学文献,然后写综述,做PPT。需要的不仅仅是写作能力和技巧,还有信息搜集和概括的能力,以及把复杂的科学概念说清楚的沟通能力。我对于写作本身虽然有很大的业余爱好,但是如果是当成工作,大概也谈不上喜欢。在跟已经转行科学交流的学长学姐交流之后,作罢。

2.6 咨询

从第一次听说咨询(大概是博士二年级),到在Coursera上学习经济学、战略分析,到选修哥大商学院的课,参加一些社交活动,到2016年加入哥大咨询俱乐部,开始申请咨询的工作。咨询是我前期投入非常大的方向。身边有很多中国同学都拿到了麦肯锡或者BCG在中国办公室的工作,而想要留在美国从事咨询工作却鲜有成功的案例。咨询业的职位需求本来就不多,在国内在美国的竞争都非常激烈,毕竟咨询已经成为很多博士转行的默认选项,特别是top N的那些学校,也就是咨询公司常说的target school。非target的学校申请难度要更大。美国公司能够提供工作签证的就更少,想要在美国工作不仅要英语特别好,主要看气质。而所谓的咨询气质是什么,准备过咨询的同学应该都能理解,无法言传。

我在面试的过程中,发现自己的性格跟咨询业的整体风格和工作模式并不是很合得来,特别是在穿正装分析商业案例的时候,心中总是有很强的表演错觉,感觉那个人并不是真正的我。至于咨询业强调的领导力和解决问题的能力,确实很难客观地去衡量,以至于被拒都不知道为何被拒。有些人觉得咨询不用怎么准备,target school的同学练两个月case就可以面试了。然而,借用我一个朋友的话,“咨询确实不怎么需要学习hard skill,但是要重新学习做人。”技术可以学习,但气质和性格却是经年累月的。所以,咨询公司在面试时,case做得及格之后,性格和眼缘非常重要。关于hard skill和soft skill,我后来才发现,不只是咨询,很多行业包括数据科学都是如此。hard skill决定入门资格,而soft skill决定入门之后能走多远。

在申请咨询的暑假项目失败之后,不甘心的我去哥大的职业教育中心CCE做了MBTI性格测试,当然我之前也在网上测过自己的性格,CCE测出来的结果跟我在网上测出来的一样,更适合从事运筹工程之类目的明确,行动清晰的工作,所以我大概并不适合做咨询吧。于是,由于种种原因,摩拳擦掌近两年的我,在经历了无数难以入睡的焦虑夜晚之后,在2016年6月即将申请的时候,放弃了咨询这条路。

而这个时候,已经博士5年级的我马上就要迎来博士的第6年了。我还是不知道自己想要做什么。

2.7 其他

之所以说是其他,因为PhD转行的方向非常多,身边也有成功的例子。有去读法学院JD的,有去做专利的,有去医学院读MD的,有去医学院读医师PA的,有去做学校行政工作的,当然还有创业的,等等。我或多或少都了解了一些可能的方向,也都或多或少地谈不上喜欢,也不觉得自己能坚持下来。比如法学院,一想到要考LSAT入学考试,要回到啃书的日子,就觉得压力太大。

3. 发现

本科同一个实验室的师姐,神经科学博士毕业之后去了Facebook做数据科学家,跟她聊了之后发现这个工作非常有趣,用到一些编程,也用到一些数据分析,还需要解决问题和思考。在跟其他师兄师姐的聊天中,我逐渐了解了数据科学(data science)这个行业,也逐渐发现自己似乎找到了自己喜欢的方向。在网上(知乎一亩三分地BBSQuora)读了很多介绍数据科学的文章和如何准备之后,我踏上了数据科学之路。

4. 准备

说干就干。2016年的6月底,我开始了转行之路。

我个人比较推荐通过系统的课程学习数据科学,而不是速成或者刷题,不是看几页别人总结的cheat sheet,也不是跟着大牛们做几个kaggle项目刷个名次。系统学习的时间虽然很长,也可能学着后面忘了前面,但从知识掌握的角度,自己一步一步慢慢学,一边学一边琢磨,然后自己融会贯通自己进行总结,掌握基本的理论和概念,知其然也知其所以然。这样之后再去刷题,参考别人的cheat sheet,看kaggle上别人的项目流程和思路,不仅事半功倍,也能够更好地理解数据分析。说到底,数据科学是门硬功夫,需要持续不断地学习新知识,反思旧概念。如果不能付出足够的时间和汗水,而只看到所谓数据科学的光鲜外表,可能很难转行成功吧。

因为需要投入很多 (平时晚上和周末基本都要学习),所以决定需谨慎。

4.1 编程

编程的乐趣在于搭建项目,这样一来有成就感,二来有可视化的结果。

4.1.1 Python入门(1-2月)

对于零基础或者有一些基础但没有系统训练的人来说,Udacity的Python课程非常有帮助。

  1. Intro to Computer Science
  2. Programming Foundations with Python

4.1.2 数据结构和算法(2-3月)

软件工程师的面试算法和数据结构考的比较多,而数据分析的职位大多数并不在意算法,但是有一些公司还是会问简单的算法,比如二叉树和搜索算法。

  1. Design of Computer Programs
  2. Essential Data Structures in C/C++
    • http://www.cs.columbia.edu/~jae/3136/
    • 这是哥大的一门课,老师Jae是个非常非常有趣的人。对于从来没有接触过C++也没有系统学过数据结构和算法的人非常有用。
  3. Introduction to Algorithms
  4. LeetCode

4.2 数据分析

在网上查了一圈之后,发现还是Udacity的课程比较全面,而且是项目导向,也就是说每上完一门课,就可以做一个项目。我最终选择的是Data Analyst Nanodegree (https://www.udacity.com/course/data-analyst-nanodegree–nd002)。

这个Nanodegree的课程包括以下几个领域。所有的课程都可以在Udacity上免费学习。而Nanodegree的好处是有人进行远程指导和项目反馈。

  • Statistics
  • Intro to Data Analysis
  • Data Wrangling with MongoDB
  • SQL For Data Analysis
  • Data Analysis with R
  • Intro to Machine Learning
  • Data Visualization and D3.js
  • A/B Testing

全部课程学习完成,并且把作业的大项目做完,基本要4-6个月。我个人非常推荐。

当然,nanodegree价格也不算便宜(跟学校的学分比起来也不算太贵)。是否值得投资,全看个人喜好。我跟Udacity也没有任何利益关系,只是分享下自己的学习经验。

4.2.1 概率和统计(~1月)

偏理论。Udacity的这几门课非常基础,适合入门。当然很多人本科已经修过概率和统计,所以看视频只是巩固一下知识,顺便了解一下一些专业的单词英文怎么说。

这些课可以应付大多数的面试,而少数公司比如Google(参看glassdoor和一亩三分地的面试经验),对统计知识的要求更为深入。

YouTube的这个英国助教的A full course in econometrics,一共有271个视频,我觉得讲得深入浅出,特别对于没有上过研究生统计课的人,帮助非常大。里面涉及regression assumption和time series的部分,在我面试的时候就用到了。

https://www.youtube.com/user/SpartacanUsuals/playlists

4.2.2 A/B testing (~2周)

根据公司不同,一些职位可能会要求懂什么是A/B test,怎么设计实验。这对于实验出身的博士并不是很难理解,但是涉及到一些网上实验的细节和统计的计算,还是需要多加练习。Udacity这门课是由Google的员工讲授,获益匪浅。https://www.udacity.com/course/ab-testing–ud257

4.2.3 Numpy & Pandas(2-4周)

如果使用Python进行数据分析,那么Numpy和Pandas这两个函数包是必不可少的。

Udacity的Intro to Data Analysis讲了如何使用这两个包,非常好学,好用。https://www.udacity.com/course/intro-to-data-analysis–ud170

4.2.4 R(2-4周)

一般来说,只要熟练掌握一门语言Python,就可以申请大多数数据科学的职位。之所以把R单独列出来,是因为R有很多统计相关的函数和包,在调用的时候比较方便。

Nanodegree里Data Analysis with R是非常不错的R入门教程。https://www.udacity.com/course/data-analysis-with-r–ud651

这门课只是介绍了基本的作图和探索性数据分析EDA,而不涉及其他的R的功能。所以如果想要深入学习R的话,还是要自己多加练习。

4.2.5 SQL(2-4周)

同样的,Nanodegree里Data Wrangling with MongoDB是非常不错的SQL入门教程。https://www.udacity.com/course/data-wrangling-with-mongodb–ud032

除此之外,SQL zoo也是很好的练习资源。http://sqlzoo.net/wiki/SQL_Tutorial

4.2.6 大数据(1-2 月)

有些职位可能会要求有大数据处理的经验。

4.2.7 机器学习(1-2月)

Udacity的机器学习课程偏操作,对于理论和计算的要求不高。而Coursera的课更偏理论的推导和数学。两门课同时学习,效果更佳。

4.2.8 人工智能(2-6月)

大多数数据科学的职位并不要求会人工智能,但是如果需要或者感兴趣的话,可以自学。

4.3 商业思维

根据职位不同,有些数据科学的面试会有类似于咨询的案例分析,而有些则只是强调编程和数据分析技能的匹配。

强烈推荐咨询的案例面试。比如Victor Cheng的免费视频https://www.caseinterview.com/ 对于理解如何站在商业角度看问题,还是很有启示的。由于大多数案例分析没有所谓的标准答案,表达能力和思考问题的角度就非常重要了。

举两个例子:

1. 问:如何预测谷歌引擎2020年在比利时的搜索量?因为搜索量直接决定公司需要购买的服务器数量,所以预测很重要。

思路:这是很明显的时间序列预测问题。建几个time series prediction model 不难,但在涉及到任何实际数据分析之前,最好先进行案例分析。从大局着眼,分析问题,提出框架(MECE思想, mutually exclusive collectively exhaustive),最后再建模。毕竟建模简单,关键是思考的过程。以下是一些可能的思路。

1) customer 我们的用户是谁,市场多大,近些年趋势如何,客户用什么设备搜索(电脑,手机,ipad)。每月每周每天趋势如何,是否具有季节性或周末高峰?

2) competitor,其他搜索引擎。

3) company, product, cost。如果搜索有周期性,多余的服务器资源如何利用?租赁或公司内其他的服务?

4) 建模。estimate range,上面的因素如何影响到各个参数的设定。是overestimate还是underestimate更糟?为什么?

总结:案例分析是个讨论交流的过程,一定要避免个人独白。建模是最后一步,在此之前,还是要多多分析。

2. 问:如何提高某保单的销售额(revenue)?

思路:revenue在咨询中是个很经典的问题。准备过咨询的人可能可以很快地列出框架,没有类似经验的则可能想到哪儿说到哪儿,一会说要降价,一会又说要促销,一会又说要增加销售渠道。但从分析问题的框架来看,MECE思想,可以大体分为内因外因。

1) 外:该类保单市场多大?趋势如何?主要竞争者是谁?客户是谁?客户年龄收入等状况(customer segmentation)?价格敏感度如何?

2)内:该保单是啥?车还是人?在公司占比多少?是主打产品还是副线?该产品特色如何?是价格还是品质?与其他保单是否冲突?

3) 要提高销售额,无非是提高价格或者提高销量。如果该产品价格敏感度低,而且属于独特的刚性需求产品,可以提价。如果该产品是generic,也可以通过降价提高销量,但要考虑是否有其他竞争者的价格战。也可以针对不同客户进行不同定价。

4) 行业相关。这里保单是保险业,如果对保险业或者任何面试的行业不熟悉,可以直接问面试官,保单的销售额是如何计算的?是保费投保人越多越好,还是说保费减去保险公司理赔的数量,算差价。这样就需要进行风险评估定价。因为我并没有深入了解过保险业,所以也不清楚这个行业相关的知识。但是如果你拿到了保险公司的面试,提前了解该行业的基本情况,特别是盈利模式,对面试很有帮助。

总结:如果实在不懂,一定要问面试官。在进行任何建模和数据分析之前,一定要确认自己理解对了问题。不然就南辕北辙了。

此外,大多数博士并没有什么商业的实践经历,如果有可能,可以参加一下data hackathon或者case competition,了解一下思考问题的一些方法。

5. 做项目

除了Udacity的项目,也可以自己在Kaggle(https://www.kaggle.com/)上做项目。总之是要有内容可以写,面试的时候可以聊。

订阅一些数据科学的邮件,比如https://www.datascienceweekly.org/,里面经常有其他人做的项目,可以借鉴一下。

如果有时间,可以参加数据科学领域的线下聚会https://www.meetup.com/,我就在一次线下聚会的时候遇到了神经科学转行的同志。

项目是简历的重中之重。

然而,我个人不建议在基础没有打好的情况下去刷项目,因为那样很容易陷入调参的大坑。毕竟有时候机器学习是玄学,参数模型选对了,准确率刷得很高。然而,从知识的角度,只刷项目并不能很深入地理解。在学习课程之后,再有针对地刷几个项目,了解工作流程和思路,比不停调参有意义得多。

6. 简历

网上和学校的职业教育中心已经有很多教如何写简历的攻略了(https://www.careereducation.columbia.edu/topics/resumes-cvs),Udacity的Nanodegree也有教人写简历的课程和反馈。这里就强调一下可能会被忽略的几点。

  1. 格式
    • 一页PDF。
    • 避免用花哨的格式,比如竖列的格式,看起来虽然新奇,但是确实没什么大用。
    • 避免用图标和新奇的字体,避免在电脑自动筛选简历的时候无法识别格式。
  2.  Summary
    • 大多数应届毕业生并没有太多的东西可写,也很难通过自己的经历体现自己的优势。在一位职场达人学姐的指导下,我在简历最前面加了Summary的部分,针对所申工作的要求,高度概括总结自己的优势和经历。这样在HR筛简历的时候,可以一目了然地看到优点。
  3. Projects
    • 量化。数据量有多大? 用了多少个特征?用的是什么具体的模型?结果提高了多少?改变了什么?
    • 独立项目还是合作项目?个人做的内容是什么?
    • 细节越多,越独特,也越能够吸引人。如果写得很宽泛,就显得缺乏个人的思考。

7. 软实力

7.1 沟通能力

推荐一本书吧,卡耐基的how to win friends and influence people。

https://www.amazon.com/How-Win-Friends-Influence-People/dp/0671027034

不少人说这是一本鸡汤软文,充斥着传销一般的励志故事……我之前也是这么想的,所以一直不想读。去年一个我认为人际能力很好的朋友推荐我去读,他表示自己刚来美国的时候也是没啥朋友,后来就按照书里的一些建议改变自己的行动,刚开始就是跟人尬聊,碰上路人或者街边的流浪汉都尬聊,给予对方最大的注意力和兴趣,后来逐渐就自然起来。我读了之后,真的是获益良多。最大的收获是,大多数人做决定,并不是100%理智的,相当多的时候,瞬间的决定取决于当时的情势,自己的喜好,和运气。人性并不是我们想象中那么直截了当,不是跟数学公式一样精准科学。

 

7.2 英语

交流起来应该没啥问题,口音的话推荐一下American Accent Training 里面讲了很多中国人发音的问题,美式英语的特点。如果对自己的口音很在意,可以用这本书短时间强化一下。

https://www.amazon.com/American-Accent-Training-Audio-CDs/dp/1438071655

8. 申请

8.1 投简历

大概10个月-2年之后(取决于个人的进展),就可以投简历找工作了。

2018年的暑假实习基本2017年的8月就有公司开始招人了,一直持续到2018年年初,取决于公司的招人情况。而全职工作很多公司都是全年招人,应届毕业生的招收主要集中在校内的秋招或者春招,把握好时机。

如果有可能一定要投实习,积累业界经验,这样在找全职工作的时候也更加有所准备。如果实在没办法实习,那就尽量做一些项目。在投简历的时候尽量内推,增加自己获得面试的几率。不管是通过LinkedIn直接找校友,还是在论坛上找人帮着递简历,在不惹人烦的情况下多多联系。

当然,很多公司可能还是会自己网上海投。如果可能,最好能够联系公司里的员工出来喝茶进行informational interview,了解一下公司情况。海投的话,建议广撒网,反正投简历不收费。

8.2 培训项目

除了投工作的简历,还可以申请一些免费的培训项目,这些项目基本都是针对转行的PhD,进行3-4个月的高强度培训,做项目,然后跟其他公司直接面试。

  • Insight Data Science
    • http://insightdatascience.com/
    • 我所接触的Insight fellow对项目的评价都很高,也基本都通过Insight找到工作了。当时我同时拿了实习公司和Insight的offer,因为考虑到实习可能有return offer以及是真实的工作环境,最终并没有参加Insight的培训。
    • 我个人的面试经历是,Insight确实是要求申请人本身有一定的编程和数据处理经验,最好已经会用Python,R,或者MATLAB。除了PhD的项目,申请人最好有自己的小项目,比如很多人做过的twitter自然语言分析,纽约citi bike之类的。如果只是写自己PhD阶段处理过的数据和项目,其实并不是特别充实,也不太容易过简历这一关。
    • 面试的时候,需要申请人自己讲述一个数据处理的项目。这个项目不一定要非常复杂,或者非常高深。我之前有听别人说一定要有很炫酷的机器学习或者自然语言之类,但根据我个人的经验来看,Insight更看重申请者个人对数据本身的热情和对问题的思考,特别是表达能力。如何把一个项目讲得绘声绘色,让听众也能够很感兴趣,非常engaging,如何把一些复杂的编程语言说清楚,如何解释自己编程的逻辑(比如为什么选择决策树,而不是其他机器学习的模型)。如果只是进行一个简单粗暴的grid search,用TensorFlow建个神经网络跑几百个epoch,却不解释清楚“为什么”选择一个metrics,“为什么”要多次抽样,甚至于“为什么”对这个问题感兴趣,那么可能即使你的机器学习项目最后的准确率非常高,但也很难过得了面试。
    • 我当时把面试的项目整理成三篇博客(http://www.juyang.co/shared-ride-efficiency-data-wrangling/),项目基本是数据探索和解释,并没有预测分析和机器学习。在面试的时候不仅给面试官展示了Python代码,也讲述了一个完整的故事,得到了一个比较有用的结论,申请的同学们可以作为一个参考。
  • Data Incubator
    • https://www.thedataincubator.com/
    • 在Insight之前,我也申请了这个项目,但在code challenge环节被拒。后来想想被拒的原因非常明显,我的项目做得不好。就如我上面所说,我本以为一定要做炫酷的自然语言分析啊机器学习啊时间序列分析啊神经网络啊,这些看上去很“高端”的项目,却忽略了自己本身的技术和专长,以及时间和资源。俗话说,没有金刚钻,别揽瓷器活。我当时想做的项目是用自然语言分析纽约地区Yelp上的餐厅review,从而给用户推荐个人化的餐厅。这个想法可能是好的,但是项目工程太大,而且数据并不能简单获得,Yelp的API限制下载流量,所以我花了大半天才下好数据,然后发现这个API并不提供完整的review,而只是一句话简介。而我本身对自然语言(NLP)的了解只是停留在知道怎么用的阶段,并没有深入的理论学习,在分析数据的时候并不能很快地抓住重点。最后,因为时间有限加上数据不完整,这个项目我做得非常仓促。不过在Data Incubator失利之后,我吸取了教训,好好准备了Insight的项目。

投完简历就是面试了!这个时候的你,对数据科学行业有了基本的了解,自己的技能树也打好了基础。面试就是另一个阶段的事情了,以后有机会再写。

9. 结语之前

据我有限的道听途说,今年data scientist招人基本都是跳槽的experienced hire,新人大多要求博士学位。之前跟一些统计硕士聊过,他们抱怨说自己专业对口,花了几年时间专门学统计,难道还比不过那些个从物理生化机械转行的博士么?而现实是,除了某些打着data scientist名号把data scientist和data analyst放在一块招的,大多数data scientist真的倾向于博士,哪怕专业不那么对口。至于原因,问过一些面试的人,大概是说data scientist整体因为算是个不太成熟的领域,很多东西都要自己去探索,去research,自己去想idea,然后设计实验,分析结果,解释不清不白的数据,还要做ppt报告,几年博士的训练在广义的科研能力上可能更加适合,特别是在失败和不顺时候的韧性。当然就不提大多数博士年龄比硕士大,所以在人情世故上可能更通达一些。至于知识啥的,他们觉得你博士都读下来了,智商应该够,啥都可以以后再学。所以我其实觉得quit phd可能是比较冒险的行为,如果可以的话,最好是一边读phd,一边学习转行技能。说到底,学历还是很重要的。

在市场竞争激烈的现在,申请的时候别管工作名称,data scientist和data analyst,business intelligence,如果编程算法能力不错的话也可以申一下engineer职位。总之能申的都先申了,入门再说。与其抱着不切实际的理想,不如脚踏实地地从头做起。

10. 结语

感谢这一路上帮助我的家人、导师、朋友、同学、同事,以及在我焦虑崩溃的找工作过程中坚持不懈打Dota2并一直陪伴鼓励我的PT。

本文来自:http://www.juyang.co/phd%E8%BD%AC%E8%A1%8C%E4%B9%8B%E8%B7%AF/

Advertisements

慢病毒的包装之基础知识

The use of viral delivery systems to transduce cells for gene and protein investigations has become prominent over the last 20 years. In particular, the use of lentiviral vectors permits stable expression of your gene of interest. This is all possible with a little bit of nucleic acid magic.

Lentiviruses (a genus of retrovirus) express reverse transcriptase, which converts the viral RNA to double stranded DNA, and integrase, which inserts this viral DNA into the host DNA. Once the viral DNA is integrated into the host DNA, it divides along with host cell and none are the wiser. The main difference between retrovirus and lentivirus is that retrovirus infects only dividing cells whereas lentivirus infects both dividing and non-dividing cells1, thus making it possible to infect post mitotic cells like neurons2.

Experimental Design

As we all remember from microbiology class, viruses need cells to “survive” as they lack the replication machinery to produce more copies of their genome. So one of the most important aspects of lentiviral vector delivery system experiments is the actual production of lentiviral vectors, which often takes place in HEK293 cells (or some variety).

For example, one common use of lentivirus delivery systems is to insert short hairpin RNAs (shRNA) for RNAi-mediated gene knock-down. In this instance, the shRNA is first packaged into the lentiviral vector, and is then used to transfect HEK293 cells. These transfected cells are allowed to incubate for ~3 days, which permits the lentivirus to replicate and produce lentiviral particles that are then harvested, titered, and used to transduce target cells.

Before starting any experiment, it is always a good idea to plan ahead and order all the required components. For transfection and transduction experiments, you will need reagents for maxiprep/midiprep, media for growing both HEK293 cells and your cells of interest for the study, reagents like lipofectamine for transfection, and the appropriate antibiotic (depending on the antibiotic resistant gene present in your lentiviral vector).

Small RNAs For Targeted Knock-Down

Thanks to the user friendly web applications like siRNA Wizard, BLOCK-iT™ RNAi Designer, shRNA Designer and others, it has now become very easy to design shRNAs. Core facilities in universities may also offer to design and synthesize shRNAs according to your preferences. Always make sure to include a fluorescent marker with the shRNA for easy detection of infected cells. Once the shRNA is obtained, it is a good idea to use midi or maxi-prep, to produce enough for upcoming experiments.

Are Your HEK293 Cells Happy?

It is essential to maintain cells in good condition. Cells should be routinely checked and split when they reach about 80% confluency. HEK293 cells are fast growing and trypsinize quickly, so do not allow for HEK293 cells to incubate for long in trypsin (30-60s should do it), or you could witness large cell death. Cells thawed from frozen stock should be passaged at least twice before seeding for the transduction experiment. Another important point to remember is to handle dishes containing cells very gently as the cells detach easily. For the transfection experiment, HEK293 cells should be seeded at about 5*10^6 cells/10cm dish or in such a way that the cells are about 40-50% confluent the next morning (day of the transfection).

Packing up for the Transduction

The next step is to package the lentiviral vector plasmid, along with viral packaging vectors, into liposomes for delivery into HEK293 cells.

It is important to use serum-free media such as OptiMEM for the packaging part of the experiment. Serum free media enhances the complex formation of DNA with cationic liposomes and there by increases transfection efficiency. For more information please refer here and here!

  • Add 500 µl of OptiMEM media to two 1.5 ml tubes labeled Tube A and Tube B.
  • Tube A: add 60 µl of Lipofectamine
  • Tube B: Add equal ratio of the plasmid with shRNA and packaging plasmid to the tube: 10ug of the shRNA, 5ug of the plasmid encoding gag and pol, and 5ug of the plasmid encoding rev.
  • Gently tap mix the tubes, flash spin, and incubate at room temperature for 10 minutes.
  • Add contents of Tube B to Tube A drop wise, flick the tube gently, flash spin, and incubate at room temperature for 45 minutes
  • At this stage, change the media on HEK293 cells to 5ml OptiMEM media

Now that we have the transfection mixture with the shRNA, packaging plasmids, and lipofectamine, it’s time to start packing.

  • Tilt the petri dish with HEK293 cells and add the transfection mixture drop-wise to the collected medium. At this point, if you are not gentle you can see the HEK cells getting unhappy and dislodging. So please be cautious while adding the transfection mixture.
  • Once the solution is added, carefully swirl the plate to both mix up the medium and evenly distribute the transfection mixture onto the cells.

Incubate the cells 5-8 hours in the serum free media. After incubation, gently aspirate the media (this will contain any plasmid-containing liposomes that did not transfect the HEK293 cells) and add 10 ml of complete media to the side of the plate, such that cells do not detach. The HEK293 cells will package the shRNA into a viral particle and release it into the media. From this point onwards, the media will be rich with virus particles, so proper PPE should be worn while handling. Collect the media (virus particles) after 48 hours and add 10 ml fresh complete media to the same plate. Collect media again after 72 hours and combine with the media collected at 48 hours. Filter sterilize the combined collected media by passing it through a  0.45microns filter to permit virus flow-through. Freeze thaw cycles will reduce the potency of the virus, so it is a good idea to make 2.5ml aliquots of the virus. The virus can be stored at 4° C for about a month or two, and at -200C  long term. Always use bleach to dispose of the pipette tips and dishes used during virus production. Read and learn a lot more about viral transductions here and here!

Getting the Virus into the Cells

Now that we have the virus, it’s time to infect the target cells. In the majority of cases, it is important to titer your virus so that you know the concentration used for your experiment and can reliably repeat your results!

However, in this particular method, we are only aiming to obtain a good knockdown. This is achieved by transducing at least 50% of the cells with virus.  We should make sure to maintain the proper ratios to get about 50% transduction :

  • Use an equal ratio of virus and cells to get 50% transduction. In a 15ml tube, resuspend about 2 million cells (1/4th of a confluent 10cm dish) in 2.5ml complete media. To the same tube, 2.5ml of virus (1/4th of the total virus obtained from one 10cm dish) and 15ug/ml of polybrene are added. Polybrene3 enhances the transduction efficiency by neutralizing the charges between viral particles and the cell membrane. However, the exact mechanism is not clearly known.
  • Mix gently and plate the cells in a new 10cm dish. Wait for 24 hours before changing to fresh complete medium without virus. If the shRNA construct contained a fluorescent marker, you can check the success of the integration 48 hours post-transfection; if not, go ahead with the antibiotic selection for another 48 hours. I usually start the transduction on a Wednesday, so the cells can be selected over the weekend.

You Did It!

Check your cells for knockdown or your specific end point by the appropriate analytical method, typically this would involve a Western Blot.

Please feel free to comment below with any questions. Thanks for reading and good luck!

References:

  1. Lentiviral Guide, https://www.addgene.org/viral-vectors/lentivirus/lenti-guide/
  2. Matt Carter, Jennifer Shieh, in Guide to Research Techniques in Neuroscience (Second Edition), 2015
  3. Davis, H. E., J. R. Morgan, and M. L. Yarmush. 2002. Polybrene increases retrovirus gene transfer efficiency by enhancing receptor-independent virus adsorption on target cell membranes. Biophys. Chem. 97:159–172

文献阅读是科研的重要基础,但是并非每一个科研人员都喜欢和擅长看文献——例如我自己。我发现,阅读文献存在的问题可以归纳为三个:坐不住,记不住,想不开。
第一大问题:坐不住
坐不住,指的是不喜欢看文献。为什么我们喜欢看小说,看电视剧,却不喜欢看文献呢?首先是因为看文献难,其次是因为看小说、电视剧更有趣,而看文献却枯燥乏味。“坐不住”的问题怎样才能解决?根据《兴趣从何而来》一文中的分析,可以采用以下方法:
首先是通过大量阅读使看文献成为自己擅长的事情。人们总是对自己擅长的事情感兴趣,当大量阅读文献之后,积累了某一领域的基础知识,领悟到了阅读文献的方法,再去看文献难度降低很多,就容易静下心来读了。一开始看文献,好比跑马拉松,很痛苦;熟练了之后,好比散步,很轻松。此外,在某一领域内阅读了一定量的文献之后,对该领域变得熟悉起来,而熟悉也可以增强兴趣。
其次,带着问题看文献。问题一旦提出,就有了回答的需求。带着问题看文献,满足了自己回答问题的需求,而需求得到满足就会导致快乐,所以带着问题看文献会更有兴趣。需要注意的是,提出问题之后,不要马上看文献,而要冥思苦想一段时间。这就如同人在不是很饿时吃饭没胃口,如果饿了一天之后,随便吃什么都
第三,树立明确的目标。例如,一天看一篇文献,或者一周精读一篇文献。树立目标之后,就有了看文献的动力。如果能找到同学和自己树立同样的目标,相互监督、交流,则效果会更好。
第四,用“爱屋及乌”的方法提高兴趣。我曾经在一门课程上向大家介绍过日本科学家利根川进的一篇论文。在介绍的同时,我顺便了解了他的一些事迹并对他产生了兴趣。后来有一天,我在一期Cell上看到他的两篇论文,高兴不已,因为看到我“认识”的人发表的文章了!对某一位科学家的兴趣,常常也可以转化为对他写的论文的兴趣,这就是“爱屋及乌”。因此,熟悉和喜欢一些科学家对看文献是有帮助的。此外,一般大家都有自己感兴趣的领域,看到非兴趣领域的文章,把它与自己感兴趣的领域联系起来,自然就更有兴趣了。
第五,用做白日梦的方法提高兴趣。想象自己看文献的能力提高之后,可以津津有味地阅读Science,Nature(参见施一公老师博文《学生如何提高专业英文阅读能力》),轻松愉快地获取科研信息,提高科研水平,享受科研。这样的想象也可以增强兴趣。
第六,用想象力增强看文献的兴趣。文献的内容虽然是死的,但是可以把它想象成活的东西,可以对它编故事。喜欢武侠小说,就编成武侠小说,喜欢言情小说,就编成言情小说,喜欢历史剧,就编成历史剧。
还有一些做法会降低看文献的效率从而降低兴趣。张彦斌老师在《旁观留美研究生的困惑》一文中提到有一位研究生,因为看文献时总是从头开始一字不拉地看地看,结果看了很久还是不懂。后来接受张老师的建议一开始只抓主线效果就好多了。施一公老师也曾经提过:看文献要抓主线(见《学生如何提高专业英文阅读能力》)。
对于有些人来说,走动可以促进思维,所以如果实在坐不住,不妨把文献打印出来,边走边看。
第二大问题:记不住
当能静下心来看文献之后,第二个问题就是记不住了。今天看过的文献,过几天就没有印象,过一个月就忘得一干二净。所有的努力都化为乌有,怎么能使人不沮丧?
我尝试过很多声称可以增强记忆力的方法,有些甚至声称可以增强记忆力十倍,但我的记忆力连20%的提高都没有。事实上,精简记忆内容才是最好的选择。我们可以轻松地将记忆内容精简为五分之一,十分之一,但是却不可能提高自己的记忆力五倍,十倍。
精简记忆内容还有一个极其重要的好处:提高了自己对事情重要性的判断力。因为在精简记忆内容的时候,需要记忆的一定是重点,需要舍弃的是次要部分。长此以往,不仅对文献,对科研,而且对日常生活中不同问题和事情重要性的判断力也会大大提高。无论你将来从事何种职业,这种能力都是极端重要的。
我们可以把一篇文献精简为一句话,几句话,或者很短的一段话。哪些部分是重点呢?首先是结论,因为结论是我们用来进行推理的基础。如果精简为一句话,这句话就一般是结论。不过,由于结论并非完全可靠,所以,一定要加上“可能”两个字。例如:本文研究表明:基因A可能(或者很可能)与记忆有关。
如果精简为几句话,除了结论,还要加上关键实验。一篇文章为了论证一个观点,常常会做大量的实验从多方面进行论证,但是,最关键的实验往往只有一两个。例如:本研究在小鼠身上敲除基因A,水迷宫实验发现记忆力受损;过表达基因A,水迷宫实验发现记忆力增强,因此表明基因A很可能与记忆有关。
如果精简为一段话的话,还需要加上选题的依据。即为什么做这个研究,这样研究有多重要,为什么重要。此外,还可以加上对自己课题有帮助的细节,例如实验方法、论证方法等。总之,是虽然对大部分人不重要,但是对自己很重要的地方。
看完一遍暂时记住了之后,不久就会忘记。所以,对于重要文献,定期的复习很重要。马臻老师曾经在《解答读者问题——读文献等》的博文中说过:“好的文献至少要读三遍。做试验前读一遍,实验中读一遍,写文章时再读一遍。”这个建议很好。做试验前看过的文献,可能在做实验中就会忘记,也可能没有注意到对自己有用的细节,在做实验中再看,往往有新的发现。
此外,有些文章会对论文进行精彩的介绍,看了这样的文章,记忆就会很深刻。例如,《科学美国人》就会经常介绍有趣的研究,文章写得很好,可以订阅。科学网上,我发现肖陆江老师的博客上介绍了许多神经科学的论文,而且写得简短有趣,看后难以忘记。
看完一篇文献之后,做成PPT,向别人介绍文献内容也是增强记忆的好方法。我选修的有些课程就需要向别人介绍文献,虽然当时需要比较多的时间,可是后来却难以忘记,付出的时间也是值得的。如果觉得做成PPT太麻烦,也可以简单的和别人口头讨论。
写博客介绍文献内容也是一个不错的选择。要想把一篇文献介绍清楚,自己就必须先理解它;要想介绍的简洁,就要能抓住重点;要想写得有趣,就要发挥想象力。我经常发现,写博客是可以促进记忆的。我的博客今后可能会介绍一点文献。
与熟悉的事物建立联系是促进记忆的重要方法。所以,看文献的时候,应该尽可能与日常生活和自己熟悉的理论、事物联系起来。经常这样做的话,很快就可以发现,其实大部分道理都是差不多的。
如果有足够的兴趣和热情,也可以自己组织Journal club,找一批热爱读文献的同学,定期轮流由一人向大家介绍文献。
很多研究基因、蛋白质、分子功能的文献都有固定的模式可循,无论怎样千变万化,最后都离不开最基本的几招。记住了这几招,看文献就更容易记住。我以前曾将研究基因功能的研究方法归纳为四大绝招,后来把这几招运用到看文献中去,发现看文献轻松很多,也更容易记住了。(参见博文《研究基因功能的“四大绝招”》)
很多人可能觉得看在电脑上看文献不容易记住。所以对于重要的文献,可以用笔记本认真记下来。我曾经这样做过,发现效果不错。
第三大问题:想不开
仅仅记住别人做的研究是不够的。科研的灵魂是创新,即使你能看完并记住成千上万篇文献,如果不能做出好的研究,可以说只是浪费时间。“想不开”,指的是看了文献没有想法,没有收获。大家都相信:付出就有收获,努力就能成功。如果大量付出却没有收获,的确会让人想不开­——烦恼、郁闷。如果你看文献总是“想不开”,可能就会真的想不开了。所以,看文献一定要“想得开”。
怎样才能算是“想得开”了呢?看完一篇文献,能够提出问题,产生新的想法,对自己的课题有启发,或者指明了新的研究方向。
带着问题看文献很重要,看了文献之后思考问题更重要。如果看完后没有问题,那么就依次回答以下几个问题:
1. 本文有多重要,为什么?
判断研究重要性的能力是科研鉴赏力的主要构成。科研鉴赏力的表现是怎样的?看到重要的研究能够判断出来,并欣赏到其美妙之处。只有不断地对文献和研究的重要性进行判断,才能逐步培养出自己的判断力。经典文献,可以作为“重要研究”的阳性对照。看一篇经典文献,“这篇文献重要吗?”,回答一定是肯定的。“这篇文献为什么重要?”,才是重点思考的问题。只有弄清楚了重要的原因,在分析将来的文献时,才能准确判断出其重要性。所以,阅读文献,应该从经典文献开始,并弄清楚经典文献重要的原因。
2. 作者为什么能想到这个选题?我能够想到吗?
决定科研人员水平的关键就是选题。选题关注三点:创新性,重要性和可行性(参见我以前的博文《谈科研的创造力,洞察力和行动力》。选题一旦确定,怎样设计实验证明就都是技术活了,选题才是艺术。分析别人为什么能想到这个选题,可以使自己得到启发,将来也能想到好的选题。分析完了之后,模拟一遍作者的选题过程。假设自己置身于作者的处境,知道作者知道的一些背景知识,问自己:我能够想到这个选题吗?如果可以,怎样想到?如果不可以,为什么?
3. 本文解决了什么问题,提出了什么新的问题?
几乎所有文献都是要解决一个科学问题。但是,科研是无止境的,一个问题的解决,往往导致许多新的问题产生。看完一篇文献,要问自己:本文解决了什么问题?这个问题有多重要?这个问题的解决产生了哪些新的问题?其中哪个是最重要的?(参见《划时代的论文与划时代的问题》)
4. 本文对自己课题有何启发?
创造力的关键就是建立联系。看完一篇文献,一定要与自己做的课题或者将来打算做的东西联系起来,问自己:本文对我的课题有何启发?哪些地方可以为我所用?
5. 将来的发展方向是什么?
高水平的科学家可以准确的预测未来,并根据对未来的预测决定现在研究什么。只有不断地对未来进行预测,才可以养成预测未来的习惯和提高自己对未来的预测能力。看完一篇文献之后,要思考:这个领域今后的发展方向有哪些?其中哪一两个是最重要的?本问题与问题3有紧密联系。
6. 本文有哪些不足?怎样改进?
金无足赤,无人无人,一篇文章写得再好也有缺点。能够发现高水平论文的缺点,不仅是自己科研水平的体现,也可以防止自己犯类似的错误,因此也可以提高自己的科研水平。所以看完文献之后应该思考文章有哪些不足,应该怎样改进。
7. 结果是否有其他解释?
同一个结果往往可以有多种解释,对这些解释考虑是否周全是决定结论是否可靠的关键。如果细心分析的话,也许能发现不同于作者的解释。这样的锻炼,不仅可以发现别人的不足,还可以帮助自己养成严谨的思维习惯,在设计实验时考虑到多种可能并用对照增强文章说服力。
8. 我有哪些新的想法?
回答完前面七个问题之后,自然就想得开了,也会产生一些新的想法。如果还不知足,那就再强迫自己想出几个idea来。

===================================

读者来信:从 Ph.D到现在工作半年,发了12 篇paper, 7 篇first author.)我现在每天还保持读至少2-3 篇的文献的习惯.读文献有不同的读法.但最重要的自己总结概括这篇文献到底说了什么,否则就是白读,读的时候好像什么都明白,一合上就什么都不知道,这是 读文献的大忌,既浪费时间,最重要的是,没有养成良好的习惯,导致以后不愿意读文献.
1. 每次读完文献 (不管是细读还是粗读), 合上文献后,想想看,文章最重要的 take home message 是什么, 如果不知道,就从abstract,conclusion 里找, 并且从discuss 里最好确认一下. 这样一来, 一篇文章就过关了. take home message 其实都不会很多, 基本上是一些concepts, 如果你发现你需要记得很多,那往往是没有读到重点.
2. 扩充知识面的读法, 重点读introduction, 看人家提出的问题,以及目前的进展 类似的文章, 每天读一两篇,一个月内就基本上对这个领域的某个方向有个大概的了解.读好的review 也行, 但这样人容易懒惰.
3. 为了写文章的读法, 读文章的时候, 尤其是看discussion 的时候,看到好的英文句型, 最好有意识的记一下,看一下作者是谁,哪篇文章,哪个期刊, 这样以后照猫画虎写的时候,效率高些.比自己在那里半天琢磨出一个句子强的多. 当然,读的多,写的多,你需要记得句型就越少.其实很简单,有意识的去总结和记亿, 就不容易忘记.

读者来信:第一,提高阅读的效率
1.集中时间看文献:
看文献的时间越分散,浪费时间越多。集中时间看更容易联系起来,形成整体印象。
2.做好记录和标记:
复印或打印的文献,直接用笔标记或批注。pdf 或html 格式的文献,可以用编辑器标亮或改变文字颜色。这是避免时间浪费的又一重要手段。否则等于没看。
3.阅读顺序:
根据阅读目的选择合适的顺序。一般先看abstract、introduction,然后看discussion,最后看result 和method(结合图表)。
第二,文献的整理
1.下载电子版文献时(caj,pdf,html),把文章题目粘贴为文件名(文件名不能有特殊符号)
2.不同主题存入不同文件夹。文件夹的题目要简短,如:PD,LTP,PKC,NO。
3.看过的文献归入子文件夹,最起码要把有用的和没用的分开。
4.重要文献根据重要程度在文件名前加001,002,003 编号,然后按名称排列图标,最重要的文献就排在最前了。而且重要文献要注意追踪。

读者来信:
如何读材料及试验:当你文献看多了以后,这部分内容也很简单了,无非就是介绍试验方法,自己怎么做试验的。很快就能把它看完了吧
如何看试验结果:看结果这部分一定要结合结果中的图和表看,这样看的快。主要看懂试验的结果,体会作者的表达方法(例如作者用不同的句子结构描述一些数字的结果)。有时看完以后再想想:就这么一点结果,别人居然可以大篇幅的写这么多,要是我可能半页就说完了?
如何看分析与讨论:这是一篇文章的重点,也是最花时间的。我一般把前面部分看完以后不急于看分析讨论。我会想要是我做出来这些结果我会怎么来写这部分分析 与讨论呢?然后慢慢看作者的分析与讨论,仔细体会作者观点,为我所用。当然有时候别人的观点比较新,分析比较深刻,偶尔看不懂也是情理之中。当你看的多 了,你肯定会看的越来越懂,自己的idea 越来越多。

 

在美国的中国人回中国生活:如何换中国驾照?

本文所有经验与流程均基于浙江省宁波市,户籍为宁波,或拥有宁波市居住证的同学可以完全follow本文的流程;其他地区请酌情参考!作者会积极在评论区为大家答疑,但不保证准确性与时效性。一切信息请以车管所为准。本次更换驾驶证的时间为2018年7月23日。

材料要求

首先,先为大家罗列一下需要准备的材料,C代表需要复印:

  1. 美国驾照C
  2. 身份证C
  3. 护照个人信息页C
  4. 美国签证页C
  5. 居住/暂住证C

好吧。。。可能似乎好像全都需要复印,为了保险起见请每样材料复印两份。

办事流程

标准办事流程如下:

  • 请先访问本地车管所的网站,核实所需资料。具体操作方式为,访问 http://bj.122.gov.cn/ 切换至当地网站——办事指南(页面右上角)——窗口办事指南(左侧点选)——持境外机动车驾驶证申请驾驶证(下拉框,在中间部位)。请先自行阅读当地车管所规定再前往办理。
  • 百度/电话咨询车管所制定的驾照翻译机构并询问/百度电话,了解对方营业时间、翻译周期及所需材料。
  • 找一个工作日的早上前往翻译机构(一般为所在城市的外事交流中心/外国人服务中心/翻译协会),带上所有材料进行驾照翻译。缴费后翻译中心将出具《境外机动车驾驶证翻译函》并盖公章。
  • 火速前往车管所,通常在车管所旁就有医院设立的体检处,走个形式就可以了。体检时请告知护士是C1驾照,体检结束后拿到体检结果表一份。
  • 进入车管所,告知需要境外换证,取号等候。叫到号后,将所有材料的原件和复印件全部递交给窗口。
  • 选择科目一考试日期(最快可选当日),交费后领取科目一预约确认单。(到了这一步,你离胜利就仅剩一步之遥了)
  • 完成科目一考试,共100题,90分以上合格。通过后打印科目一考试成绩确认单(在考场领取),回到车管所再次领号,待核实材料后缴纳工本费。
  • 等候约10分钟左右就可以领取属于你自己的中国驾照了。
  • 更换的驾照

避坑

怎么样,看上去是不是非常简单呢,实际上,根据各地政策不同,有一些坑大家要谨慎避开:

  • 部分车管所接受自己带的一寸照片,而部分车管所不接受。保险起见,准备4张一寸照片随身携带,反正不占地方,要是被要求拍照也不亏。
  • 请备好200元左右的足额零钱,部分业务无法接受微信/支付宝,甚至刷卡也不行,这一点上国内的车管所和美国的DMV达成了一致共识~
  • 尽量在周三的上午前往,根据朋友的DP显示,出现过一上午三小时就全部搞定的状况。
  • 有条件请尽量前往二线城市办理,根据北京和上海同学的DP显示,一线城市的科目一往往要排到一个月以后。而科目一则是最关键的步骤。二线城市办事效率也不低,相关的案例似乎也接触过不少了,所以时效性反而强于一线城市。三四线城市可能会出现车管所一年都见不到几张国外驾照彻底懵逼的状况,请谨慎操作。
  • 部分城市车管所似乎没有与出入境联网,这种状况就很恼火,需要去户籍所在地出入境大厅打印出入境证明。根据笔者的观察,PVG、PEK都在入境的地方看见过出入境记录打印的地方,因此可以在回国的时候做好提前规划,反正三分钟的事情。
  • 各国驾照更换流程大同小异,不过小语种驾照翻译一般需要2-3个工作日,请提前预留好时间。
  • 相关法规的要求是:自驾照签发日起连续在该国居住三个月方可补考科目一换驾照
    • 1月5日拿到美国驾照,4月5日之后回国,则直接换驾照
    • 1月5日拿到美国驾照,3月5日回国,此后无论什么时候再回美国,住了多久,均不符合政策
    • 1月5日拿到美国驾照,3月5日去了墨西哥,4月5日之后回国,如果护照上没有出入境章体现的话无所谓,有出入境章则不符合政策

综上所述,满足连续居住满三个月是关键,这个记录时间以出入境记录为准。车管所和翻译中心在对部分州的驾照验证时似乎不是特别熟练(较为罕见/模板没有更新)所以可能需要进行一些答疑和指导。更有甚者直接谷歌XX州驾照图片。。。

总之,境外驾照更换境内驾照的政策是一个非常好的便民政策,在实际操作过程中也没有发现官方故意设卡导致事情难办的状况。车管所的办事人员体现了很高的专业素养和服务态度,驾照立等可取效率也非常高,这一点是非常值得肯定的。另外,更换下来的驾照是没有一年实习期的,aka可以直接自己上高速。需要注意的是,驾照最好随身带,不然可能会被罚款与扣分。

附:国内租车技巧

拿到驾照后,笔者马上就通过神州租车租到了一辆大众。或许是出于及其坑爹的驾考政策,国内的租车公司对驾龄和年龄完全无所谓,只要你有驾照基本上就是统一价。需要注意的是,多数租车公司都需要持本人信用卡、驾照和二代身份证原件办理手续。对于留学生来说,没有国内工作是很难办理国内信用卡的,但是副卡也是可行的。所以请大家在租车前提前准备好国内的信用卡。外卡很可能在租车公司的卡机上刷不出来。

租车请优先选择大型租车公司,在服务流程和专业保障上都会好一些,车况也更加干净。但是由于公共交通便宜,高速收费和油价较贵,很多时候开车出行的性价比是大打折扣的,这一点和美国完全相反。比如以我经常往返的松江-杭州为例,乘坐高铁+公共交通到家的往返花费在150元以内,但是如果开车的话,就要支出80元的车租+130元高速费+50元保险+150元油费.因此车上坐少于三个人都是非常不划算的,大家在国内租车出行时不妨多多对比,做下参考。

NSMB编辑对投稿的建议

今天,Nature Structural & Molecular Biology (NSMB)的新任主编Dr. Ines Chen在清华给了一个题为“The editorial process — looking inside the black box”的报告,让我大概了解了manuscript脱手之后的命运,也纠正了我的几个误区。其中最有意思的几点记下来与大家分享:

1. Cover Letter:这绝不是一个形式主义的文件,它只给editor看。在cover letter里面你可以把自己真实的想法都写出来,比如“A的model是错的,我们的model是对的”。这种说法一般在论文里是很忌讳的,所以cover letter是你唯一的可以写出那些很重要却又不能在论文里畅所欲言的内容的机会。千万不要把cover letter变成一个简单的abstract的复制版。在cover letter里面可以exclude或suggest reviewers。大多数journal会严肃考虑你的exclusion,但是剔除的不要太多,否则他们就没人可选了,你的list也就没有意义了。但是,cover letter也不要太长,1-1.5页就好。

2. 一定要好好写figure legend。不要写main text累得半死才去写figure legend。其实editor第一关就看cover letter和figure / figure legend。

3. 不是reviewer的每一个point我们都得老老实实地听话,editor有时也会根据reviewer的意见、你的实际情况权衡一下。Ines举了一个例子。某一篇文章,reviewer要求author做virus侵染实验,但是author回复说:因为这个病毒的危害,全美国只有两个实验室可以做这一类实验。于是,editor就放了他们一马,接受文章了。(我自己也有这样的例子,有一次遇到一个特BT的reviewer,提的意见驴唇不对马嘴。于是我给editor写信。editor回复说:我完全同意你的意见,我也认为这个reviewer的意见ABCD你都不用理会,但是E你最好做一下。遇到懂行的editor,是我们的幸运)

4. 要学会appeal。即使收到的是完完全全的拒绝信,如果你对自己的paper真的很有信心,也不要放弃最后一次机会:appeal!据Ines讲,在她们手里,通过appeal又救回来的论文有20%(哭死,我过去有3篇文章,其实都不是很差的comment,只不过一看到reject,我二话不说,当天就submit到其他journal了)。

5. 看到不好的reviewer’s comments or decision,稍微耐心一点点,不要当天就回复。让自己沉静两天,也给editor足够的时间对你的文章换个思维(是啊是啊)

本文来自:http://blog.sciencenet.cn/blog-65865-513465.html

无需内切酶和连接酶的基因克隆方法

If you think all cloning techniques require restriction enzymes or ligases, think again. There are lots of ways you can clone without restriction enzymes or ligases for seamless cloning results. Read below to learn about Topoisomerase cloning, SLIC and Gibson.

Method #1: Topoisomerase Technology

One of my very favorite restriction enzyme-less cloning methods is the topoisomerase technology. It requires no special primers and no ligases – it is as easy as cloning comes.

This technology is based off of topoisomerase I from the Vaccinia virus. This enzyme is able to bind duplex DNA and cleave it. It then stores the energy from this breakage as a covalent bond between the cleaved 3′ DNA strand and a tyrosyl residue of the topoisomerase I. This phospho-tyrosyl bond is then subsequently attacked by the 5′ hydroxyl of the original cleaved DNA strand, thus releasing topoisomerase. Topoisomerase cloning exploits this reaction to clone PCR products without the use of restriction enzymes or ligases. Spiffy huh?

The vectors that comes in these kits are linearized with the Vaccinia virus DNA topoisomerase I covalently bound to the 3´ ends of each DNA strand. If you incubate this vector with your PCR product it will incorporate your product and create a closed vector that can then be transformed into chemically competent cells or electroporated into electrocompetent cells – your choice. Some kits use vectors that are split in two and use Cre recombinase to form the circularized vector following insertion of the PCR product.

Using topoisomerase kits means that you no longer need to design restriction sites into your PCR primers. Good if you are lazy. And great if your PCR product is difficult to amplify, as restriction sites in your primers lowers your PCR efficiency.

Example Topoisomerase Protocol (this may vary between kits)

  • Create your PCR product. Design normal primers and amplify up your DNA-strand-of-interest using whatever PCR protocol you desire. Just take note of what kind of polymerase you use to perform this amplification. It will dictate what kind of topoisomerase kit you need to use. But I will talk more about that in a bit.
  • Mix together your PCR product and topoisomerase vector. Incubate for 5 minutes at room temperature.
  • Transform the topoisomerase cloning reaction into One Shot Competent Cells that come with the kit, or your favorite cell line. For best result plate on medium containing antibiotics for which you plasmid has resistance genes.
  • In addition, some vectors may contains the ccdB gene. Successful ligation of your PCR product into the vector will disrupts expression of the lacZ?-ccdB gene allowing only successful recombinants to grow upon transformation, as all non-recombinant vector are killed upon plating. This means you do not need to do blue/white screening. With this method 95% of your clones should have the correct insert. Although you can if you want if the LacZ gene is there.
  • Select and sequence the inserts of 10 white or light blue colonies. Confirm your insert using primers relevant to your vector (vectors may contain primer sites for M13, T7 or other common sites) to amplify the insert and send it to your favorite sequencing people. This will help not only confirm the sequence but will also tell you the direction of your clone, so that you can make sure you subclone your clone in the correct direction. To sub-clone out of the vector use one of its many built-in restriction sites – just check your specific vector map for details of which sites it contains.

Expert Tip: Make Sure You Use the Correct Kit

There are a few different kits available, which kit is right for you depends on your PCR reaction. Especially what kind of polymerase you use: proofreading or non-proofreading. Proofreading polymerases are polymerases that check each nucleotide during DNA synthesis. A proofreading polymerase will remove all unpaired 3′ ends from your PCR products. Thus giving you a PCR product with blunt ends. So if you created your soon-to-be-cloned-PCR-product using a proofreading polymerase, such as Pfu or another high-fidelity proofreading polymerases, you need to use a blunt-end kit such as StrataClone Blunt PCR Cloning Kit or TOPO® Blunt-End Kit.

If your DNA template is hard to amplify and you need your PCR reaction to be more robust – say you are working with damaged DNA or little DNA template – then you may prefer to use a non-proofreading polymerase. If this is your case and you created your PCR product using a non-proofreading polymerase – such as the ever popular Taq polymerase – then you should use the TOPO-TA kit or the standard StrataClone PCR Cloning Kit. Lastly, if your PCR product is longer than usual, (if it is 3–10 kb) you might want to consider using the TOPO long fragment cloning kit.

Method #2: Sequence and Ligase Independent Cloning (SLIC)

You do not need ligase in the SLIC method, but you do need to use specially designed primers. These special primers will make the ends of your PCR product homologous to your destination vector. Then you will use the exonuclease activity of T4 phage DNA polymerase to chew back the ends of your PCR product and your destination vector. This will create overhangs allowing your PCR product and vectors to anneal giving you a cloned piece of DNA. 

SLIC Protocol

  • Create PCR product with special primers that have homology to your destination vector. To learn more about the design of these special primers see the article on Ligation Independent Cloning Primer Design.
  • Linearize your destination vector. For this you will want to use a restriction enzyme, but this will be the only time you will do so in this method.
  • Add a T4 polymerase. Next you will incubate your PCR product and vector with a T4 phage DNA polymerase but no dNTPs. Without any dNTPs this polymerase has 3’ exonuclease activity that will digest back your vector and PCR product to create sticky overhangs. If you designed your primers correctly, the overhangs from your PCR product and your vector will then anneal.
  • Add dCTP. Only now will you add a nucleotide, dCTP. This will halt the digestion and start the polymerase replicating but it will stall, because not all the dNTPs are present. End result will be your PCR product cloned into your destination vector with 4 single-stranded nicks.
  • Mix and Transform. When you transform this vector into Escherichia coli the gap will be filled in.

The SLIC technique can be a little tricky with its extra long primers, and it may not be your best choice for hard-to-amplify DNA. Additionally, this technique relies on the correct annealing of long DNA sequences, which is only possible if the DNA is properly melted, and certain DNA sequences – repetitive DNA or hairpin prone DNA may prove difficult. For more about SLIC see Olwen Reina’s article, Say Goodbye to Restriction Enzymes and Ligases and Nick Oswald’s article, Ligation Independent Cloning Protocol.

Method #3: Gibson Assembly

Gibson assembly is the same as SLIC except that it uses a dedicated exonuclease (instead of the T4 polymerase) and uses a ligase to seal the nicks. The advantage of Gibson over SLIC is that it is a “one tube” reaction.

Gibson Assembly Protocol:

  • Create PCR product with special primers to create homology between your PCR product and vectors. Same as the SLIC method.
  • Linearize your destination vector.
  • Incubate your PCR product and vector with a T5 exonuclease to digest back your vector and PCR product to create overhangs. If you designed your primers correctly, the overhangs from your PCR product and your vector will anneal.
  • Add the Phusion polymerase. The phusion polymerase will follow the exonuclease around the plasmid and overtake it. And the heat from your thermocycler will eventual deactivate the exonuclease. You will then use ligase to seal the holes and create your final clone.

The advantage of the Gibson technique is that using a ligase to seal increases your output/efficiency. A disadvantage to Gibson is that it is more expensive – the T5 exonuclease, Phusion polymerase, and ligase cost more than the SLIC components. Also you should know that this method works best if your DNA fragment is 250 base pairs or longer, otherwise you run the risk of the exonuclease eating away your entire product before it can anneal. Not good! Also all the same SLIC disclaimers apply: DNA sequences with repeats or hairpins may be uncooperative. Kits are available for Gibson Assembly from NEB, but you can also prepare your own home-brewed reaction mixes.

There are lots of ways to clone. Traditional restriction-enzyme-based methods that rely on restriction enzymes to make the inserts or destination vectors “sticky” for subsequent assembly are not your only choice. Methods like TOPO, SLIC and Gibson will give you seamless clones without requiring restriction enzymes or, sometimes, even ligase.

论文“方法”部分的撰写

这部分大家大部分是copy/paste,但是又是容易被人挑错的地方。

Excellent research takes time and effort, and a publication is your chance to showcase your hard work. While your main motivation might be to share and discuss your results, your methodology section is key to the reproducibility of your work, acting as a foundation for other researchers to repeat and build upon your findings.

In this article, we will guide you towards writing an exceptional methodology section, including how to design and document your experiments, and how to test your results, all while building a trustworthy reputation as a scientist.

Experimental Design: Factors That Affect Reproducibility

      1. Controls

It may be tempting to skip controls when running routine experiments. However, by including controls in each experiment, you have a better chance of troubleshooting experiments that don’t go as planned, and you can circumvent the risk of thinking you’ve made a significant observation when you haven’t. An excellent example is a flow cytometry experiment. You may be tempted to use gates established in previous experiments instead of running fresh controls. However, even daily fluctuations in atmospheric pressure can affect how a flow cytometry instrument runs your samples.

Bear in mind that depending on your experiment, you may need both positive and negative controls, and it is wise to include control samples in duplicate as a minimum. In this way, you’ll always have a backup if something happens to one of your control samples. A good rule of thumb is that your control sample should differ from your experimental samples by only one component/characteristic/trait.

2. Blinding

Blinding helps reduce the influence of external factors on the outcome of an experiment, and is most widely used during the testing of new drugs in clinical trials. During blinded clinical trials, half of the trial participants are given the test treatment (drug), and the other half are a given a placebo (mock) treatment, and the study participants don’t know which treatment they have been given. The placebo acts as a control and eliminates the possibility that the participant’s expectations may affect the outcome of the test treatment. In double blinding, neither the subject nor the investigator knows which treatment the trial participants have received.

Unfortunately, blinding is not always possible. This might be the case when the test treatment is a completely novel type of intervention, while the control group receives the standard of care intervention or treatment. Clinical trials in which participants and investigators know who is getting which treatment are referred to as open label studies.

3. Gender, Age, and Race Balancing

For treatments destined for eventual use in men and women, animal testing, and clinical trials should include a similar number of participants from each gender. Ideally, research subjects or clinical trial participants should represent as diverse a population as possible, within the scope of the experiment/trial. The same applies to balancing with race and age. When the tested population is limited to a certain age range and/or race, the results cannot be said to be universally applicable. If you cannot balance for gender, age, or race, state the limitations in your paper’s discussion section.

4. Adequate Sample Size

The size of a sample must reflect the degree of statistical power required for your experiment. For example, a pilot clinical study usually consists of 10 to 30 participants. The appropriate sample size depends on at least two important factors: the margin of error (i.e. the confidence intervals) and the confidence level.

The margin of error: If you set your margin of error to 5% and your test treatment positively affects 90% of your participants, you should expect 85-95% of your future population, i.e. participants in a subsequent trial or patients, to respond positively to the test treatment.

The confidence level: Following the above example, with a 5% margin of error and a 90% rate of positive effects on your study population, the confidence level tells you how often the percentage of your population who responded positively actually lies within the boundaries of your margin of error. In simple terms, if you choose a confidence interval of 95%, you can be sure that 95% of the time, 85-95% of your population will respond positively to the treatment.

Taken together, the margin of error and the confidence level tell you how confident you can be that your sample size is broadly applicable to the population you’re testing. For extra guidance, there are a few freely available softwares to help you determine your ideal sample size, such as this online sample size and margin of error calculator.

5. Statistical Tests

Broadly speaking, there are two types of statistical tests: planned and exploratory. Planned tests are those that are chosen in advance of experimentation. Exploratory tests are those you run after the experiments have been carried out. You should always aim to identify the types of statistical tests you will perform ahead of time. Make sure you understand the statistical program you’re using, and that you are using the appropriate statistical test(s) for your dataset. If you’re not sure, seek advice.

Exploratory analysis carries less weight as it can be a “fishing expedition” to find significant results. However, when there is adequate justification, you can include the results of an exploratory analysis in a paper. Importantly, always state clearly which statistical tests were planned and which were exploratory, and any conclusion(s) made from the exploratory analysis should be taken with a grain of salt.

6. Reagents

Choose commercially available reagents and ingredients where possible. Commercially available reagents are validated after production and should be trustworthy. If you’re preparing a reagent yourself, e.g. a buffer, based on previously published work, cite the original authors and make sure to contact them if you have any questions concerning their method. If the buffer recipe is unpublished, clearly describe every single step of the process involved in making a batch, including the order in which you dissolved the individual components.

7. Clarity and Honesty

It should be very clear from your methodology section how you got from A to B to C and so on. Your methodology is essentially a road map that allows others to do exactly what you have done. So, when designing your experiments, make sure to clearly document every single step for reproducibility. Accurately record the quantities used for each component, and note the manufacturer and lot number of each reagent or specimen you use. Make sure that you describe each step in adequate detail in simple but precise language.

Do a Run-Through

Once you’ve documented a procedure, ask at least one colleague to perform the steps you’ve written down. Shadow them and note down any comments they make throughout. In doing so, you should get a good feeling for which steps are easily understood and which ones need clarification. Resist the temptation to help them understand a step until it is clear they are stuck. Such an exercise allows both parties to spot mistakes and omissions, allowing you to check your protocol’s inter-observer reliability.

Citing and Explaining

Make sure you cite other researchers when you mention their methods, results, ideas and conclusions. If you used a previously published method but modified it, you must still cite the original author(s) and clearly state the modifications you made, no matter how small or insignificant they seem. Explain and justify any deviations from the original protocol.

Transparency

Be willing to answer questions on your methodology. Unfortunately, specific details are sometimes held back by researchers, especially when it comes to newly developed protocols. This not only slows down scientific research, but also calls into question the credibility of a researcher’s work. Open and honest collaborations allow cross-functional and interdisciplinary teams to work together to make discoveries and advance science. By sharing your experiences, i.e. your methodology, you are setting a good example for others.

Further Inspiration for Your Methodology Section

The guidance provided in this article should help you create an excellent methodology section. For more inspiration, pay close attention to the methodology sections published by experts in your field. Another useful resource is your target journal, which should contain a set of submission guidelines for authors. Finally, it is worth taking a look at journals that only publish protocols and method-based articles for even more ideas to help you write a killer methodology section. For example, check out Nature Protocol’s excellent guide for authors here.

Further Reading:

  1. https://www.elsevier.com/connect/scientific-credibility-and-reproducibility
  2. https://www.nih.gov/research-training/rigor-reproducibility/principles-guidelines-reporting-preclinical-research