转录组分析之参考基因组的查找

  【方言】生性:粤语,懂事、上进、听话。

  这标题的意思是,儿子很听话懂事,生病的母亲对此很欣慰。

  (手动DOG脸~~)

  没有这种体验,因为我是兽医

  

  那年我们大四,隔壁宿舍新开学大一。

  大一新生嘛,刚解放,精力比较旺盛,大四嘛,老油条了,比较懒散。

  大一宿舍,天天晚上1 2点还在狂欢,至今记得他们的舍歌是“斑马,斑马”。大四的老油条本来想养生,然后躺平等毕业,想早睡早起,然后沟通几次未果。

  本来有多种方式解决的,比如找个学生会的小学弟,找宿管大姐姐,找他们导员小姐姐,毕竟大四了,还是认识几个人的。

  后来一想算了,给他们上大学第一课吧。

  于是,开始了保留节目——打麻将,要知道在大学宿舍打麻将,打起来是收不住的,一直到凌晨5点,连续一礼拜,隔壁宿舍的哥们,每天早上都是熊猫眼,晚上9点就早早上床休息。

  很和谐!!!!!

  肯德基不知道,说说麦当劳吧。

  我18岁那年,当时和朋友约好了高考完去北京看看。为此我还很努力的攒了半年的零花钱。结果前一天还好好的,考完试准备走的时候,朋友死活联系不上了。打了一堆电话,她妈接了,说朋友要去亲戚家吃晚饭,不去北京了。

  我挂了电话瘫在沙发上呆了差不多五分钟,最后想明白一件事:不能因为别人而停下自己的脚步。

  我去车站把她的票退了,回来简单收拾了一下,晚上坐上了去北京的火车。

  那是我第一次去北京,之前也很少很少出远门。

  要坐一整夜的绿皮硬座,周围的人熟悉了互问对方去北京做啥。不外乎就是出差,打工,办事,找人。轮到我了,我说去玩的。周围的人一半黑人问号脸,一半地铁老爷爷看手机。仿佛我在做一件特没6的事。

  那时的我,眼神清澈愚蠢,满心里自以为是的聪明。

  真好啊。

  在北京待了几天后,因为一些原因,没地儿住了。

  那时候还没有智能机,我那时候还小也不太敢自己去找酒店,当然主要也是为了省钱。

  最后想了很久,想起来麦当劳很多都是24小时营业的,可以去那里待着。

  然后出于安全考虑,我选择了王府井的那个麦当劳。因为根据我朴素的智慧,我觉得这个位置肯定最安全,并且晚上大街上也会有很亮的灯不会让人害怕。

  当时那家麦当劳,因为生意很好,所以晚上十点以前,保安是不太允许顾客在里面干坐着的。当然他们不会明示,但保安肯定一打眼就知道谁是来吃饭的谁是来蹭座儿的,并采取一定的措施。

  所以那个时候,我的记忆就是:

  傍晚时分,我坐在天安门城楼斜对面的马路牙子上,看着长安街从明亮到肃穆,从夕阳西下到华灯初上。白天大片大片热闹的游客逐渐散去,路灯悄然点亮,公交车上挤满了回家的人。不时还有住在附近的男人骑个坤车路过,车把上挂着刚买的菜。

  这个场景我一直难以忘记,一是这里是很多很多人一生想来可能都来不了的,他却骑个自行车就能到家了。二是这烟火气十足场景,配合要黑未黑的天色,华灯初上的气氛。让我第一次深刻感受到了孤独,那种没地方去无家可归的感觉。

  一般十点左右麦当劳就开始清净了,这时候里面的人基本就是:三五成群来写作业的学生,大包小裹还有行李箱的游客,独自吃饭的上班族,几个闲聊的人。大多集中在一楼,二楼人更少。我在这里还见过老外明目张胆的yp。

  那种比较舒适的沙发座往往会被学生党占领。我坐在她们旁边,其实心里是有些羡慕的,虽然我家那里也有麦当劳,离我家也不远几个街口,但我学生时期不会这样的。包括我的同学们也都不会。

  一般十一点以后基本就没有纯来吃饭的人了。留下的人基本都是要在这里通宵的。

  这里麦当劳晚班的餐台那里的工作人员都是老阿姨,年龄看起来都五六十往上,这让我还蛮惊讶的,因为在我家那里麦当劳永远都是年轻人。

  这里因为灯火通明人群来往所以会让人时间意识不强,明明已经十一点多了但是不会觉得很晚。

  我甚至还因为头发出油厉害了,半夜偷摸在二楼的洗手间洗过头发。用洗手池的温水快速打湿头发,用洗手液当洗发水。冲干净后用烘手机把头发烘干。那时候的烘手机还是那种一个大按钮,按一下出一阵热风,下面也没有接水珠的板子的那种,所以我头才能伸进去吹风。也庆幸那时候我是短头发,省了很多事。

  我洗头发包括吹头发的时候,偶尔也会有人进出的,当时觉得自己这样新奇又有趣,现在作为旁观者的角度回忆那个场景,觉得自己就纯纯的流浪汉嘛,不过依然很有趣哎!

  印象很深的还有洗手间打扫卫生的大爷,头发花白,看起来说七十多也有人信。半夜的女洗手间里,我听到有经理(领导)在大声的训斥那个大爷,应该就是哪里不干净了,打扫不及时。

  真的训斥的很厉害,简直穷凶恶极那种。我听到那个大爷无奈的说:“我刚才看还好好的,不知道又是谁弄脏了balabala”。

  听他们的对话,我觉得好难过,年龄那么大了要被训斥成这样。

  头发吹的半干,下楼后感觉屋子里会有些闷,索性就去门外面台阶那里坐着。白天热闹的不行的王府井,现在在夜幕里沉默不语。各种灯把这里照的亮亮的。各类巨大的广告牌在灯光下被照的光怪陆离。尽管已是六月份,不过半夜还是有微风沉醉的感觉,清爽舒适。

  此时虽然已来北京数天,也逛遍了大街小巷,但在这一刻,我吹着夜风,看着天空的繁星,看着王府井各类店铺广告牌,看着左边尽头的长安街,看着偶尔开过的夜班公交,才突然意识到,咦?我在北京啊。

  这是我第一次感受到旅行的趣味:就是那种你突然意识到,那些你曾经想象过,向往过,以为不会去到的地方,自己突然就身处其中的奇妙感。

  这个麦当劳大概十二点半左右开始打扫卫生,是那种彻底的打扫,天花板的灯都会被擦一遍。也因为如此,顾客会被挪来挪去。

  这里还有一个规定,就是在这里过夜的人不能睡觉。后半夜总会有人撑不住打起瞌睡,这时候会有保安走来走去,看到谁睡着就会去把他推醒,警告一句:不要睡觉!

  我记得我实在困得不行,就带上墨镜看报纸,实际在闭眼假寐。现在想想觉得自己也太傻逼了,可是又佩服当时的自己能想出来这么傻逼的主意。而现在的我打死也干不出这样的事了,那个时候好机智啊。

  不过等过了凌晨两点多,大部分人都撑不住,或多或少都会睡着,保安管的也不会很严了。这个时候能睡大概两三个小时,因为五点多六点,就会被保安再次推醒:“天亮了,走吧!”

  是哒,天亮后保安会用这句话把你赶走。

  于是我也就开始了新一天的闲逛,顺便去隔壁肯德基吃个早餐(dog)。

  说实话现在的我虽然已经不会在麦当劳肯德基通宵,但我回忆当年这段,依然觉得不可思议,他们就是这么直接毫不掩饰的对待你。

  现在的我重新这样来一遍,可能会难过或者愤怒吧,但那时的我,满心都被新鲜有趣的旅行占据,以至于所有事都觉得很棒呢。

  

  当然是广州老市长黎子流系列啦,黎市长官声斐然,带着本土化团队为广州上世纪末的腾飞做出巨大贡献,但一口糟糕的“广普”也着实惹了不少笑话:

  有一次,时任某部长的陈慕华(后任副总理)来穗调研,黎市长说:“陈部长呀,您很久没来我们‘肛门’(江门)看看了。”

  陈说:“‘肛门’?有什么好看的!”

  黎回答说:“没‘大便’(大变),也有小便(小变)呀,“肛门”再过去一点就是‘小鸟天堂’了,好好玩滴。。。。。。

  黎去京参加人大会,一进电梯,服务员礼貌地问:“您几楼”?

  黎:是我,有何事?

  服务员:首长,我问您几楼?

  黎:我就是`你几楼’啊,你怎么认识我的?

  ……

  某次,黎市长带着考察团一道坐船视察琶洲黄埔沿江两岸新貌,不由雅兴大发:“站在床头(船头)看娇妻(郊区),新妻(新区)总比老妻(老区)好,真是越看越欢喜啊”~

  —— ——

  当然了,这些坊间笑话多为编排,说明当年广东的开放包容程度极高,可以拿领导口音开涮,市民可以电视问政,各种时事栏目也会直言不讳开怼。听说后来有人把这些段子给黎子流市长讲了,他也就哈哈一笑而过,现在还敢吗?多数老广,其实挺怀念那个敢讲敢说的年代~

  哈哈哈打开发现好多人回复

  是这样的,因为家里原因(不是特别好的事情)我很小就出国啦,原生家庭亲情方面比较冷漠哈,并不是说家人不爱我,就是不是特别热情肉麻可以撒娇的关系。

  淘宝虽然那时候已经很盛行,但当时年纪小没怎么在网络上网购过。“亲和亲爱的”的称呼是很甜,但我说的这个sweetie我觉得很甜是因为她真的面对着我很灿烂地微笑。平时生活里也确实没什么人对我称呼特别甜过,因为名字不太好叫昵称的原因,大部分家人或朋友都是喊我全名。之所以说好像找到了家人是因为那时候去没有朋友,很想念家里人。所以一旦有人跟我热情示好我就有种“蛮感动的,好像家人一样。”(加上我是奶奶带大,对老年人很有感情)

  不管怎样,这是我很真实的感受。并不是处于不懂得感恩父母的养育或者炫耀自己留学经历的原因。只是在当时那个环境下,有种被抛弃送出去的感觉,也没朋友没家人,很想念奶奶。这个称呼确实是我冲击挺大的。我也很想有人可以甜甜的喊我一句亲昵的昵称(但父母比较严厉是真的不会这么叫我)。

  之所以回答这个也是觉得自己那时候的思想好笑,怎么会这样就觉得很开心了(所以才在闹笑话这里写下这个答案)。

  很抱歉引起大家的不适。这个回答保留一段时间,希望评论的各位可以刷到解除误解。但我并不觉得我对“sweetie”这个称呼会觉得感动,感觉以前很苦(小时候小,并不懂父母赚钱辛苦,我就想直接的感受他们对我的爱)有什么太大的思想错误。确实这个sweetie有治愈到我一段时间,也让我开始敢于去表达特别热烈的词汇,所以我现在也会喊我朋友“宝贝、宝”这种很肉麻的称呼,以前性格比较内向害羞是真的不会这么叫。有任何我思想不对的地方也可以再指出。

  关于学历,我成绩不好,出国确实比较混日子这点我就不辩解了。初三出国混到研究生毕业,除了研究生学校还可以其他的也就是普通学校。目前已经工作八年了。回国后跟父母关系好了很多,反而现在老了,他们偶尔还会叠音叫我,三十多岁还被叠音喊小名有点肉麻,但我很开心。

  请各位不要留下关于英国研究生刻板印象的评论,我不希望我这条一开始并未交代其他背景的、引起各位不适的回答突然就被扣在他们头上,并不是每一条你们认为的不感恩、突然在国外就感动的评论都是他们发的,也可能是我这种没头没尾就留一个回答的人随手编辑的。

  谢谢各位~

  ps.我是广东人,但我小时候不属于很可爱的小朋友,也不常自己出门,所以可能年纪小没什么人喊过靓女哈哈哈哈。而且我待的地区好像确实商店人不常喊靓女的。

  还有我说的前十几年人生是指被喊sweetie的时候往前数的十几年人生。我现在都三十多啦!!成年后没这么苦的思想了是真的!

  ———-以下原答案

  刚到英国去超市买东西

  老奶奶收银员会微笑喊我sweetie,我前十几年人生从未有人喊我这么甜的称呼。我那叫一个感动!好像找到了家人,特别喜欢这个老奶奶。

  后面发现不是称呼甜。是我前十几年过的苦。

  对于到手的转录组数据,我们还需要找到合适的参考基因组数据与其进行对比。那究竟如何查找合适的参考基因组呢?接下来我们就来一起探究一下如何查找合适的参考基因组。

  对于转录组分析来说,参考基因组就像是一个标准,一个规则。俗话说的好,无规矩不成方圆,在转录组分析过程中也需要一个标准,通过将转录组数据回帖到参考基因组中,从而得到每个基因的read count数,进而得到各基因的表达量信息。

  目前对于参考基因组的查找,主要通过查询相关数据库进行寻找,如NCBI数据库,以NCBI数据库为例,我们查找银杏的参考基因组序列,首先在NCBI的搜索栏中搜索银杏的拉丁名Ginkgo biloba L

  通过搜索后得到下面图

  可以看到图中基因组一栏中,有着一个Assembly(组装)项目,点进去我们即可得到他人上传的已经组装好的银杏基因组。如下图所示

  对于其下载,则点击右侧的FTP directory for GenBank assembly,即可进入项目详细目录

  参考基因组主要需要两个文件,一个是基因组文件,如上图中GCA_024626585.1_ASM2462658v1_genomic.fna.gz文件,另一个则是基因组注释文件,一般是gtf文件。

  2、我们经常可以看到gtf文件和gff文件,以及上图中还出现的gbff文件,那么几者之间有何区别呢?首先是参考基因组中需要用到的gtf文件,GFF全称为general feature format,这种格式主要是用来注释基因组,GTF全称为gene transfer format,主要是用来对基因进行注释。因此两者之间有着细微的不同。在文件格式方面两个也有着细微差异,GTF文件以及GFF文件都由9列数据组成,这两种文件的前8列都是相同的,非常好理解,区别在于第九列,第9列必须以gene_id以及transcript_id开头,GTF文件的第9列同GFF文件不同,虽然同样是标签与值配对的情况,但标签与值之间以空格分开,且每个特征之后都要有分号。当只有gff文件时,可将gff文件转化为gtf文件,如使用Cufflinks里面的工具gffread,即可进行转化;gbff格式主要是GenBank数据库常用的数据记录格式。整体可以分为3部分:描述部分,注释部分和序列部分。

  描述部分中LOCUS表示基因的位置,长度,分子类型,数据更新的最后时间。

  Definition描述基因的名称,是否为编码区,以及位于那条染色体上。

  Accession:表示的是检索号,Version表示版本号,Source表示物种来源,Organism表述具体的物种分类,以及

  注释部分(Feature)描述基因和基因的产物,以及序列相关的生物学特征。对该序列的RNA,CDS和gene进行描述。

  序列部分(Origin)展示的就是核苷酸序列,以“//”结尾。如果展示的是真核生物的基因,那么基因组中还包括了除了exon之外的部分,具体的Reference参考文献。

  gff格式文件gtf格式文件gbff格式文件的描述部分gbff格式文件的注释部分第二个常用的数据库是Ensemble数据库

  Ensemble数据库点击中间搜索栏即可进行搜索

  参考基因组序列点击Download DNA Sequence进行下载参考基因组序列

  参考基因组注释文件点击右侧Download GTF文件下载参考基因组注释文件

  3、除此之外还可以通过查找相关文献的方式进行查找参考基因组,如本次实验中查找银杏参考基因组,就选用的是下面该篇文章中的参考基因组

  The nearly complete genome of Ginkgo bilobailluminates gymnosperm evolution好了,这就是今天的如何查找合适的参考基因组及其注释文件,继续关注我,带你学更多的转录组知识哦!!!还可以关注我的微信公众号:小陳日常二三事,里面有着更多的惊喜等着大家哦!!!